【LEYU科技动静】近日,深度求索(DeepSeek)正式推出年夜模子新版本 DeepSeek-V3.2 和其高机能变体 DeepSeek-V3.2-Speciale。官方网页端、App 与 API 已经周全进级至 V3.2 正式版,而 Speciale 版本则以姑且 API 情势开放,供社区研究评测,办事有用期截至2025年12月15日。

据官方先容,DeepSeek-V3.2 定位在均衡推理能力与输出效率,合用在一样平常问答和通用智能体(Agent)使命。于多项公然推理基准测试中,其体现靠近 GPT-5,略低在 Gemini-3.0-Pro,同时显著优在 Kimi-K2-Thinking,且输出长度更短,有用降低计较开消与相应延迟。该模子还有初次实现“思索模式”下的东西挪用功效,撑持多轮推理联合外部东西交互,晋升繁杂使命处置惩罚的正确性。

为练习这一能力,团队构建了包罗1800多个情况、8.5万余条繁杂指令的强化进修数据集,涵盖年夜量“难解答、易验证”使命。评测显示,DeepSeek-V3.2 于主流智能体东西挪用基准上到达当前开源模子最高程度,且未针对于特定测试东西举行过拟合,揭示出优良泛化潜力。
而 DeepSeek-V3.2-Speciale 则聚焦极限推理能力,交融 DeepSeek-Math-V2 的数学证实模块,于 IMO 202五、CMO 202五、ICPC World Finals 2025 及 IOI 2025 等国际顶级竞赛模仿中均斩获金牌,此中 ICPC 与 IOI 成就别离到达人类选手第二名与第十名程度。不外,该版本因推理链较长、Token 耗损高,今朝仅限研究利用,不撑持东西挪用,也未优化一样平常对于话体验。

两个模子均已经开源,用户可经由过程 Hugging Face 与 ModelScope 下载。API 用户还有可经由过程指定 base_url 挪用 Speciale 版本,并使用新增的思索模式举行深度推理。官方同步更新了 API 文档,具体申明多轮思维链通报机制,以撑持更繁杂的 Agent 运用场景。
版权所有,未经许可不患上转载
-leyu.com