开云体育

DeepSeek-V31正式发布混合推理架构加持Agent能力再迎突破开云体育官方

2025-08-23
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!通过引入混合推理架构和显著增强的智能体(Agent)能力,进一步加剧了全球AI市场的技术竞赛。

  V3.1版本的核心亮点是采用了全新的混合推理架构,允许模型在一个统一框架内支持“思考”与“非思考”两种模式。根据官方公告,新版本通过训练后优化,在工具使用与编程、搜索等智能体任务上表现获得较大提升。需要注意的是,DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。UE8M0 FP8是针对即将发布的下一代国产芯片设计。

  据社区测试数据显示,新模型在Aider多语言编程基准测试中得分超越了Anthropic的Claude 4 Opus,同时保持了显著的成本优势。这一性能突破已在开发者社区引发广泛关注,模型在Hugging Face平台的热度迅速攀升。

  DeepSeek同步升级了API接口,将上下文窗口扩展至128K,并新增了对Anthropic API格式的支持以简化迁移。更重要的是,公司宣布将于2025年9月6日起执行新的API定价方案并取消夜间优惠,这被视为其在服务能力扩容后,加速商业化进程的关键一步。

  在效率方面,新的思考模式(V3.1-Think)经过思维链压缩训练,相比上一代模型(R1-0528),在任务表现基本持平的情况下,token消耗量可减少20%至50%。

  新模型着重强化了以编程和搜索为代表的Agent能力。根据DeepSeek公布的数据,V3.1在代码修复(SWE)和命令行终端任务(Terminal-Bench)测试中,性能相较于公司以往模型有明显提高。在搜索任务上,模型在需要多步推理的复杂搜索测试(browsecomp)中也大幅领先。

  社区进行的第三方测试进一步证实了其编程能力的跃升。数据显示,在Aider编程基准上,V3.1取得了71.6%的高分,超越了包括Claude 4 Opus在内的多个知名模型。同时,该测试也凸显了其成本效益,完成一次编程任务的成本仅为1.01美元,远低于部分专有闭源模型。这些性能指标的提升,直接增强了DeepSeek在自动化编程和复杂信息处理等商业场景中的吸引力。

  DeepSeek继续其开源策略,已将V3.1的Base模型和后训练模型在Hugging Face与魔搭社区上发布。据称,此次发布的模型参数量为685B,Base模型在V3基础上额外进行了840B token的训练。公司特别提醒开发者,新模型采用了UE8M0 FP8 Scale的参数精度,且分词器(tokenizer)和聊天模板有较大调整,部署时需参考最新文档。

  与此同时,API服务也全面升级。除了将上下文长度扩展至128K外,DeepSeek还为开发者提供了更强大的工具调用功能,例如支持strict模式的Function Calling以确保输出格式的规范性。

  此外,为降低生态迁移成本,API增加了对Anthropic API格式的兼容支持,方便使用Claude Code框架的开发者接入DeepSeek模型。

  在技术与产品更新之外,DeepSeek也迈出了清晰的商业化步伐。公司宣布,将从北京时间2025年9月6日凌晨起,对开放平台的API接口调用价格进行调整,届时将执行新版价格表,并同步取消实行已久的夜间时段优惠。

  在价格调整生效前,所有API服务仍按原价格政策计费。公司表示,此举是为更好地满足用户调用需求,并已对API服务资源进行了扩容。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  尖扎黄河特大桥事故12名遇难者遗体已送至殡仪馆:等家属来见逝者最后一面

  深夜,美国传来大消息!美联储主席释放降息信号 ,美元急跌,人民币拉升,金价大涨,美股全线爆发

  尖扎黄河特大桥钢索断裂已致12人遇难4人失联:原计划8月底合龙,遇难者家属正在赶往事发地

  《编码物候》展览开幕 北京时代美术馆以科学艺术解读数字与生物交织的宇宙节律

搜索