开云体育
开云APP下载DeepSeek公开致谢腾讯:对DpEP的优化是开源通信框架性能显著提升最高达100%
开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!DeepSeek 公开致谢腾讯:腾讯优化让 DeepEP 开源通信框架性能显著提升近日,DeepSeek 公开对腾讯技术团队表达诚挚感谢,腾讯对 DeepSeek 开源的 DeepEP 通信框架进行深度优化,促使其在多样网络环境下性能实现大幅跃升,为企业开展 AI 大模型训练工作提供了更具效率的解决思路。
DeepEP 作为全球首个专为 MoE(混合专家)模型设计的开源通信库,于今年 2 月由 DeepSeek 在开源活动中重磅推出,开源地址为 。其主要应用于芯片间通信,在 AI 大模型训练进程里扮演关键角色。它具备实现全对全(all - to - all)通信、原生 FP8 调度支持、灵活 GPU 资源控制等特性,可提供高吞吐量与低延迟的全对全 GPU 内核,即 MoE 调度和组合功能。在 AI 领域,混合专家模型(MoE)通过多个专业化 “专家” 子模型处理不同任务,专家并行(EP)技术能让多个专家并行处理任务不同部分,合理分配工作负载,DeepEP 在其中保障 “专家” 间数据快速、有效地流通。
自 DeepEP 开源以来,尽管其凭借创新设计,在初始版本便达成 300% 的通信效率提升,且有效缓解了 MoE 架构模型对特定通信库的依赖,然而,在成本更为亲民、应用范围更为广泛的 RoCE(融合以太网远程直接内存访问)网络环境中,其性能表现不尽人意,这一状况引发开源社区的持续探讨。
腾讯星脉网络团队在 DeepEP 开源后迅速投身技术研究,精准锁定两大关键性能瓶颈。其一,双端口网卡带宽未能得到充分利用;其二,CPU 控制面交互环节存在较高时延问题。腾讯技术团队针对这些问题展开深入攻坚,实施了一系列卓有成效的优化举措。在 RoCE 网络优化层面,借助拓扑感知的多 QP 建链技术,智能调配数据流,极大提升双端口网卡带宽利用率;基于 IBGDA 技术优化,促使 “控制面” 场景操作绕过 CPU “中转”;创造性引入 “QP 内时序锁” 机制,保障多个 GPU 间数据传输顺序精准无误。
经此番优化,DeepEP 性能提升成果显著。在 RoCE 网络环境下,性能实现翻倍增长,提升幅度高达 100%;反哺至 IB(InfiniBand)网络时,原有通信效率再度提升 30%。DeepSeek 的人工智能基础设施工程师赵成刚在 GitHub 仓库发布说明,盛赞腾讯网络平台部门提供的技术方案,让 DeepEP 实现了 “巨大提速”。
目前,该优化技术已全面开源,并且在腾讯混元大模型等项目的训练推理环节成功落地应用。在腾讯星脉与 H20 服务器构建的高性能环境里,这套优化方案展现出良好的通用性与稳定性 。腾讯方面表示,该技术方案源于其在数据中心开发、优化以及图形处理单元之间通信领域积累的丰富经验,此前这些技术成果已应用于腾讯混元 AI 模型训练,如今开源供 DeepSeek 等外部用户使用,在强化 DeepEP 项目稳健性的同时,有力 “提升了通信性能”。
此次腾讯助力 DeepSeek 优化 DeepEP 通信框架,体现了国内科技企业在人工智能领域积极投身开源合作的热忱态度,更表明技术共享、协同优化能够切实推动行业进步,为 AI 大模型训练效率提升开辟新路径。接下来有望见证更多此类合作成果,助力中国人工智能产业朝着更高峰迈进。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
比亚迪公关总经理李云飞:有些企业开发布会不拉踩别人可能就不自在,这种流量会反噬自己!有的人是又坏又蠢
人发誓要让马斯克在政治上“无家可归”:他是个疯子,接纳他绝无可能
王自如谈离开格力:正当想把最新AI技术融入到构想中时,终场哨声响了!还有很多灵感没来得及实现,有些遗憾
最新版三星笔记 App 可实现数学求解,支持 S25 Ultra 等机型
雷神推出 9999 元 RTX 5060 版 ZERO18 游戏本:i9-13900HX处理器
洛图科技:2025 年 5 月中国电视市场整机出货量 283.0 万台