开云体育
算力狂飙时代:新华三如开云体育何掀起底座革命?
效率提升后,煤炭消耗不降反升。这个反直觉的现象,后来被命名为“杰文斯悖论”。
一个半世纪后,这场悖论在AI舞台悄然上演——当DeepSeek宣称其推理大模型训练成本降至同行的1/20时,算力需求却像脱缰的野马,狂奔不止。
对此,新华三集团高级副总裁、技术委员会副主席刘新民这样解释:“单个模型训练所需算力下降,降低了中小型企业和从业者切入AI领域的门槛,吸引更广泛的参与,让更多企业和从业者有机会去尝试、去探索,引发了一场广泛而深刻的行业变革,从而推动算力需求的跃迁式上升。”
这无疑给算力基础设施带来了巨大的挑战。如果说AI大模型是带动百行百业生产力提升的“新引擎”,算力基础设施则是这台引擎的“动力系统”——引擎越快,底座越要稳。
生成式AI的爆发,尤其是DeepSeek的横空出世,正在重塑算力版图。这场变革,既深且广。
首先,算力的“胃口”越来越大。数据显示,全球智能算力需求以78%的复合年增长率狂飙,其中超三分之一的增量直接源于DeepSeek类模型的场景渗透。DeepSeek的MoE将单次推理计算量压至传统模型的20%,堪称“省油神器”。但开源生态的爆发——日均50亿次调用——让总算力消耗翻了3倍。这就像一辆省油的车跑了更远的路,油箱反而更快见底。
其次,算力结构在悄然变形。训练与推理的需求呈现“剪刀差”:训练侧因低资源需求放缓,智算中心从“堆算力”转向“挤效率”;推理侧却因高性价比门槛降低而井喷,企业争相入场,用户并发调用激增,海量参数处理需求如潮水般涌来。云计算厂商不得不掉转船头,从集中式训练转向分布式推理,数据中心开始向边缘延伸。
再者,场景化成了新战场。智能驾驶和机器人需要低时延、高并发的专用推理服务器,金融风控和医疗影像等需要快速接入推理能力的场景则青睐绿色高效的一体机。与此同时,海量数据吞吐对高性能存储和AI网络提出更高要求。优化互联架构、提升存储性能、创新网络协议,已成为提升智算中心能效的有效途径。
面对这场算力风暴,刘新民认为,未来将是“大小兼顾”的格局。大型算力中心仍是AI训练的脊梁,尤其是头部智算中心凭借高功率机柜和液冷技术屹立不倒。而推理需求的爆发,则催生小型算力中心的崛起,尤其在边缘计算和本地部署场景中,中小企业借此搭上AI快车。
放大到国家层面,则强调区域平衡与“东数西算”并重,东部集群强化热数据处理,西部则借绿电优势承接冷数据和训练任务,形成一幅“东训西存”的互补图景。
面对AI掀起的算力狂潮,企业需要怎样的底座?新华三给出的答案是技术创新的“四重奏”:Scale-up、Scale-out、高性能存储和广域数据传输。
AI大模型动辄千亿参数,单张GPU早已不堪重负。Scale-up网络如同一根强有力的“脊柱”,纵向扩展GPU互联,支持几十到数百GPU互联,从而加速AI任务完成。
而Scale-out网络则是“筋骨横展”,通过横向扩展支持万卡甚至十万卡互联,确保集群高可用。在新华三看来,Scale-out网络发展的主要思路是通过优化RoCE技术,以端网融合的技术路线提升网络利用率。
存储是AI训练的“粮仓”。由于训练数据的读取带宽对于不同数据要求不同,因此整个训练过程需要高性能的存储和网络配合。为满足AI存储大带宽、高吞吐、低延迟的要求,可通过冷热数据分离提升读取效率,使用高速存储协议(NVMe-oF)和全闪阵列等方面进行优化。
随着智算业务需求量的不断发展,海量样本入算、存算分离拉远训练、跨数据中心协同训练和业务推理等海量数据跨广域流动的场景逐渐增多。在广域网络中,跨域的物理时延较大,数据传输的可靠性也面临挑战,丢包处理和拥塞控制尤为重要。
值得注意的是,新华三全栈智算解决方案的逻辑,正好可以与这四个关键因素一一对应:
在Scale-up层面,新华三推出G7系列模块化服务器,以丰富的软硬件生态兼容性,已完成和超过10余家芯片厂商的联合设计,适用于集群训练、训推一体、边缘推理等场景。在面向万亿模型的超节点集群方面,H3C UniPoD超节点支持单机柜、多机柜等多种形态,Scale-up互联规模提升300%,大幅缩短训练总时长,降低延迟,为万亿参数模型训练提供强大支持。
在Scale-out层面,新华三推出全球首款单芯片51.2T 800G“LPO+液冷”交换机,满足智算网络的高吞吐、低时延、绿色节能需求。并研发端网融合Scale-out整体解决方案,在UEC技术基础之上,配合网络控制器的全局能力,开发拥塞控制算法,满足大集群高可用的需求。
在高性能存储方面,新华三通过存储软件栈全面重构,打造单节点80GB/s带宽、200万IOPS的下一代AI数据存储平台H3C UniStor Polaris X20000系列,实现性能优化、协议融合和架构进化。
在广域数据传输方面,新华三的确定性网络和数据快递技术方案,通过软硬件协议栈重构,在5000km距离下实现90%以上带宽利用率,时延较传统方案降低5倍,堪称“数据高铁”。
提及能效的考量,刘新民直言:“人工智能的尽头是能源。”通过AI运维与算力平台调度,将低利用率服务器的任务集中和关停,可在不牺牲性能的前提下,实现算力利用率和能效显著提升。
“下一代算力和网络也许会与当前完全不同。”刘新民表示,未来大模型的训练将在芯片内、芯片间、设备间、数据中心内、城市内以及相距上千公里的城市间都会有互联互通的需求,联接标准的打通将是迈向算力时代的重要一步。
在产品矩阵布局上,新华三构建了从硬件基础设施到行业解决方案的完整链条。在互联标准层面,新华三积极参与UEC(超以太联盟)和UALink(加速卡超级互联联盟)等标准的讨论和制定,将技术重心从传统网络设备制造向协议层延伸。新华三正携手产业伙伴共同探索推进芯片卡间互联开放标准,进一步提升算力密度,推动产业智能化进程。刘新民表示:“我们希望通过推动开放、标准的联接,实现生态兼容的同时保留差异化特色,最终形成即插即用的通用解决方案。”
谈及近期市场上卷起的“DeepSeek一体机”热潮,刘新民直言,“市场需求旺盛,测试机供不应求。但我们认为热点背后,真正的价值在于场景落地,而非硬件本身。我们既顺应趋势,推出了搭载DeepSeek V3和R1模型的一体机,也保持冷静和谨慎的态度。”
在AI基础设施领域,新华三积极实践“AI in ALL”技术战略,发挥“算力×联接”的倍增效应,以“技术融合、标准共建、场景赋能”为支点,携手广泛的产业伙伴,服务百行百业。
迈向AI新纪元,新华三不仅是算力基础设施的提供者,更是产业跃迁的筑梦者。正如刘新民所说:“未来的‘联接’,不只是算力的互联,而是万物的互联。”新华三正以技术创新之力,耕耘AI时代的广袤田野。返回搜狐,查看更多