开云体育

开云体育官方英伟达发布DGX Station桌面AI超算单机运行1万亿参数模型

2026-01-08
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!其核心目标是让开发者、研究人员和数据科学家无需依赖云端集群,即可在本地桌面上开发、微调并运行从 1000 亿到 1 万亿参数的开源及前沿 AI 模型,打通了从本地原型设计到云端大规模扩展的通道。

  作为入门级旗舰,DGX Spark 专为 1000 亿参数级别的模型设计。该系统引入了 NVFP4 数据格式,能将 AI 模型压缩高达 70% 且不损失智能表现。

  此外,英伟达优化与开源社区(如llama.cpp)的深度合作,该系统在运行 SOTA(最先进)模型时平均性能提升了 35%,并显著加快了 LLM(大语言模型)的加载速度。

  面向企业级和前沿实验室的 DGX Station 则不仅是性能怪兽,更是行业标杆。该机型搭载 GB300 Grace Blackwell Ultra 超级芯片,配备高达 775 GB 的 FP4 精度一致性内存,这一配置让其能够本地运行高达 1 万亿参数的巨型模型。

  IT之家注:一致性内存(Coherent Memory)指在 CPU 和 GPU 之间共享同一地址空间并实现硬件级数据同步的架构,通过 2026 年主流的 NVLink-C2C 或 PCIe Gen6/7 互连技术,数据可以在不同处理器间自由流动,无需显式的内存拷贝过程,显著降低了延迟。

  FP4 精度是一种 4 位浮点格式(通常采用 1 位符号、2 位指数、1 位尾数的 E2M1 布局),专为 Blackwell 及后续 Rubin 架构优化,能在保持模型精度的前提下,将显存占用降低至 FP16 的四分之一,吞吐量提升高达 2-3 倍。

  在硬件供应方面,DGX Spark 及合作伙伴推出的 GB10 系统即日起通过戴尔、惠普、联想、华硕等厂商发售,而旗舰级的 DGX Station 将于今年晚些时候正式上市。返回搜狐,查看更多

搜索