英伟达GTC大会一直以来都在AI领域占据着重要地位,此次大会更是吸引了众多目光。在会上,英伟达推出了一系列令人瞩目的产品和技术,展示了其在AI领域的深厚实力和前瞻性布局。
首先,全新的Blackwell芯片 成为焦点之一。代号为“Ultra”的GB300AI芯片,接棒去年的B200,实现了性能上的重大突破。它将包括英伟达GB300 NVL72机架级解决方案以及英伟达HGX B300NVL16系统。GB300 NVL72预计今年下半年发布,具备多项强大参数,如在进行FP4精度的推理任务时能达到1.1ExaFLOPS,在FP8精度的训练任务中性能为1.2 ExaFLOPS等。与GB200 NVL72相比,性能提升显著,还配备了更多内存和更高带宽。
除了芯片,英伟达还推出了两款“真·AI PC”。DGX Station 包含单个GB300 BlackwellUltra芯片,配备784GB的同一系统内存,内置800Gbps英伟达ConnectX-8 SuperNIC网络,支持20petaflops的AI性能。而之前展示的“迷你主机”Project DIGITS正式命名为DGX Spark ,搭载专为桌面优化的GB10Grace Blackwell超级芯片,每秒可提供高达1000万亿次AI计算操作,用于最新AI推理模型的微调和推理。
在未来芯片规划方面,英伟达官宣了下一代AI芯片Rubin 。Vera RubinNVL144预计2026年下半年发布,性能将达到Hopper的900倍,相比Blackwell也有大幅提升。Rubin引入了名为Veru的GraceCPU继任者,包含88个定制的Arm核心。此外,英伟达还计划推出Rubin Ultra版本,将于2027年下半年推出,性能更为强大。
随着AI工厂规模的扩大,网络基础设施的重要性日益凸显。英伟达推出了Spectrum-X™ 和Quantum-X硅光网络交换机。Spectrum-X Photonics交换机具有多种配置,总带宽和吞吐量可观。与之配套的Quantum-XPhotonics交换机基于200Gb/s SerDes技术,为AI计算架构提供2倍速度和5倍可扩展性。
在软件方面,为“AI工厂”打造的操作系统Dynamo备受关注。它是一款分布式推理服务库,具有GPU规划引擎、智能路由器、低延迟通信库和内存管理器等优势,能为相关问题提供开源解决方案。
人形机器人环节,英伟达带来了Isaac GR00TN1,全球首款开源人形机器人功能模型。该模型采用“双系统”架构,模仿人类认知原理,在视觉语言模型支持下实现动作规划和执行。黄仁勋还宣布了与GoogleDeepMind和Disney ReseARCh合作开发的开源物理引擎Newton。
此外,英伟达在DeepSeek-R1推理方面取得了优异成绩。一台搭载8个BlackwellGPU的DGX系统,运行6710亿参数的DeepSeek-R1模型时,实现了高速推理,通过硬件和软件结合,吞吐量和成本效率都有大幅提升。