GTC 2025召开,英伟达面临新挑战与机遇 在GTC2025的开幕主题演讲上,英伟达创始人黄仁勋将其比作“AI界的超级碗”。然而,近期英伟达股价暴跌,且业内对GPU需求提出质疑,如以DeepSeekR1为代表的声音,在此背景下,英伟达需拿出有力“硬货”。
Agentic AI成为英伟达新希望 黄仁勋用40分钟解读AgenticAI时代,英伟达的关键在于高效处理tokens。AI历经判别式、生成式,正迈向AgenticAI时代,计算方式不断改变。从AlexNet到chatgpt,计算方式从检索变为生成;从生成式AI到agenticAI应用,对tokens需求大增。老黄以LLaMA3.3和Deepseek-R1为例,展示推理类应用消耗更多tokens,让AI更可靠。此外,测试阶段的ScalingLaw才刚开始,加速AI工作负载的“AI工厂”要高效处理tokens,实现从AI语言到智能的转化,这构成了AgenticAI下的新黄氏定律曲线,且购买英伟达产品对实现AI应用商业化有利。
“AI工厂”的操作系统Dynamo登场英伟达推出“AI工厂”引擎的操作系统Dynamo,旨在优化tokens的吞吐和延迟。为让大模型高效产出更多token,各公司有不同方案,英伟达的Dynamo被比作新时代的VMware,能让AI推理更好。采用Blackwell结合Dynamo,能优化性能,使用Dynamo可让Blackwell上的DeepSeek-R1吞吐量提升30倍,且Dynamo完全开源。黄仁勋还帮企业算账,对比了不同芯片在功耗、性能和token产出上的差异,强调购买英伟达产品能节省成本。
硬件领域多点开花 在硬件方面,英伟达推出Blackwell AI工厂平台的演进版本BlackwellUltra,专为AI推理设计,AI性能比前代高1.5倍,多家科技公司和云服务提供商将从2025年下半年提供相关实例。英伟达还公布数据中心路线图更新,包括下一代AI芯片Rubin与RubinUltra的计划配置。同时,英伟达首次公开光芯片在AI计算领域的进展,与台积电合作打造Spectrum-X和Quantum-X交换机,硅光芯片具有诸多优势,能优化巨型数据中心,两款交换机也有不同的上市计划。此外,老黄宣布下一代AI芯片架构命名为Feynman,将于2028年登场。
机器人生态完整成型在GTC上,物理AI受关注。英伟达在物理AI的数据、算法、算力方面全面发力。算力上有Orin和Thor芯片;数据上,通过OmniVerse数字孪生环境和Cosmos模型训练平台生成虚拟仿真数据,还针对人形机器人推出工具。在自动驾驶领域,通用汽车与英伟达合作;人形机器人领域,英伟达发布GR00TN1模型,是全球首个开放可定制的通用人形机器人推理与技能基础模型。此外,英伟达还与多方合作推出新物理引擎Newton,展示了Blue机器人,其在机器人领域持续投入。