英伟达2025年3月18日GTC大会:创新与布局背后的思考
英伟达2025年3月18日举办的GTC大会,虽表面看似平淡,实则蕴含诸多关键信息。大会上,英伟达创始人兼CEO黄仁勋发布的各项更新,此前已被市场预期消化,当日英伟达股价仍下跌3.3%。然而,与一些机构投资人和芯片从业者交流后发现,很多人对英伟达的发展路线和布局依然看好。
一、技术创新:纵向与横向扩展的协同
黄仁勋在Keynote演讲中强调,英伟达并非单张GPU芯片的叙事,而是“Scale Up and Scale Out”的宏大布局。“ScaleUp”即“纵向扩展”,通过NVLINK通信互联技术将单个系统功能推至极致。黄仁勋公布了英伟达未来几代芯片的路线图,从当前的Blackwell到未来的BlackwellUltra、Vera Rubin、Rubin Ultra,最终到2028年的Feynman架构,每一代芯片性能都有显著提升。
“Scale Out”即“横向扩展”,通过硅光技术CPO(Co-packagedOptics,光电一体封装交换机)等技术更新,实现数据中心算力集群的快速扩张和提效。CPO交换机将插拔式光模块替换为与ASIC一体化封装的硅光器件,与传统网络相比,能效提高3.5倍,网络可靠性提高10倍,部署时间缩短1.3倍,极大增强了英伟达数据中心的互联性能。
二、软件生态:打造推理侧的“第二个CUDA”
英伟达在软件生态上推出重要更新——Dynamo。这是一款开源的AI推理服务软件,被视为NvidiaTriton推理服务器的“接班人”,旨在以更高效和更低的成本加速并扩展AI模型的推理部署。Dynamo包含GPU规划器、智能路由器、低延迟通信库和显存管理器四项关键创新,大幅提升了推理性能和资源利用率,降低了单位推理任务的成本。
三、数据中心基建:适配大规模集群建设
为配合更大规模集群建设,数据中心基建和上下游需随之更新。芯片架构取名方式的更新,强调了“集群”生态。数据中心中的机架架构将升级为“Kyber”,通过计算托盘旋转90度,实现更高的机架密度。同时,整个数据中心的制冷、供电等也需为新一代芯片升级。
四、推理时代:竞争格局与英伟达的优势
在AI进入推理侧之际,AMD、Groq、谷歌TPU、ASIC等玩家试图分羹。然而,无论是投资人还是芯片领域人士,大多认为“大家都有机会,但机会不大”。英伟达目前生态完整,护城河深厚,不仅单个GPU性能出色,大集群高效联通,且CUDA软件层面优化和支持强大,还在不断加固新的护城河。
五、全生态布局:“全生态超级碗模式”
黄仁勋传递出“全生态布局”的重要信号,即今后任何需要加速计算的领域都不会错过。此次演讲中,背后展示的“为每一个产业服务的CUDA-X”涵盖多个领域。量子计算、自动驾驶和机器人赛道中的仿真平台和算法,是英伟达着重布局的方向。黄仁勋提出“全生态超级碗模式”,旨在让英伟达生态中的每个人都成为赢家。