当AI数据中心需连成“超级GPU”,OCS成跨区域传输关键解法

AI快讯5秒前发布 niko
1 0

AI数据中心的“跨区域计算”痛点

当AI训练与大规模计算需要调动全球数据中心的算力时,跨区域网络延迟与高能耗成为核心阻碍——英伟达曾明确提及,跨数据中心延迟是AI训练效率的重要制约因素。而随着数据量呈指数级增长,传统电交换架构下的“光-电-光”信号转换流程,更让能耗与延迟问题雪上加霜。

OCS:光域直连刷新数据传输潜力

由光通信技术演进而来的OCS(光路交换机),给出了截然不同的解法:无需经过光-电信号转换,直接在光域内完成信号交换。这一特性让OCS具备“延迟与能耗双低”的核心优势——相比需依赖光-电转换的CPO(光学共封装系统),OCS更像“光域立交桥”:当数据中心需跨区域串联成“超级GPU”,内部数十万计算节点协同计算时,OCS能以更低延迟支撑大规模数据传输,同时降低能耗消耗。

谷歌案例:OCS的“效能实证”

谷歌是OCS技术的“率先落地者”。2023年,谷歌研究发现OCS硬件与光纤组件成本仅占超级计算系统的5%,功耗占比不足3%;随后将OCS引入Jupiter数据中心网络,结果显示:网络吞吐量提升30%、功耗降低40%、数据流完成时间缩短10%、宕机时间减少50倍,资本开支也下降30%。这一案例直观验证了OCS的价值——用更低成本实现跨区域数据中心的高效协同

巨头入局:从标准化到商业化落地

OCS的潜力已吸引全球巨头参与。2025年7月,开放计算项目(OCP)成立OCS子项目,旨在推动光交换技术的开放化与标准化,初始成员包括谷歌、微软、英伟达、Lumentum等。作为项目领导者,Lumentum已率先收获商业化成果:第二季度向两家超大规模云厂商出货OCS,第三家客户即将落地,未来相关业务有望贡献数亿美元收入。

国内厂商也在加速布局:华为推出的全光交换机Huawei OptiXtrans DC808,采用MEMS技术实现高速稳定交换,还在2025年日本Interop Tokyo展会上获得“Best of Show Award特别奖”,展现了国内OCS技术的竞争力。

未解决的挑战:成本与技术路径分歧

但OCS并非“毫无阻碍”。当前光交换机制造成本仍高于电交换机,英伟达在OCP EMEA 2025大会上提到,OCS与CPO配合使用才能进一步降低整体功耗——OCS是对CPO的互补,而非全方位替代。此外,OCS内部仍存在技术路径分歧:

  • MEMS方案:核心客户为谷歌,参与厂商较多,技术成熟度较高;
  • 数字液晶DLC方案:由Coherent研发,已逐步导入超大规模云厂商供应链;
  • 压电陶瓷DBS方案:Polatis独家技术,目前仍未成熟。

市场前景:2029年规模或超16亿美元

尽管存在挑战,OCS的成长确定性仍被看好。Cignal AI预计,2025年后更多厂商将投资OCS领域,其在数据中心核心层、AI集群的部署量将持续增长,2029年市场规模有望超过16亿美元;国盛证券更是直言,OCS有望引领下一个光子通信时代。

中信证券提醒,AI数据中心使用OCS仍处早期阶段,但技术路线可行、优势明显,建议关注整机、核心器件、光学零部件等全产业链环节。

本文来自微信公众号“科创板日报”,作者:张真,36氪经授权发布。

© 版权声明