AI领域竞争激烈,谁先掌握关键技术与构建生态,对大模型未来至关重要。谷歌在这方面正凭借自身优势发力。在谷歌云NEXt’25峰会上,谷歌带来诸多创新成果。算力基础设施方面,发布了专为推理设计的第七代TPU——Ironwood。当前,算力紧缺是行业普遍面临的问题,谷歌此前在TPU支出巨大,还租赁英伟达GPU,对推理友好的AI芯片需求迫切。
Ironwood芯片性能卓越,全方位超越前作Trillium。在推理朝着统一多模态与思维链发展的当下,芯片性能提升需求大增。Ironwood单卡性能强大,在FP8精度下峰值算力与B200相当,单芯片HBM内存容量和带宽优势明显。同时,其能效大幅提升,避免了被电力瓶颈限制,还可纵向、横向扩展,实现高效分布式计算。
算法提效同步推进,谷歌的推理模型不断迭代。此前发布的gemini-2.5-Pro在基准测试中表现出色,成本大幅下降。此次公开的Gemini-2.5-Flash亮点在于“动态且可控”的计算能力,避免算力浪费。此外,谷歌还发布了文本到音乐模型Lyria,迭代多个多模态模型,成为多模态最齐备的单一平台。
智能体生态建设上,谷歌发布Agent2Agent协议。该协议允许不同开发者的智能体相互通信,明确了三方参与者及交互方式,保障安全与隐私。谷歌认为A2A与MCP互补,MCP侧重链接实用数据等,A2A解决多智能体协同问题。如今智能体竞争激烈,推理时代未来将是多智能体自主推理的时代,谷歌看好A2A的商业潜力。
© 版权声明
文章版权归作者所有,未经允许请勿转载。