火山引擎发布多款模型及解决方案,推动AI Agent发展
2025年4月17日,字节跳动旗下的火山引擎面向企业市场发布了重要产品。其中,豆包1.5・深度思考模型首次亮相,这也是豆包App背后的推理模型。此外,还有豆包・文生图模型3.0以及升级版的视觉理解模型。同时,火山引擎推出了OSAgent解决方案及AI云原生推理套件,助力企业构建和部署Agent应用。
豆包1.5深度思考模型:综合推理能力出色
年初以来,不少ToC应用接入其他推理模型,而3月初豆包App上线的「深度思考」模式,背后是字节跳动自研的豆包深度思考模型。如今,豆包1.5 ·深度思考模型正式发布,可在火山方舟平台体验和调用。该模型具备多种能力,联网模式下能像人类一样边想边搜,例如在购物场景中,可根据限制条件推荐露营装备,在点菜场景中能根据图片给出菜单方案。它还拥有视觉推理能力,在专业领域推理任务完成度高,具备低延迟特性,采用MoE架构,参数设置合理,在多模态场景应用广泛。
豆包文生图模型3.0及视觉理解模型升级
豆包文生图模型3.0实现了更好的文字排版表现、实拍级图像生成效果以及2K高清图片生成方式,解决了小字和长文本生成难题,改善了图片排版。豆包1.5视觉理解模型也有重要更新,视觉定位更精准,支持多种定位方式,可扩展应用场景;视频理解能力大幅提升,企业可基于此打造有趣的商业化应用。
云进入Agentic AI时代,火山引擎提供支持
随着强化学习泛化,AI进入AgenticAI时代。火山引擎为企业「定义自己的通用Agent」搭建基础设施。模型方面,需具备自主规划等能力和多模态推理能力。Infra技术栈也在进化,火山引擎推出OSAgent解决方案,支持大模型操作数字和物理世界,包含多种产品,为Agent智能交互提供基础。在垂直类Agent上也有探索,同时打造了AI云原生ServingKit推理套件,降低推理成本。火山引擎会在模型优化、成本降低、产品落地等方面持续发力,此前市场份额领先,未来Agent有望带动更大的tokens调用量。