年初,DeepSeek R1大模型亮相,其推理与性能媲美OpenAIo1,因开源策略与灵活部署能力,吸引火山引擎、阿里云等众多平台接入。随着接入厂商增多,各平台在基础设施适配能力上展开暗战。
中国软件评测中心的评测显示,各厂商在深度思考、代码能力等维度分化明显。在推理维度,百度智能云、火山引擎等平台展现出较强逻辑延展性。这种性能分野,反映了技术适配、资源调度与生态协同方面的深层博弈。
为测评各平台对DeepSeekR1的运用效果,选取AIME数学竞赛题目进行测试。AIME题目对模型的数学推理、逻辑严谨性和计算精度要求极高,是检验深度推理能力的有效工具。此前,DeepSeek-R1官方在AIME2024基准测试中取得79.8%的pass@1得分。
此次通过Python脚本测评了火山引擎、阿里云、官方Deepseek、腾讯云。结果显示,AIME题库下正确率从高到低依次为:火山引擎83.33%、官方Deepseek73.33%、阿里云71.67%、腾讯云58.33%。其中,火山和Deepseek表现平稳,阿里云在电信网络下异常中断严重,腾讯云网络无响应较频繁。
手动选取一道AIME试题观察,火山引擎速度最快、解题步骤清晰且贴心翻译成中文,用时13.68秒,官方Deepseek则最慢,用时81秒。
若想更全面测评各厂商APi性能,可参考第三方开发者的硬核实测项目。该项目从TTFT、TBT、吞吐量等维度测评,并绘制图表。结果表明,在生成速度和效率方面,火山引擎领先,其吞吐量达29.50tokens/s,TBT指标为33.9ms。在高负载稳定性上,火山引擎也表现出色。
综合来看,火山引擎在生成速度、效率、稳定性方面兼具优势,是Deepseek目前的最强“六边形战士”辅助。不过,AI行业发展迅速,各厂商都需不断努力。
DeepSeekR1云平台的分化,是对AI基础设施能力的检验,暴露了国产AI产业链的攻坚难点。对用户来说,这是精细化选择的机会。当前,火山引擎正在进行拉新活动,用户可畅享DeepSeekR1和V3 ,还有丰厚奖励。