文心一言免费与DeepSeek竞争,大模型推理能力对比及应用新趋势

AI快讯1周前发布 niko
11 0
AiPPT - 一键生成ppt

2月13日,百度官方宣告一个重大消息:文心一言自4月1日0时起将全面免费开放,届时PC端与App端的所有用户都能免费使用其最新模型。回溯到2023年11月1日,百度曾推出文心一言专业版,并开启连续包月49.9元的付费服务,这使其成为中国AI巨头中率先面向C端推出付费模式的大模型产品。然而,历经516天,文心一言如今迈向全面免费的新阶段。

在文心一言官宣免费前夕,百度创始人兼首席执行官李彦宏在谈及DeepSeek对AI行业的冲击时,表示要加大创新力度。他认为这是创新频出的激动时刻,行业必须适应快速变化。DeepSeek的出现,让AI相关行业产生震动。它不仅彰显了中国AI大模型在世界前沿的实力,其思维模式创新且落地实践实用;还为投资者与硬件开发商指明新方向,即便无需高额投入,也能收获良好效果。更重要的是,DeepSeek完全免费,C端用户可随时免费使用其最新大模型,这与此前为大模型C端产品盈利而焦虑的巨头们形成鲜明对比。如今文心一言彻底免费,具备强悍推理、理解、记忆和逻辑能力的文心4.0Turbo也将向普通用户开放,这意味着文心一言与DeepSeek的竞争正式打响。

免费开放后,文心一言的使用体验备受关注。目前文心一言面向C端的大模型产品有文心3.5、文心4.0、文心4.0Turbo和文心4.0工具版。此前文心3.5免费,后三款需开通VIP使用,VIP价格为连续包月59.9元、连续包年588.8元,相比对标产品GPTPlus已很合理。4月1日后,这三款模型都将免费开放。为了解免费前后的差异,有人对文心3.5和文心4.0Turbo进行对比测试。在语言类问题“我也想过过过儿的生活”测试中,二者虽都理解含义,但给出的建议不同。文心3.5推荐武术课程和锻炼方式,而文心4.0Turbo则建议从精神层面学习杨过的处事作风。在推理环节,面对判断小明在哪一天说实话的逻辑推理问题,文心4.0Turbo推理速度明显更快,仅做四次假设就得出正确答案,而文心3.5不仅速度慢,最终答案也不正确,不过其思维链清晰,便于发现推理问题。在进阶的扑克牌数字推论数学推理问题上,文心4.0Turbo依旧表现出色,几乎在20秒内给出完整思考过程与正确答案,文心3.5虽推理速度有所提升,但过程复杂且最终回答错误,经重复测试后才给出正确回答。整体而言,文心4.0Turbo在推理逻辑性、记忆能力和处理速度上优势明显,清华研究报告的评测成绩也在普通用户体验中得到印证。

文心4.0Turbo在推理能力和处理速度上的优势,也是DeepSeek受到关注的原因之一。那么,DeepSeek在处理同样问题时表现如何?在扑克牌数字推断问题上,文心4.0Turbo在1分钟内完成正确解答,而DeepSeek不仅思维过程繁琐,花费近十分钟推理,还出现得出正确答案但最终回答错误的情况,这表明其R1大模型仍有进步空间,且存在服务器算力不足问题,普通用户使用时大概率会遇到服务器繁忙提示。不过,DeepSeek思维链清晰,便于复现和检查推理过程。在普通推理问题上,DeepSeek虽能展示详细思考过程,但速度慢,复杂问题还会出现答案不符情况,文心4.0Turbo则更成熟,只是思考过程展示不如DeepSeek详细。目前中国面向C端的AI大模型应用中,百度文心一言和智谱清言的智谱AI提供VIP服务,方式不同;而元宝、豆包通义千问等免费应用多为多模态。海外主流AI应用则多开启VIP订阅模式。整体来看,中国AI应用普遍采用免费策略,这既能快速扩大用户基础,又能提升品牌影响力。百度宣布文心一言免费,对DeepSeek等其他AI应用构成巨大威胁。

2023年文心一言、chatgpt开启订阅模式后,市场曾认为AI付费时代来临,但如今这股风潮未被广泛跟随。DeepSeek的走红警示开发大模型不能仅靠堆砌算力,就连OpenAI也受其影响。百度转向免费背后,是推理成本的降低。对于普通用户来说,文心一言免费令人兴奋,其在中文领域优势明显。文心一言免费后,将与DeepSeek、豆包等展开激烈竞争,中国AI应用的大比拼才真正开始。

© 版权声明
智谱清言 - 国产最强AI模型