2月13日,百度官方宣告重大消息,文心一言自4月1日0时起将全面免费开放,所有PC端与App端用户均可免费使用其最新模型。回溯过往,2023年11月1日,百度推出文心一言专业版并开启付费服务,在国内AI巨头中率先迈出这一步。然而,历经516天,文心一言如今走向全面免费之路。

在文心一言官宣免费前夕,百度创始人李彦宏在谈及DeepSeek对AI行业的冲击时,表示要加大创新力度。他认为这是充满创新的时代,企业必须适应快速变化。DeepSeek的出现意义非凡,它不仅让中国AI大模型站在世界前列,在思维模式创新与落地实践实用方面表现出色,还为投资者和硬件开发商指明新方向,且其完全免费供C端用户使用,这与此前寻求C端盈利的巨头模式不同。如今,文心一言彻底免费,拥有强大推理、理解、记忆和逻辑能力的文心4.0Turbo面向普通用户开放,意味着它与DeepSeek的竞争正式打响。
文心一言目前面向C端的大模型产品有文心3.5、文心4.0、文心4.0Turbo和文心4.0工具版。此前文心3.5免费,后三款需开通VIP。此前VIP价格为59.9元连续包月、588.8元连续包年,相比对标产品GPTPlus已很合理。4月1日后,文心4.0、文心4.0 Turbo、文心4.0工具版均免费开放。很多用户好奇文心3.5与付费的文心4.0Turbo差异,为此进行了对比测试。
在语言类问题测试中,提出‘我也想过过过儿的生活’,文心3.5和文心4.0Turbo都能理解含义,但给出不同建议。文心3.5推荐武术课程等帮助成为‘大侠’,不太符合实际;文心4.0Turbo则建议从精神角度做‘大侠’,更具合理性。

推理环节中,给出逻辑推理问题判断小明说实话的日期。文心4.0Turbo推理速度明显更快,仅四次假设就得出正确答案,即小明在第三天(星期二)说实话;文心3.5推理速度慢,花费约1分钟且答案错误,不过其思维链清晰,便于发现推理问题。

进阶数学推理问题选取扑克牌数字推论,文心4.0Turbo在20秒内给出完整思考过程和正确答案;文心3.5推理速度虽比之前快,但过程复杂且出现错误。不过经重复测试,文心3.5最终给出正确回答,说明文心一言整体正确率不错,但文心4.0Turbo效率更优。
文心4.0 Turbo在推理逻辑性、记忆能力和处理速度方面优势显著,清华研究报告的大模型综合评测也证实其表现出色,这在普通用户体验中得到体现。
文心4.0 Turbo的优势也是DeepSeek爆火原因之一。在扑克牌数字推断问题上,文心4.0 Turbo1分钟内完成解答且答案正确,而DeepSeek不仅花费近十分钟,思维过程繁琐,还出现得出正确答案但最终回答错误的情况,这表明其还有提升空间,且目前存在服务器算力不足问题,常出现服务器繁忙提示。不过,DeepSeek思维链清晰,便于复现和检查推理过程。在普通推理问题上,DeepSeek速度慢,复杂问题易出错,文心4.0Turbo则更成熟,只是思考过程展示不如DeepSeek详细。

百度作为国内最早推出C端大模型应用的厂商,产品历经升级已成熟。此前文心一言付费服务让部分用户有距离感。目前国内面向C端的AI大模型应用中,文心一言和智谱清言的智谱AI提供VIP服务,前者限制模型使用权限,后者限制问答次数。免费的AI应用如元宝、豆包、通义千问多为多模态应用,海外主流AI应用则多开启VIP订阅模式。中国市场AI应用普遍免费,这既能快速扩大用户基础,又能提升品牌影响力。如今百度宣布文心一言免费,对DeepSeek等AI应用构成巨大威胁。
2023年文心一言、chatgpt开启订阅模式后,AI付费时代未如预期到来。DeepSeek走红警示开发大模型不能仅靠堆砌算力。百度转向免费,背后是市场迈向成熟,李彦宏曾透露大模型推理成本大幅降低。普通用户对文心一言免费感到兴奋,因其在中文领域优势明显。文心一言免费后将与DeepSeek、豆包等展开激烈竞争,中国AI应用的大比拼正式开启。