春节前夕,DeepSeek在AI领域掀起了一场海啸,让国内一众大模型同行感受到了压力。北京一家大模型公司的资深从业者李辉(化名)表示,DeepSeek的产品能力与ChatGPT不存在差别,个人对其满意程度达80-90分,而国内其他大模型分数他只给一半。

李辉认为,DeepSeek有两点令人印象深刻。一是产品能力,它在自然语言交互方面有显著进步,对用户输入的理解更为准确,回答上下文也很顺畅。李辉让其整理某类型漫画,它能从中文到日文名进行条分缕析的罗列,且具备版权保护意识。二是给行业带来了希望,DeepSeek用较为低廉的成本取得了与OpenAI相近的效果,为大模型的商业化发展提供了新的思路。
然而,并非所有人都对DeepSeek持乐观态度。另一家大模型公司从业者王锐(化名)和自家人对DeepSeek进行测试后,发现了一些问题。例如,DeepSeek在回答立春时间和春节档电影票房排名等问题时出现错误。王锐认为,“大模型幻觉”问题依旧存在,市场主流的其他大模型产品能力并不逊色于DeepSeek。不过,他也承认,DeepSeek开创了全新的模型训练模式,加速了AI行业迭代,实现了用户破圈,从重视B端客户转向B端和C端并重,尤其是C端用户。

对于DeepSeek的未来,业内看法不一。有观点认为,它对海外巨头形成了降维打击,可能会终结国内的百模大战,也会让业界对大模型的期待降低,使行业回归理性。从2024年至今,大模型市场掀起了价格战,各大厂主力大模型纷纷降价,“大模型定价进入了厘时代”。不过,也有声音认为市场对DeepSeek的“追捧有点过了”,它目前可能更适合中小企业。
此外,李辉对DeepSeek-R1宣称的低成本表示怀疑,同时也指出,未来可能会出现更具性价比的模型。就在近日,有媒体报道,“AI教母”李飞飞等研究人员以不到50美元的云计算费用,成功训练出人工智能推理模型s1,其在数学和编码能力测试中的表现与OpenAI的O1和DeepSeek的R1等尖端模型不相上下。
总之,国内AI市场的竞争对各方都有益处,普通企业和个体用户能够以更低成本使用能力更强的AI。在中国AI军团登上国际舞台的时代,从业者将同时面临痛苦和快感。