DeepSeek引发行业震动，大模型格局或将改变

春节前夕，DeepSeek在AI领域掀起了一场海啸，让国内一众大模型同行感受到了压力。北京一家大模型公司的资深从业者李辉（化名）表示，DeepSeek的产品能力与ChatGPT不存在差别，个人对其满意程度达80-90分，而国内其他大模型分数他只给一半。

李辉认为，DeepSeek有两点令人印象深刻。一是产品能力，它在自然语言交互方面有显著进步，对用户输入的理解更为准确，回答上下文也很顺畅。李辉让其整理某类型漫画，它能从中文到日文名进行条分缕析的罗列，且具备版权保护意识。二是给行业带来了希望，DeepSeek用较为低廉的成本取得了与OpenAI相近的效果，为大模型的商业化发展提供了新的思路。

然而，并非所有人都对DeepSeek持乐观态度。另一家大模型公司从业者王锐（化名）和自家人对DeepSeek进行测试后，发现了一些问题。例如，DeepSeek在回答立春时间和春节档电影票房排名等问题时出现错误。王锐认为，“大模型幻觉”问题依旧存在，市场主流的其他大模型产品能力并不逊色于DeepSeek。不过，他也承认，DeepSeek开创了全新的模型训练模式，加速了AI行业迭代，实现了用户破圈，从重视B端客户转向B端和C端并重，尤其是C端用户。

对于DeepSeek的未来，业内看法不一。有观点认为，它对海外巨头形成了降维打击，可能会终结国内的百模大战，也会让业界对大模型的期待降低，使行业回归理性。从2024年至今，大模型市场掀起了价格战，各大厂主力大模型纷纷降价，“大模型定价进入了厘时代”。不过，也有声音认为市场对DeepSeek的“追捧有点过了”，它目前可能更适合中小企业。

此外，李辉对DeepSeek-R1宣称的低成本表示怀疑，同时也指出，未来可能会出现更具性价比的模型。就在近日，有媒体报道，“AI教母”李飞飞等研究人员以不到50美元的云计算费用，成功训练出人工智能推理模型s1，其在数学和编码能力测试中的表现与OpenAI的O1和DeepSeek的R1等尖端模型不相上下。

总之，国内AI市场的竞争对各方都有益处，普通企业和个体用户能够以更低成本使用能力更强的AI。在中国AI军团登上国际舞台的时代，从业者将同时面临痛苦和快感。

# AI快讯

文章版权归作者所有，未经允许请勿转载。