年前,DeepSeek在AI领域掀起巨大波澜,让国内众多大模型同行在春节期间备受关注。某大厂大模型业者甚至感慨产品超出想象,比自家的各方面都更出色,以至于产生跳槽的想法。不过,也有业者对此持有不同看法,认为其火爆或许只是一种情绪泡沫。
李辉,作为北京一家大模型公司的资深从业者,在DeepSeek爆火时,与同事展开了热烈讨论。他直言,DeepSeek的产品能力与ChatGPT相比并无差别,满意度可达80
90分,远超国内其他大模型。在他看来,DeepSeek有两大亮点。其一,产品能力出众。李辉在使用中发现,其他国内大模型对用户输入的prompt要求较高,而DeepSeek在自然语言交互方面更进一步,无论用户说什么都能理解,回答的上下文也十分顺畅。他还让DeepSeek帮忙整理漫画,从中文到日文名,都能条分缕析地罗列出来,且DeepSeek因版权保护意识拒绝提供下载地址。其二,给行业带来希望。李辉认为,DeepSeek以较低的成本取得了与OpenAI相近的效果,为商业化发展带来了更大可能。
然而,并非所有人都对DeepSeek持乐观态度。另一家大模型公司从业者王锐,对DeepSeek的爆火持相对理性的态度。他和家人在测试中发现了两个bug,这让他对DeepSeek的第一印象不佳。他认为,“大模型幻觉”这一难题依然存在,虽然DeepSeek开创了全新的模型训练模式,加速了AI行业迭代,实现了用户破圈,从重视B端客户转向B端和C端并重,但很多人下载使用可能只是跟风,这些靠情绪而来的用户是否为核心高频用户存疑。
老板们对DeepSeek的看法也不尽相同。有消息称雷军曾以千万年薪挖来95后AI天才少女罗福莉,她被传是DeepSeek的首席架构师,但后续并无确切消息。舆论认为,国内大模型的六大独角兽公司,即“AI六小虎”可能受到冲击。DeepSeek将战线拉到与OpenAI、Gemini齐平的水平,对海外巨头形成降维打击,这是否会影响“AI六小虎”的发展,甚至终结国内的百模大战,值得关注。此外,DeepSeek也可能让业界对大模型的期待降低,戳破大模型的泡沫,使行业回归理性。如今,大模型纷纷打起价格战,“大模型定价进入了厘时代”。不过,也有机构认为市场对DeepSeek的“追捧有点过了”,它可能更适合中小企业。李辉对DeepSeek也存在疑问,比如其成本宣称是否属实,以及未来是否会有更具性价比的模型出现。就在近日,有媒体报道研究人员以低成本训练出的s1模型与DeepSeek的R1等尖端模型表现相近。无论如何,国内的竞争对各方都有益,普通企业和个体用户能以低成本使用更强的AI,而从业者则将在2025年面临痛苦与快感并存的局面。