DeepSeek R1冲击大模型市场
DeepSeekR1问世128天,给大模型市场带来巨大震动。它成功压低推理模型价格,OpenAI六月更新的o3价格相较o1直降为2折。同时,第三方平台托管的DeepSeek模型使用量飙升,较发布时增长近20倍,成就了众多云计算厂商。然而,DeepSeek自家网站和APi市场份额却持续下滑。
降本致服务质量妥协
尽管DeepSeekV3与R1版本更新后能力增强、价格降低,但用户却大量流失。SemiAnalysis指出,这是因为DeepSeek为降低成本,在服务质量上做出诸多妥协。以首token延迟衡量,用户在其官方平台使用模型时,常需等待几秒才有响应,而其他平台响应速度快很多,甚至几乎零延迟。在价格与性能方面,DeepSeek在有限推理计算资源下,仅提供64k上下文窗口服务,在主流模型提供商中处于较低水平,无法满足编程等场景需求。
专注AGI研发的策略
DeepSeek这些降本策略是主动选择,它无意从用户身上盈利,也无意通过聊天应用或API服务提供大量token,而是专注于实现AGI。它将大量算力资源用于内部研发,配合开源策略,让云服务托管模型以赢得影响力和培养生态。在其影响下,Claude也开始降低速度缓解算力紧张。
大模型发展新趋势
如今,大模型供应商正多维度改进模型,不仅提高智能上限,更注重提升每个token能提供的智能。
© 版权声明
文章版权归作者所有,未经允许请勿转载。