Deepseek引领大模型行业变革，技术突破与开源策略引关注

春节期间，人工智能成为社交焦点，人形机器人在春晚出圈，Deepseek也强势登场。网友纷纷涌入，科技金融行业人员忙着测试模型。海外市场态度不一，OpenAI指责后，微软、英伟达等大厂却接入，OpenAICEO也称赞其R1模型。国内互联网巨头跟进，2月6日有道宣布全面拥抱DeepSeek-R1，Hi Echo等产品也将接入其推理能力并升级。

Deepseek并非因中美大模型技术之争才被关注，去年中它就因价格优势崭露头角。当时其推出的DeepSeek-V2价格仅为GPT-4-Turbo的百分之一左右，被称为“AI界拼多多”，且降价后仍有利润。这得益于其独特的模型训练路径，Deepseek-R1-Zero通过单纯强化学习训练实现推理能力，还创新性使用了FP8、MLA和MoE三种技术。其中，DeepSeek-V3的MoE架构更为精简有效，能降低无效训练。实际性能上，Deepseek-R1已能比肩OpenAI-o1正式版，在多项权威评测中表现出色。

Deepseek的“出身”也备受关注，它成立于2023年12月，前身服务于量化交易，创始人梁文锋在量化交易领域成绩斐然。其“开源”策略更是引发震动，将模型架构和参数开源，吸引了众多大厂和技术人才。海外大厂如英伟达、英特尔等纷纷接入，国内大厂阿里云、百度云也跟进。不过，欧美多国对其安全性存疑，美国开展国家安全调查并要求部分部门禁用，微软也曾调查相关数据获取问题。

对于普通用户，Deepseek带来新机会的同时也有挑战。社交平台出现相关课程，但使用体验上，它难以承受大量流量，已关闭联网功能，输出质量下降。而且在图文、视频能力上有所缺失，还面临政策、数据安全等争议，计算资源与算力也受限。但它的出现推动了大模型生态发展，如智能手机行业般，为行业带来更多机遇。

# AI快讯

文章版权归作者所有，未经允许请勿转载。