Deepseek引领大模型行业变革,技术突破与开源策略引关注

AI快讯2周前发布 niko
2 0
AiPPT - 一键生成ppt

春节期间,人工智能成为社交焦点,人形机器人在春晚出圈,Deepseek也强势登场。网友纷纷涌入,科技金融行业人员忙着测试模型。海外市场态度不一,OpenAI指责后,微软、英伟达等大厂却接入,OpenAICEO也称赞其R1模型。国内互联网巨头跟进,2月6日有道宣布全面拥抱DeepSeek-R1,Hi Echo等产品也将接入其推理能力并升级。

Deepseek并非因中美大模型技术之争才被关注,去年中它就因价格优势崭露头角。当时其推出的DeepSeek-V2价格仅为GPT-4-Turbo的百分之一左右,被称为“AI界拼多多”,且降价后仍有利润。这得益于其独特的模型训练路径,Deepseek-R1-Zero通过单纯强化学习训练实现推理能力,还创新性使用了FP8、MLA和MoE三种技术。其中,DeepSeek-V3的MoE架构更为精简有效,能降低无效训练。实际性能上,Deepseek-R1已能比肩OpenAI-o1正式版,在多项权威评测中表现出色。

Deepseek的“出身”也备受关注,它成立于2023年12月,前身服务于量化交易,创始人梁文锋在量化交易领域成绩斐然。其“开源”策略更是引发震动,将模型架构和参数开源,吸引了众多大厂和技术人才。海外大厂如英伟达、英特尔等纷纷接入,国内大厂阿里云、百度云也跟进。不过,欧美多国对其安全性存疑,美国开展国家安全调查并要求部分部门禁用,微软也曾调查相关数据获取问题。

对于普通用户,Deepseek带来新机会的同时也有挑战。社交平台出现相关课程,但使用体验上,它难以承受大量流量,已关闭联网功能,输出质量下降。而且在图文、视频能力上有所缺失,还面临政策、数据安全等争议,计算资源与算力也受限。但它的出现推动了大模型生态发展,如智能手机行业般,为行业带来更多机遇。

© 版权声明
智谱清言 - 国产最强AI模型