AI圈热闹非凡：DeepSeek、QwQ-Max-Preview与Claude 3.7 Sonnet引领技术变革

AI快讯1年前 (2025)发布 niko

近日，AI领域呈现出一片活跃景象。新一代“开源战神”DeepSeek表现亮眼，在以R1教育市场后，开启全面开源模式，5天内每日发布一个代码库。其中，第一天推出的FlashMLA针对英伟达的HoppersGPU（如H100、H800）进行了效率优化，实现了对GPU性能的充分挖掘。而今日开源的DeepEP通信库，专为专家混合（MoE）和专家并行（EP）设计，能够使“专家们”的交流更为快速、高效，这无疑会吸引国内众多持有HoppersGPU且研究MOE模型的AI公司。

阿里通义千问作为“开源老兵”，也不甘示弱，推出了QwQ-Max-Preview深度思考模型。这是一个基于Qwen2.5-Max的推理模型，具备很强的数学理解与编码能力，虽为预览版，但已展示出思维链，还支持联网搜索。经测试，在解答数学竞赛真题时，QwQ-Max-Preview给出了正确答案，不过思考时间略长。

与此同时，大洋彼岸的AnthroPic对模型进行了升级，推出了号称迄今为止最聪明的 Claude 3.7Sonnet。这是一个推理模型与传统模型的“混血”混合模型，拥有标准和扩展两种模式。在扩展模式下，用户能够看到大模型的推理步骤与思考过程，其在解答测试题目时，展现出了又快又准的优势，并且代码能力依然强劲，在与Grok3等模型的对比中脱颖而出。

从这些事件中可以清晰地看到当前人工智能的发展趋势。一方面，开源阵营不断壮大，DeepSeek的开源举措收获众多关注，除了它和Meta，阿里通义千问、xAI，以及陆续拥抱开源的百度、Minimax和阶跃星辰等，都让开源阵营日益强大。另一方面，推理模型逐渐成为主流，各模型在数学、代码等方面展开竞争，展现出AI领域快速发展、不断创新的态势。

# AI快讯

文章版权归作者所有，未经允许请勿转载。