AI圈热闹非凡:DeepSeek、QwQ-Max-Preview与Claude 3.7 Sonnet引领技术变革

AI快讯12小时前发布 niko
1 0
AiPPT - 一键生成ppt

近日,AI领域呈现出一片活跃景象。新一代“开源战神”DeepSeek表现亮眼,在以R1教育市场后,开启全面开源模式,5天内每日发布一个代码库。其中,第一天推出的FlashMLA针对英伟达的HoppersGPU(如H100、H800)进行了效率优化,实现了对GPU性能的充分挖掘。而今日开源的DeepEP通信库,专为专家混合(MoE)和专家并行(EP)设计,能够使“专家们”的交流更为快速、高效,这无疑会吸引国内众多持有HoppersGPU且研究MOE模型的AI公司。

阿里通义千问作为“开源老兵”,也不甘示弱,推出了QwQ-Max-Preview深度思考模型。这是一个基于Qwen2.5-Max的推理模型,具备很强的数学理解与编码能力,虽为预览版,但已展示出思维链,还支持联网搜索。经测试,在解答数学竞赛真题时,QwQ-Max-Preview给出了正确答案,不过思考时间略长。

与此同时,大洋彼岸的AnthroPic对模型进行了升级,推出了号称迄今为止最聪明的Claude 3.7Sonnet。这是一个推理模型与传统模型的“混血”混合模型,拥有标准和扩展两种模式。在扩展模式下,用户能够看到大模型的推理步骤与思考过程,其在解答测试题目时,展现出了又快又准的优势,并且代码能力依然强劲,在与Grok3等模型的对比中脱颖而出。

从这些事件中可以清晰地看到当前人工智能的发展趋势。一方面,开源阵营不断壮大,DeepSeek的开源举措收获众多关注,除了它和Meta,阿里通义千问、xAI,以及陆续拥抱开源的百度、Minimax和阶跃星辰等,都让开源阵营日益强大。另一方面,推理模型逐渐成为主流,各模型在数学、代码等方面展开竞争,展现出AI领域快速发展、不断创新的态势。

© 版权声明
智谱清言 - 国产最强AI模型