Claude 3.7 Sonnet：首款混合推理模型引领AI新变革

AI快讯1年前 (2025)发布 niko

Claude 3.7 Sonnet：开启AI混合推理新时代

近日，AnthroPic推出的Claude 3.7Sonnet引发AI界关注，这一模型以其独特的混合推理能力，为该领域带来新变革。作为市场上首个混合推理模型，Claude 3.7Sonnet融合了即时响应与逐步思考的能力，API用户还能控制其思考时间。

独特设计理念，兼顾速度与深度

Claude 3.7Sonnet的设计理念与其他推理模型不同。Anthropic认为推理应是前沿模型的整体能力，而非独立模型。该模型既是普通语言模型，也是推理模型，有标准和扩展思考两种模式。标准模式是Claude3.5Sonnet的升级，扩展思考模式下，模型会自我反思，提升数学、编码等任务的性能。此外，用户通过API使用时能控制思考预算，在速度与回答质量间权衡。同时，模型优化重点转向现实世界任务，在SWE-bench Verified、TAU-bench等评测中表现出色。

AI编码新助力，Claude Code诞生

Anthropic还推出了智能体编码工具ClaudeCode（预览版）。它能主动与人协作，完成搜索阅读代码、编辑文件等任务，还改进了Claude.ai上的编码体验，所有Claude套餐支持GitHub集成。Claude3.7 Sonnet作为强大的编码模型，能深入理解项目，成为开发的有力助手。虽ClaudeCode尚处早期，但已在测试驱动开发等方面发挥重要作用，早期测试中完成45分钟手动任务，显著减少开发时间和工作量。

全新特性与测试机制，提升性能表现

Claude 3.7Sonnet具备“行为扩展”特性，在计算机使用任务中表现更佳，在OSWorld评估中优势明显。其扩展思考模式与AI智能体训练结合，在游戏等任务中实现突破。在测试计算方面，模型运用“串行测试时计算”机制提升性能，研究人员还探索并行测试时计算，通过采样多个思维过程选择最佳结果，在GPQA评估中取得突破，提升了回答质量和正确答案输出频率。

免费体验与广泛应用，引发各界关注

Claude 3.7Sonnet已在Claude.ai平台上线，Web、iOS和Android用户可免费体验，开发者也可通过多种途径访问。其价格与前代相同，性价比高。此外，AI大佬如宾夕法尼亚大学沃顿商学院教授EthanMollick对其进行测试，Claude 3.7的表现令人惊叹，能预判需求、创新方法，为AI领域带来新突破。

# AI快讯

文章版权归作者所有，未经允许请勿转载。