Claude 3.7 Sonnet:首款混合推理模型引领AI新变革

AI快讯4小时前发布 niko
1 0
AiPPT - 一键生成ppt

Claude 3.7 Sonnet:开启AI混合推理新时代

近日,AnthroPic推出的Claude 3.7Sonnet引发AI界关注,这一模型以其独特的混合推理能力,为该领域带来新变革。作为市场上首个混合推理模型,Claude 3.7Sonnet融合了即时响应与逐步思考的能力,API用户还能控制其思考时间。

独特设计理念,兼顾速度与深度

Claude 3.7Sonnet的设计理念与其他推理模型不同。Anthropic认为推理应是前沿模型的整体能力,而非独立模型。该模型既是普通语言模型,也是推理模型,有标准和扩展思考两种模式。标准模式是Claude3.5Sonnet的升级,扩展思考模式下,模型会自我反思,提升数学、编码等任务的性能。此外,用户通过API使用时能控制思考预算,在速度与回答质量间权衡。同时,模型优化重点转向现实世界任务,在SWE-bench Verified、TAU-bench等评测中表现出色。

AI编码新助力,Claude Code诞生

Anthropic还推出了智能体编码工具ClaudeCode(预览版)。它能主动与人协作,完成搜索阅读代码、编辑文件等任务,还改进了Claude.ai上的编码体验,所有Claude套餐支持GitHub集成。Claude3.7 Sonnet作为强大的编码模型,能深入理解项目,成为开发的有力助手。虽ClaudeCode尚处早期,但已在测试驱动开发等方面发挥重要作用,早期测试中完成45分钟手动任务,显著减少开发时间和工作量。

全新特性与测试机制,提升性能表现

Claude 3.7Sonnet具备“行为扩展”特性,在计算机使用任务中表现更佳,在OSWorld评估中优势明显。其扩展思考模式与AI智能体训练结合,在游戏等任务中实现突破。在测试计算方面,模型运用“串行测试时计算”机制提升性能,研究人员还探索并行测试时计算,通过采样多个思维过程选择最佳结果,在GPQA评估中取得突破,提升了回答质量和正确答案输出频率。

免费体验与广泛应用,引发各界关注

Claude 3.7Sonnet已在Claude.ai平台上线,Web、iOS和Android用户可免费体验,开发者也可通过多种途径访问。其价格与前代相同,性价比高。此外,AI大佬如宾夕法尼亚大学沃顿商学院教授EthanMollick对其进行测试,Claude 3.7的表现令人惊叹,能预判需求、创新方法,为AI领域带来新突破。

© 版权声明
智谱清言 - 国产最强AI模型