QVQ-Max：开启图像与视频深度思考新时代

AI快讯1年前 (2025)发布 niko

QVQ-Max ，一款全新的视觉推理模型震撼登场，它能对任意图像或视频展开深度思考，为用户带来前所未有的体验。

QVQ-Max的应用场景丰富多样。比如上传手掌图片，点击ThINKing ，它就能“看手相”，仔细分析手掌线条等特征。若“喂”给它多张图片，它能准确识别其中联系，像辨别出不同季节的西湖风景。在数学推理方面，只需一张图，它就能找到数字规律并给出答案。面对手绘简笔画视频，附上要求，它也能出色完成任务。

实际测试中，QVQ-Max表现出色。测试其看图解数学题能力，面对题目提问，深度思考后它精准识别题目并给出正确答案。给它特定图片提问，它能全面介绍星盘。视频推理测试里，对于抽象视频内容也能给出理解。

技术层面，虽Qwen团队未公布相关论文，但透露了一些亮点。在MathVision测试中，调整模型thinking最大长度，模型在该测试上的准确率不断提升。此外，QVQ-Max具备三大能力特点：图片解析能力强，能快速识别关键元素；能进一步分析信息并结合背景知识得出结论；还能进行一些创意工作，如设计插画等。而且，QVQ-Max免费可用，感兴趣的朋友可前往体验地址：https://chat.qwen.ai 。

# AI快讯

文章版权归作者所有，未经允许请勿转载。