QVQ-Max ,一款全新的视觉推理模型震撼登场,它能对任意图像或视频展开深度思考,为用户带来前所未有的体验。
QVQ-Max的应用场景丰富多样。比如上传手掌图片,点击ThINKing ,它就能“看手相”,仔细分析手掌线条等特征。若“喂”给它多张图片,它能准确识别其中联系,像辨别出不同季节的西湖风景。在数学推理方面,只需一张图,它就能找到数字规律并给出答案。面对手绘简笔画视频,附上要求,它也能出色完成任务。
实际测试中,QVQ-Max表现出色。测试其看图解数学题能力,面对题目提问,深度思考后它精准识别题目并给出正确答案。给它特定图片提问,它能全面介绍星盘。视频推理测试里,对于抽象视频内容也能给出理解。
技术层面,虽Qwen团队未公布相关论文,但透露了一些亮点。在MathVision测试中,调整模型thinking最大长度,模型在该测试上的准确率不断提升。此外,QVQ-Max具备三大能力特点:图片解析能力强,能快速识别关键元素;能进一步分析信息并结合背景知识得出结论;还能进行一些创意工作,如设计插画等。而且,QVQ-Max免费可用,感兴趣的朋友可前往体验地址:https://chat.qwen.ai 。
© 版权声明
文章版权归作者所有,未经允许请勿转载。