昆仑万维发布全球首个工业界开源多模态推理模型Skywork R1V

AI快讯1个月前发布 niko
4 0
AiPPT - 一键生成ppt

昆仑万维发布全球首个工业界开源多模态推理模型Skywork R1V

昆仑万维正式对外发布了全球首个工业界多模态推理模型SkyworkR1V,此模型拥有38亿参数。在性能方面,它已逼近知名闭源模型DeepSeek-R1,在多个基准测试里表现优异,超越一系列先进技术(SOTA)。

R1V卓越的多模态推理能力

R1V以出色的多模态推理能力著称,可完美融合文本与视觉信息。在视觉问答任务中,能与Claude3.5Sonnet和GPT-4o等闭源模型对标,同时保持顶级文本推理能力。在MMMU基准测试中,R1V斩获69分的佳绩,创造同等规模模型新纪录;在MathVista测试中也获得67.5分,展现出在复杂数学推理和逻辑分析上的强大实力。

创新技术助力R1V成功

R1V的成功离不开昆仑万维研究团队的创新技术。跨模态迁移学习技术,将大模型文本推理能力有效迁移至视觉模态,大幅减少多模态推理数据需求。混合训练策略通过结合迭代监督微调和强化学习,动态调整思维链长度,提升推理效率。自适应长度思维链蒸馏框架的引入,避免推理时的“过度思考”,显著提高推理的效率与质量。

开源推动技术共享与AGI发展

昆仑万维开源R1V,推动技术共享,为全球AI开源社区注入新活力。模型权重、推理代码和技术报告均已公开,人们可通过GitHub和HuggingFace获取相关资源,助力AGI梦想的实现。

模型权重下载

Hugging Face: https://HuggingFace.co/Skywork/Skywork-R1V-38B

GitHub: https://github.com/SkyworkAI/Skywork-R1V

详细技术报告

https://github.com/SkyworkAI/Skywork-R1V/blob/main/Skywork_R1V.pdf

© 版权声明
Trea - 国内首个原生AI IDE