ScholarCopilot:智能学术写作新突破

AI快讯6天前发布 niko
20 0
AiPPT - 一键生成ppt

学术写作难题与新突破

学术写作中,查询文献引用耗时费力,而chatgpt等通用大语言模型常出现“引用幻觉”,严重影响学术论文质量。如今,加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队带来新希望,他们提出的ScholARCoPilot智能学术写作大模型框架,专注学术场景,旨在生成带准确引用的学术文本。

ScholarCopilot与传统方法差异

传统的检索增强生成(RAG)方法采用“先检索、再生成”的静态流程,存在检索与生成意图不匹配、无法动态调整引用策略等问题。ScholarCopilot则提出“边生成、边检索”的动态机制。生成文本时,模型会动态判断引用时机,生成特殊检索信号,实时检索学术数据库并融入后续生成过程,联合优化生成与检索任务,提升引用准确度与相关性。其写作方式更贴近人类真实习惯,撰写论文时按需检索引用,且后续内容会参考已插入引用。

ScholarCopilot性能展现

研究团队以阿里云Qwen-2.5-7B模型为基础,用50万篇arXiv论文训练,并进行多维度性能评估。在引用检索准确性上,ScholarCopilot的Top-1accuracy达到40.1%,远超E5-Mistral-7B-Instruct和BM25等现有检索模型。论文生成质量方面,综合得分16.2,高于参数量更大的Qwen-2.5-72B-Instruct和Qwen-2.5-7B-Instruct模型。真人评测中,其引用质量用户偏好率达100%,整体实用性偏好率超70%。

ScholarCopilot的不足与方向

ScholarCopilot虽有进步,但仍有局限。用户反馈其内容生成丰富性与全面性待提升,创新性想法和研究问题生成能力一般。此外,用户建议未来版本与主流学术写作平台紧密整合,支持分章节独立生成和任意光标位置文本预测功能。研究团队将以此为改进方向。

后续展望

ScholarCopilot研究团队希望通过优化性能、扩展数据库、改进用户体验,让研究人员专注研究本身。目前相关论文、代码与模型已公开发布,论文链接:https://arxiv.org/pdf/2504.00824;项目网站:https://tiger-ai-lab.github.io/ScholarCopilot/;演示视频:https://www.youtube.com/watch?v=QlY7S52sWDA。

© 版权声明
Trea - 国内首个原生AI IDE