ScholarCopilot：智能学术写作新突破

学术写作难题与新突破

学术写作中，查询文献引用耗时费力，而 chatgpt等通用大语言模型常出现“引用幻觉”，严重影响学术论文质量。如今，加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队带来新希望，他们提出的ScholARCoPilot智能学术写作大模型框架，专注学术场景，旨在生成带准确引用的学术文本。

ScholarCopilot与传统方法差异

传统的检索增强生成（RAG）方法采用“先检索、再生成”的静态流程，存在检索与生成意图不匹配、无法动态调整引用策略等问题。ScholarCopilot则提出“边生成、边检索”的动态机制。生成文本时，模型会动态判断引用时机，生成特殊检索信号，实时检索学术数据库并融入后续生成过程，联合优化生成与检索任务，提升引用准确度与相关性。其写作方式更贴近人类真实习惯，撰写论文时按需检索引用，且后续内容会参考已插入引用。

ScholarCopilot性能展现

研究团队以阿里云Qwen-2.5-7B模型为基础，用50万篇arXiv论文训练，并进行多维度性能评估。在引用检索准确性上，ScholarCopilot的Top-1accuracy达到40.1%，远超E5-Mistral-7B-Instruct和BM25等现有检索模型。论文生成质量方面，综合得分16.2，高于参数量更大的Qwen-2.5-72B-Instruct和Qwen-2.5-7B-Instruct模型。真人评测中，其引用质量用户偏好率达100%，整体实用性偏好率超70%。

ScholarCopilot的不足与方向

ScholarCopilot虽有进步，但仍有局限。用户反馈其内容生成丰富性与全面性待提升，创新性想法和研究问题生成能力一般。此外，用户建议未来版本与主流学术写作平台紧密整合，支持分章节独立生成和任意光标位置文本预测功能。研究团队将以此为改进方向。

后续展望

ScholarCopilot研究团队希望通过优化性能、扩展数据库、改进用户体验，让研究人员专注研究本身。目前相关论文、代码与模型已公开发布，论文链接：https://arxiv.org/pdf/2504.00824；项目网站：https://tiger-ai-lab.github.io/ScholarCopilot/；演示视频：https://www.youtube.com/watch?v=QlY7S52sWDA。

# AI快讯

文章版权归作者所有，未经允许请勿转载。