腾讯大语言模型训练方法专利：创新对比学习提升性能

AI快讯1年前 (2025)发布 niko

腾讯科技（深圳）有限公司于天眼查App公布一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。此专利聚焦大语言模型训练，致力于以创新方式强化模型学习能力与准确性。

传统大语言模型训练多依赖单一文本摘要，易引发过拟合问题，影响生成内容的准确性与多样性。腾讯的新训练方法别出心裁，引入了信息量不同的第一摘要文本和第二摘要文本。其中，第一摘要文本涵盖正确与错误语句，为对比学习奠定基础。

借助这种对比学习方式，模型能在同一文本的不同摘要间学习。通过辨别第一摘要文本里的正误语句，成功规避因摘要单一导致的学习误差。这一创新举措不仅增强了模型的泛化能力，使其在面对未知数据时游刃有余，还提高了准确性，降低错误内容生成概率。

伴随人工智能技术发展，大语言模型在自然语言处理、智能客服、内容创作等多领域展现巨大潜力。腾讯此项专利的公布，是大语言模型训练领域的一次技术突破，有望为后续研究与应用指引新方向。

展望未来，该技术的持续发展将推动智能化应用进步，助力各行业在数字化转型中更好运用人工智能带来的便利。

文章版权归作者所有，未经允许请勿转载。