腾讯科技(深圳)有限公司于天眼查App公布一项名为“大语言模型的训练方法、装置、计算机设备及存储介质”的专利。此专利聚焦大语言模型训练,致力于以创新方式强化模型学习能力与准确性。
传统大语言模型训练多依赖单一文本摘要,易引发过拟合问题,影响生成内容的准确性与多样性。腾讯的新训练方法别出心裁,引入了信息量不同的第一摘要文本和第二摘要文本。其中,第一摘要文本涵盖正确与错误语句,为对比学习奠定基础。

借助这种对比学习方式,模型能在同一文本的不同摘要间学习。通过辨别第一摘要文本里的正误语句,成功规避因摘要单一导致的学习误差。这一创新举措不仅增强了模型的泛化能力,使其在面对未知数据时游刃有余,还提高了准确性,降低错误内容生成概率。
伴随人工智能技术发展,大语言模型在自然语言处理、智能客服、内容创作等多领域展现巨大潜力。腾讯此项专利的公布,是大语言模型训练领域的一次技术突破,有望为后续研究与应用指引新方向。
展望未来,该技术的持续发展将推动智能化应用进步,助力各行业在数字化转型中更好运用人工智能带来的便利。
© 版权声明
文章版权归作者所有,未经允许请勿转载。