GIDD模型：实现语言建模自我纠错与计算效率新突破

AI快讯7个月前发布 niko

创新扩散模型引领语言建模变革

在自然语言处理领域，新型广义插值离散扩散（GIDD）模型崭露头角。与传统模型不同，GIDD无需强化学习等后训练，就能在语言建模中实现自我纠错，达到计算效率匹配的最优性能。

解决自回归模型固有难题

自回归模型在自然语言处理中存在计算成本高、长程依赖与连贯性问题。去噪扩散模型虽提供了新途径，但自然语言处理上效果不佳。掩码扩散技术有根本性局限，而GIDD将掩码扩散推广，解决了诸多问题。

GIDD的独特技术原理

GIDD核心由混合率αt和混合分布πt组成，定义了信噪比和噪声目标分布。研究人员推导了其前向、反向过程及证据下界（ELBO），还提出了采样和自校正步骤。

混合策略与训练目标优化

为结合掩码与均匀噪声，设计了混合策略。训练目标上，针对ELBO权重问题，提出权重裁剪和动态权重调整方案，提升训练效果。

实验验证显著优势

实验表明，GIDD样本质量最高提升55%，能纠正语法等错误。下游任务性能测试中，GIDD+表现出色，虽均匀噪声训练模型有差距，但随着规模增加差距可能缩小。尽管实验有局限，但GIDD前景值得期待。

文章版权归作者所有，未经允许请勿转载。