DeepSeek开源多项技术助力大模型训练

AI快讯1年前 (2025)发布 niko

今日，国内AI领域的领军企业DeepSeek，正式公布了其开源计划第四日的成果——Optimized ParallelismStrategies。这一成果聚焦于大规模语言模型训练的核心痛点，为超万卡级集群的高效运作带来了全新思路。

DualPipe：双向管道并行算法的创新突破

DualPipe作为此次升级的关键技术，是专门针对V3/R1架构设计的双向管道并行算法。它借助创新的双向数据流管道，达成了计算与通信的高度融合。与传统单向流水线相比，该技术显著提升了计算吞吐量，在千亿至万亿参数规模的模型训练中表现卓越。据GitHub代码库数据，DualPipe通过智能调度机制，在反向传播阶段同步开展前向计算，有效提高了约30%的硬件利用率。

EPLB：解决专家并行负载不均的利器

在混合专家（MoE）模型训练中，“热点专家”问题一直是困扰业界的难题。EPLB技术的出现，首次实现了专家并行的动态负载平衡。传统方法因任务分配不合理，常导致部分计算卡负荷过重，而EPLB通过实时监控与自适应分配，将万卡级集群的整体利用率提升至92%以上，避免了资源的浪费。

计算-通信重叠优化：提升训练效率的关键一步

DeepSeek基于V3/R1架构的通信重叠分析工具，首次构建了3D并行（数据/流水线/张量并行）的时空效率模型。借助开源的分析数据集，开发者能够精准定位计算与通信的冲突节点，为超大规模模型训练提供了调优依据。经测试，这一优化可减少约15%的端到端训练耗时。

行业影响：推动大模型训练变革

此次技术发布在业界引起强烈反响。专家认为，DualPipe与EPLB的创新组合，有效应对了当前大模型训练面临的挑战。某云计算厂商技术负责人表示，这些工具将大幅降低千亿级模型训练的硬件门槛，预计可使训练成本降低20%-30%。DeepSeekCTO称，这些开源策略已在内部多个千亿参数模型训练中得到验证，未来还将持续优化。目前，三项技术均已在GitHub开源，支持开发者在不同硬件环境中进行定制化应用。

在全球AI竞赛进入“规模决胜”的关键阶段，DeepSeek的技术开源行动，彰显了中国AI企业的实力，为行业发展提供了有力支持，有望重塑大模型训练的产业格局。

# AI快讯

文章版权归作者所有，未经允许请勿转载。

DeepSeek开源多项技术 助力大模型训练

DeepSeek开源多项技术助力大模型训练