DeepSeek推出支持FP8通用矩阵乘法的开源库DeepGEMM

AI快讯12小时前发布 niko
5 0
AiPPT - 一键生成ppt

DeepSeek开源周新成果:DeepGEMM开源库登场中国人工智能企业DeepSeek在其“开源周”第3日,正式发布了一款名为DeepGEMM的开源库,该库支持FP8通用矩阵乘法(GEMM)。此工具针对密集型和混合专家(MoE)矩阵运算进行设计,能有力支撑DeepSeekV3和R1模型的训练与推理工作。官方借助X平台发布这一消息后,在技术社区激起热烈反响。

DeepGEMM的卓越性能与简洁设计 依据DeepSeek官方账号发布的内容,DeepGEMM在NVIDIA HopperGPU上能够达成高达1350+TFLOPS的FP8计算性能。其核心逻辑仅约300行代码,却在多数矩阵尺寸上超越了专家调优的内核,凸显出极高的效率与简洁性。该库无需繁杂依赖,采用即时编译(Just-In-Time)技术,支持密集布局以及两种MoE布局,设计堪称“像教程一样干净”,方便开发者学习和运用。

用户称赞与潜在影响X用户@TechBitDaily评价道:“DeepGEMM的发布是DeepSeek开源周的一大亮点,其FP8性能和简洁设计让人印象深刻。”另一位用户@AIObserverCN指出,该库在支持MoE模型的高效训练方面优势显著,或能推动AI社区在Hopper架构上展开进一步创新。

延续承诺与技术实力展现作为开源周的一部分,DeepGEMM的发布延续了DeepSeek推动AI技术透明化和社区协作的承诺。此前,该公司在开源周首两天已发布了FlashMLA和DeepEP工具,分别聚焦快速语言模型架构和专家并行通信。此次DeepGEMM的亮相,进一步彰显了其在AI基础设施建设上的技术实力。

广泛应用前景与获取途径业内人士表示,这款库不仅会提升DeepSeek自家模型的性能,还为全球开发者提供了一个高效、易用的矩阵运算工具,未来应用前景值得期待。目前,用户可通过GitHub获取DeepGEMM,去挖掘其在AI训练与推理中的潜力。项目地址:https://github.com/deepseek-ai/DeepGEMM

© 版权声明
智谱清言 - 国产最强AI模型