开源“王炸”DeepEP是啥？DeepSeek这么回答→

新湖南 • 动态

2025-02-26 21:35:44

文字/视频湖南日报全媒体记者王铭俊

2月25日，DeepSeek宣布开源全球首个面向MoE模型的全栈通信库DeepEP，这一举措立即在业界引发强烈反响，也被称为DeepSeek再次扔出的一枚“王炸”。

什么是DeepEP，它有什么用？

请看DeepSeek给出的解答————

‌DeepEP是DeepSeek开源的一款专为AI大模型设计的通信优化工具，相当于给AI训练装上了“智能交通系统”。它的核心任务是解决大模型训练时‌GPU之间的数据传输拥堵问题‌，特别是针对需要调动多个专家模块协作的MoE（混合专家）模型。

‌DeepEP有三大核心技术亮点。

‌NVLink高速通道优化：‌同一服务器内的GPU通信效率提升3倍，就像把双向四车道拓宽成十车道，数据传输速度可达每秒158GB。

RDMA远程直达传输‌：跨服务器通信时，数据像“特快专递”一样直达目标内存，避免传统传输的绕路延迟，单网卡传输速度达47GB/秒。

‌FP8智能压缩技术‌：将数据压缩成更小体积传输，类似把大卡车换成小包裹，到达后自动恢复原样，既省带宽又保精度。

‌DeepEP的实际应用价值体现在——

‌训练提速40%‌：千亿参数大模型训练时，通信效率提升大幅缩短等待时间。

‌推理响应快5倍‌：推理解码阶段延迟低至163微秒，比人类眨眼还快。

‌算力成本降低60%‌：通过优化资源利用率，让开发者用更少GPU训练更大模型。

总体而言，DeepEP通过优化底层通信效率，让MoE模型的训练门槛大幅降低，被业界称为‌“AI算力焦虑的终结者”‌‌。它不仅推动了大模型技术的平民化，也让普通用户能更快享受到AI服务升级。

作者：王铭俊

责编：李传新

一审：王铭俊

二审：杨丹

三审：杨又华

来源：湖南日报

版权作品，未经授权严禁转载。湖湘情怀，党媒立场，登录华声在线官网www.voc.com.cn或“新湖南”客户端，领先一步获取权威资讯。转载须注明来源、原标题、著作者名，不得变更核心内容。

打开新湖南APP，查看全部评论