DeepSeek开源第四弹：并行优化策略3项齐开

更新时间：2025-02-27 23:00:15 发布时间：3小时前浏览：606 评论：0

收藏

分享

2月27日消息，DeepSeek开源周第四日，DeepSeek开源了并行优化策略（Optimized Parallelism Strategies），一次开源了3项：

DualPipe：一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法

EPLB：一个针对V3/R1的专家并行负载均衡工具

Profile-data：训练和推理框架的分析数据

GitHub地址：

deepseek-ai/DualPipe

deepseek-ai/eplb

deepseek-ai/profile-data

一、DualPipe

DualPipe是DeepSeek-V3技术报告中提出的一种创新双向流水线并行算法。

它能够实现前向与后向计算和通信阶段的完全重叠，同时有效减少流水线气泡（空闲时间）。

DeepSeek展示了在8个流水线并行阶段和20个micro-batches情况下，DualPipe在两个方向上的调度示例。（来自DeepSeek-V3技术报告）

反向方向的微批次与前向方向对称，为了简化图示，这里省略了反向方向的批次 ID。图中由同一个黑色边框包围的两个单元格具有相互重叠的计算和通信。

流水线气泡与内存使用比较

表中，F代表前向块（forward chunk）的执行时间，B代表完整后向块（full backward chunk）的执行时间，W代表权重后向（backward for weights）块的执行时间，而F&B则表示同时执行且相互重叠的前向和后向块的执行时间。

DualPipe显著减少了管道气泡（空闲时间），表现出效率优势。

二、专家并行负载均衡器（EPLB）

在使用专家并行（EP）时，不同的专家模块会被分配到不同的GPU上。由于各个专家的计算负载会随当前任务而变化，因此保持各GPU间负载均衡至关重要。

如DeepSeek-V3论文所述，研究人员采用了冗余专家（redundant experts）策略，对高负载专家进行复制。

为了便于复制和部署，DeepSeek团队在eplb.py中开源了部署的EP负载平衡算法。该算法根据估计的专家负载计算平衡的专家复制和放置计划。

请注意，专家负载的具体预测方法不在此代码库的讨论范围内，一种常用的方法是采用历史统计数据的滑动平均值。

算法

负载平衡算法附带了两种用于不同情况的策略。

分层负载平衡（Hierarchical Load Balancing）

当服务器节点的数量除以专家组的数量时，使用分层负载平衡策略来利用组受限的专家路由。首先将专家组平均打包到节点上，确保不同节点的负载平衡。然后，在每个节点内复制专家。最后，将复制的专家打包到单独的GPU上，以确保不同的GPU负载平衡。分层负载平衡策略可以在预填充阶段使用较小的专家并行规模。

全局负载平衡（Global Load Balancing）

在其他情况下，使用全局负载平衡策略，该策略在全局范围内复制专家，而不管专家组如何，并将复制的专家打包到单个GPU中。该策略可以在具有较大专家并行规模的解码阶段采用。

三、DeepSeek基础设施中的数据分析：Profile-data

DeepSeek公开分享来自训练和推理框架的性能剖析数据，旨在帮助社区更深入地理解通信与计算重叠策略以及相关底层实现细节。

这些剖析数据是通过PyTorch Profiler工具获取的。

开发者可以下载后在Chrome浏览器中访问chrome://tracing（或在Edge浏览器中访问edge://tracing）直接进行可视化查看。

需要说明的是，为了便于剖析，研究人员模拟了一个完全均衡的MoE路由策略。

同时，DeepSeek还公开了这些数据的训练和推理过程。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: DeepSeek开源第四弹：并行优化策略3项齐开

本文链接: http://szsmele.com/news/show-148601.html (转载时请保留)

0 条

小米最强影像旗舰：小米15 Ultra发布，6499元起售

科技测试账号勿联 ⋅ 2阅读量 ⋅ 0评论 ⋅ 19分钟前

2025-02-27
52.99 万元起小米 SU7 Ultra 正式发布：目标成为地表最快的四门量产车

科技测试账号勿联 ⋅ 16阅读量 ⋅ 0评论 ⋅ 19分钟前

2025-02-27
1.98秒破百！小米 SU7 Ultra正式发布售价52.99万元

科技测试账号勿联 ⋅ 3阅读量 ⋅ 0评论 ⋅ 19分钟前

2025-02-27
雷军：2025年1月，小米手机市场份额位居中国第二

科技测试账号勿联 ⋅ 13阅读量 ⋅ 0评论 ⋅ 19分钟前

2025-02-27
网友分享罕见“火焰瀑布”：火流直下九天全年仅二月末可见

科技 oem580 ⋅ 272阅读量 ⋅ 0评论 ⋅ 33分钟前

2025-02-27
1299元起！小米Buds 5 Pro发布：首发Wi

科技 slfgz ⋅ 4阅读量 ⋅ 0评论 ⋅ 45分钟前

2025-02-27
254元！小米智能音箱Pro发布：首个“超级小爱”智能音箱

科技 fjdingsheng88 ⋅ 2阅读量 ⋅ 0评论 ⋅ 45分钟前

2025-02-27
久洗不发黄！米家洗烘套装Pro蓝氧洗热泵烘发布：5199.2元

科技 charmingcoating ⋅ 13阅读量 ⋅ 0评论 ⋅ 45分钟前

2025-02-27
999元小米15 Ultra专业影像套装发布：2000mAh电池可反充手机



科技 bxbldhg03 ⋅ 3阅读量 ⋅ 0评论 ⋅ 45分钟前

2025-02-27
小米Buds 5 Pro音质抢先试听！第一次让TWS耳机的声音有了画面感



科技 alvinling88 ⋅ 14阅读量 ⋅ 0评论 ⋅ 45分钟前

2025-02-27

测试账号勿联

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1