首页 > 其他 > 详细

Baidu All Reduce

时间:2019-08-22 13:04:28      阅读:77      评论:0      收藏:0      [点我收藏+]

Baidu All Reduce,即Ring All Reduce。Ring All Reduce技术在高性能计算领域很常用,2017年被百度用于深度学习训练。

朴素All Reduce的通信时间随GPU节点数线性增长。Ring All Reduce的通信时间跟GPU节点数无关,只受限于GPU间最慢的连接。 

Ring All Reduce包含两步:scatter reduce和all gather

1)scatter reduce:GPU交换数据,每个GPU得到最后结果的一部分(chunk)

2)all gather:GPU交换chunk,每个GPU得到最后结果

技术分享图片

假设要实现数组间对应元素求和,GPU节点数为N,每个GPU都有一个相同size的数组。

1、每个GPU

技术分享图片

 

Baidu All Reduce

原文:https://www.cnblogs.com/yangwenhuan/p/11391197.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!