分布式机器学习数据与模型聚合

姓名：姬文浩学号：22011210610 学院：通信工程学院

一、概述

聚合也是分布式机器学习特有的逻辑，因为分布式机器学习的方法五花八门，所以聚合本身的逻辑也多种多样。不同的分布式机器学习算法，聚合的内容和执行主体不尽相同。从聚合的内容来看，有些算法聚合的是模型（例如在数据并行的模式下），而有些算法聚合的是数据（例如在模型并行或者某些基于数据交换的分布式学习模式下）。从聚合执行的主体来看，有时是由全局服务器来完成的，有时则是由各个工作节点自己来完成的。在由全局服务器来完成聚合的情况下，有些算法聚合的对象是全部工作节点的信息，而有些算法则为了更加快捷和鲁棒只聚合部分工作节点的信息。

有效的聚合往往会带来更好的加速效果。通常我们对聚合方法有以下需求：1.聚合本身的时间代价比较少，这样给整个学习流程带来的额外负担较小；2.聚合算法合理、有效，整体的收敛性仍然能保持与单机算法大体-致。

二、基于模型加和的聚合方法

2.1 基于全部模型加和的聚合

最常用的模型聚合方法就是在参数与服务器段将来自不同工作节点的模型或者模型更新进行加权求和。

模型平均(MA)是一种非常简单的模型聚合方法"，这种方法在收到所有工作节点的模型之后，将这些模型的参数进行平均，得到新的全局模型。BMUFE 方法在MA的基础上加人了冲量概念，每次从各个工作节点得到更新的模型以后，首先计算出平均参数，再用中量更新的模式对其进行调整。最终的更新既包含当前迭代块中产生的总体模型修改(团w)，也包含前面更新积累的冲量。BMUF的目的是保持单机算法中冲量的作用，使每次梯度更新能够在整个优化过程中起作用，使更新的总体方向更加平稳、快速。ADMM方法则是通过解一个全局一致性的优化问题，把来自所有工作节点的模型聚合成为一个全局模型。

同步随机梯度下降法(SSGD) 将参数的平均换成了梯度的平均。K机并行的同步随机梯度下降法在逻辑上等价于小批量扩大K倍的单机随机梯度下降法。小批量的大小对随机梯度下降法的优化过程有很大影响，因此，在实践中，需要调整同步随机梯度下降法的学习率来抵消小批量大小的变化。

弹性平均随机梯度下降法(EASCD)对模型平均的结果做了进一步处理，从而保持各个工作节点的多样性。具体而言，EASGD引入了所谓的弹性机制，将工作节点的模型平均值与当前服务器端的参数再进行一次线性的加和。从某种意义上讲，弹性平均在当的全局根型和工作市点的最重之间建行权量。一方面探索新模型，另一方面保留一定的历史状态。

一方面保留一定的历史状态。以上这些方法的共同特点是采用（或者部分采用）了加和形式的聚合方式，这些加和方法运算复杂度低。逻辑简单，不会对整个分布式训练过程带来过多的额外压力。

2.2 基于部分模型加和的聚合

上一小节提到的聚合方法都是将所有节点的模型聚合到处。当这类方法以同步并行的机制运行时，少量速度慢的机器可能会拖累甚至阻塞整个系统的学习进度。为了解决这个问题，研究人员提出了基于部分模型加和的聚合方法。-一个极端的例子是采用异步通信，每次全局模型仅需要与一个工作节点的训练结果进行聚合。除此之外，本小节再介绍三种方法；带备份节点的同步随机梯度下降法、异步ADMM算法以及去中心化方法。对于带备份节点的同步随机梯度下降法和异步ADMM算法，在同步并行过程中，只要有足够多的工作节点完成了计算任务，就将这部分的数据或模型聚合起来，实现分布式机器学习的一-次信息整合。而去中心化方法仅需与其连接的邻居节点通信，便可完成聚合。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,324评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,356评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,328评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,147评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,160评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,115评论 1赞 296
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,025评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,867评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,307评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,528评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,688评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,409评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,001评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,657评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,811评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,685评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,573评论 2赞 353

分布式机器学习数据与模型聚合

一、概述

二、基于模型加和的聚合方法

2.1 基于全部模型加和的聚合

2.2 基于部分模型加和的聚合

推荐阅读更多精彩内容