联邦学习 - 简书

前言
随着近些年各个国家对数据的监管与使用越来越严格，以及对个人信息数据、科学数据、医疗数据等多种数据的保护，从而加剧了数据孤岛现象的出现，导致企业之间的数据合作、交换过程中，对数据共享的安全性和使用合理性提出了更高的要求。

联邦学习概念
联邦机器学习是一种特殊的分布式学习，又称联邦学习，联合学习，联盟学习，是2016年由Google率先提出，在满足用户隐私安全、数据安全和政府法规的要求下使用数据进行建模，进而解决数据孤岛问题。

image.png

联邦学习分类
考虑到在工业中的应用，联邦学习主要分为横向联邦学习、纵向联邦学习和联邦迁移学习。
横向联邦学习特点：数据的特征维度相同，通过联邦学习聚合更多的数据样本，解决单边建模数据量不足的问题。

image.png

纵向联邦学习特点：数据样本的ID是一致的，数据的特征不同，使用联邦学习丰富样本的特征，从而更精准的刻画样本。

image.png

联邦迁移学习特点：数据样本特征和数量都较少，使用联邦学习将所有样本和特征空间进行联合建模。

image.png

联邦学习中保护隐私和安全的方法
1、同态加密Homomorphic Encryption (HE)
对密文进行特定形式的代数运算得到仍然是加密的结果，将其解密后所得到的结果与对明文进行同样的运算结果一致。
2、多方安全计算Secure Multiparty Computation (MPC)
解决一组互不信任的参与者之间保护隐私的协同计算问题，并确保输入的独立性，计算的正确性，同时不泄露各输入值给参与计算的其他成员。
3、姚式混淆电路Yao' s Garbled Circuit
4、差分隐私Differential Privacy(DP)
通过引入随机机制来抵御差分攻击，以达到保护隐私的目的。

联邦学习开源框架
1、 FATE（Federated AI Technology Enabler）框架
2、 FFL（Tensorflow Federated Framework）框架

免责声明：我们致力于快乐与技术的分享，旨在快乐与技术并存，只限于在法律范围内合理学习使用。本公众号旨在分享更多知识，不构成任何投资建议或非法用途，本人只代表作者个人观点。本文章教程只限于学习，不得用于任何非法活动，我们不承担任何责任，请悉知！
如果想要获取更多资源以及技术请加入我们（qq群、微信群以及公众号二维码）：

image.png