前言
随着近些年各个国家对数据的监管与使用越来越严格,以及对个人信息数据、科学数据、医疗数据等多种数据的保护,从而加剧了数据孤岛现象的出现,导致企业之间的数据合作、交换过程中,对数据共享的安全性和使用合理性提出了更高的要求。
联邦学习概念
联邦机器学习是一种特殊的分布式学习,又称联邦学习,联合学习,联盟学习,是2016年由Google率先提出,在满足用户隐私安全、数据安全和政府法规的要求下使用数据进行建模,进而解决数据孤岛问题。
联邦学习分类
考虑到在工业中的应用,联邦学习主要分为横向联邦学习、纵向联邦学习和联邦迁移学习。
横向联邦学习特点:数据的特征维度相同,通过联邦学习聚合更多的数据样本,解决单边建模数据量不足的问题。
纵向联邦学习特点:数据样本的ID是一致的,数据的特征不同,使用联邦学习丰富样本的特征,从而更精准的刻画样本。
联邦迁移学习特点:数据样本特征和数量都较少,使用联邦学习将所有样本和特征空间进行联合建模。
联邦学习中保护隐私和安全的方法
1、 同态加密Homomorphic Encryption (HE)
对密文进行特定形式的代数运算得到仍然是加密的结果,将其解密后所得到的结果与对明文进行同样的运算结果一致。
2、 多方安全计算Secure Multiparty Computation (MPC)
解决一组互不信任的参与者之间保护隐私的协同计算问题,并确保输入的独立性,计算的正确性,同时不泄露各输入值给参与计算的其他成员。
3、 姚式混淆电路Yao' s Garbled Circuit
4、 差分隐私Differential Privacy(DP)
通过引入随机机制来抵御差分攻击,以达到保护隐私的目的。
联邦学习开源框架
1、 FATE(Federated AI Technology Enabler)框架
2、 FFL(Tensorflow Federated Framework)框架
免责声明:我们致力于快乐与技术的分享,旨在快乐与技术并存,只限于在法律范围内合理学习使用。本公众号旨在分享更多知识,不构成任何投资建议或非法用途,本人只代表作者个人观点。本文章教程只限于学习,不得用于任何非法活动,我们不承担任何责任,请悉知!
如果想要获取更多资源以及技术请加入我们(qq群、微信群以及公众号二维码):