技术百科
技术百科是零数科技基于公司技术研发、产品体系,重磅推出的技术解读专题,与行业从业者及生态客户分享零数科技最新技术探索、产品动态,共同探讨区块链及隐私计算技术的应用情况和潜力落脚点。
01
数据要素市场安全按下加速键
3月10日,十四届全国人大一次会议表决通过了关于国务院机构改革方案的决定。方案提出组建国家数据局,负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用,统筹推进数字中国、数字经济、数字社会规划和建设等,由国家发展和改革委员会管理。
国家数据局正式获批成立,和此前正式发布的《数字中国建设整体布局规划》、《关于构建数据基础制度更好发挥数据要素作用的意见》一脉相承,成为我国数字经济发展史上的里程碑时刻,标志着我国数据要素市场化配置从地方政府和市场主体自主探索的阶段,正式迈向了以国家体制机制创新和顶层设计为引领,政府、市场和社会全面整合式推进数据要素市场化配置,加速数字经济发展和数字中国建设的新阶段。
由此可见,数据在这个时代的价值不断攀升,可谓是数字化时代运转的引擎。当前,我国数据市场规模持续扩大,但数据要素市场交易机制等配套措施仍不完善,数据的标准化、资产化和商品化体系尚未建立,迫切需要加快数据基础制度规范建设,破除阻碍数据要素供给、流通、使用的体制机制障碍。与此同时,如何保障数据安全,关系到民众隐私和社会稳定,是当前数字经济健康发展的重要挑战。
隐私计算技术是解决当前“数据可用不可见”的最优解,在数据安全流通、数据价值释放过程中发挥着不可替代的作用。从技术角度看,它既实现了数据价值的流通与共享,又实现了数据的隐私保护;从法律角度看,则最大程度的提升了数据合规性。为推动实现数据要素安全流通,促进数据价值释放,零数科技2022年正式推出了零数隐私计算平台,上线以来获得了市场的广泛认可。
02
零数隐私计算平台介绍
零数隐私计算平台,通过多方安全计算、联邦学习、区块链等技术,打造数据安全基础设施及高效流通的产品体系,解决多方数据协同合作过程中的数据安全与隐私保护问题,为企业提供一站式数据可用不可见的解决方案。
平台将隐私计算结合区块链技术应用到数据流通全流程各环节当中,实现全程闭环的数据安全和隐私服务,操作和处理记录可上链保存、不可被篡改,在链上用智能合约来实现计算过程中的协作管理功能,实现覆盖数据全生命周期的隐私安全管理。
并且通过平台的安全开放sAPI和SDK组件,可帮助用户与合作伙伴轻松接入;数据经授权后方可进行安全计算,最小化利用,数据调用可追溯审计;图形化界面,操作便捷,使用门槛低,简单高效地完成建模、统计、服务部署任务。此外,平台具备私有化一键部署能力,为用户提供可视化数据分析、数据查询、联合建模等操作,可覆盖金融联合风控、政务数据开放、互联网广告营销等多种业务场景,同时将服务功能模块和机器学习算子进行组件化,用户可结合业务需求进行轻量便捷部署,提升了产品应用的灵活性与便利性,助力企业高效释放数据资产价值,共创数据共享互利生态。
据了解,平台的搭建基于同态加密(HE)、混淆电路(GC)、不经意传输(OT)、秘密分享(SS)的MPC原语协议以及隐私求交(PSI)、隐私信息检索(PIR)等安全协议,计算过程各方数据独立输入,并保证除计算结果及其可推导出的信息之外,其过程不泄漏各方隐私数据,最终保障协议的公平性和安全性。
除此之外,零数隐私计算平台以联邦学习(FL)、安全多方计算(MPC)等隐私数据保护技术为基础,针对机器学习算法进行定制化的隐私保护改造,保证原始数据不出本地即可完成联合建模,同时支持安全多方 PSI(隐私保护集合求交技术)、安全隐私查询、安全统计分析。通过零数隐私计算,各合作机构既能保障数据安全,又能发挥数据最大价值,很好地解决了业界数据孤岛的难题。
03
零数隐私计算平台产品能力
零数隐私计算平台融合了密码学、安全硬件、数据科学、人工智能、计算机工程、经济学、数据安全法等众多领域的跨学科技术体系,包含了多方安全计算、联邦学习、可信执行环境等不同的代表性隐私计算技术。其中典型的技术路线包括:多方安全计算、联邦学习、可信执行环境。
多方安全计算:是多个参与方基于密码学技术共同计算一个目标函数,保证每一方仅获取自己的计算结果, 无法通过计算过程中的交互数据推测出其他任意一方的输入和输出数据的技术。
联邦学习:可以实现在本地数据不出库的情况下,通过对中间加密数据的处理来完成多方对共享模型的机 器学习训练;通常情况下,联邦学习需与其它隐私保护计算技术联合使用,才可在计算过程中实现数据保护。
可信执行环境:是将软硬件方法构建的安全区域与其他应用和操作系统隔离开,使得操作系统和其他应用 无法访问或更改该安全区域中的代码和数据,从而达到保护敏感数据和代码效果的技术;
联邦学习可做到个体的自有数据不出本地,联邦系统通过加密机制下的参数交换方式,在不违反数据隐私 保护法规的情况下,建立一个虚拟的共有模型。建立虚拟模型时,数据本身不移动,也不会泄露用户隐私 或影响数据规范,充分保障了个体隐私信息及数据安全。在联邦学习中,用户的隐私与安全是重中之重。为了保护用户隐私,防止联邦学习应用被恶意方攻击,多方安全计算技术可以在联邦学习中被应用,成为 联邦学习技术框架中的一部分。
可信任执行环境是一种具有运算和储存功能,并且能提供安全性和完整性保护的独立处理环境。在该环境 内的程序和数据,能够得到比操作系统层面更高级别的安全保护。其实现原理是通过软硬件方法, 在中央 处理器中,构建出一个安全区域,计算过程执行代码 T A 仅在安全区域分界中执行,外部攻击者无法通过 常规手段获取和影响安全区的执行代码和逻辑,以此来实现敏感数据的隐私计算。
零数隐私计算产品支持机器学习建模、数据加工与策略开发两个核心需求方向。基于机器学习构建联合建模组件库,联合建模过程使用的特征工程、数据预处理、模型训练算法、模型评 估等组件,包括数据融合、数据预处理、特征工程、回归算法、分类算法、聚类算法、降维算法、模型报告等。
基于数据加工与策略开发构建联合计算算子库,实现四则运算、逻辑运算、统计计算等不同的计算能力算 子,满足联合统计、数据加工、策略开发等需求;目前这部分产品功能还未支持,处于预研阶段。另外还支持基于特定场景的隐匿查询、安全匹配等能力。
04
零数隐私计算平台架构
零数隐私计算平台在零数科技完整的产品体系中,属于中后端产品,产品研发的目标是打破数据孤岛,实现数据价值的充分流动,同时通过可视化效果呈现给用户,便于用户实际应用上线发布。
(1)隐私计算引擎系统:零数隐私计算底层系统支持联邦学习、多方安全计算等引擎。基于联邦学习构建联邦建模组件库,联合建模过程使用的数据预处理、机器学习算法等组件,包括数据融合、数据预处理、特征工程、线性回归、逻辑回归、XGBoost、K-Means、模型报告等;基于多方安全计算构建联合计算算子库,实现四则运算、逻辑运算、统计计算等不同的计算能力算子,满足复杂模型、联合安全统计等能力过程;另外还支持基于特定场景的隐匿查询、安全匹配等能力。
(2)隐私计算管理:隐私计算管理提供可视化隐私计算服务管理能力,为客户提供简单易用、成熟可扩展、安全可靠的产品能力,如:
a)项目管理:按照隐私计算引擎能力,提供创建、管理隐私计算任务的功能,并提供高度灵活的可视化拖拉拽式任务流程配置管理模块,降低用户使用成本,如:组件式拖拉拽的建模流程;
b)调度管理:对配置的任务在执行过程提供调度与监控能力,如:任务参与方调度、任务队列调度、计算资源调度、调度监控、调度统计等;
c)服务管理:对配置任务发布的API服务进行管理,包括服务发布服务管理、服务授权、服务使用统计等。
(3)数据管理:隐私计算过程使用数据提供管理能力,包括:数据添加、数据发布、数据合作、数据授权使用、数据鉴权、使用统计等能力。
(4)平台管理:提供隐私计算平台管理能力,包括:
a)系统管理:管理、权限管理、日志管理、通知管理等;
b)安全监控:密钥管理、存证管理、审计管理、监管管理、预警管理等;
c)报表管理:运营报表、平台驾驶舱等。
05
零数隐私计算平台的落地与应用
目前,隐私计算在金融、通信、政务、互联网、医疗等行业中的应用广泛。通过调研分析,隐私计算的应用主要覆盖两类场景:第一类中,传统信息安全技术已被普遍应用,但仍存在安全风险,隐私计算的应用可以进一步提升安全性,称为隐私计算存量优化应用场景;第二类中,传统信息安全技术无法满足应用需求,隐私计算则提供了新的机会,拓展了数据安全流通的应用场景,称为隐私计算增量创新应用场景。以下是零数科技在隐私计算领域的案例展示:
基于零数隐私计算平台的信贷预警管理平台
金融信贷业务中往往受限于数据不够丰富,在数据可解释性及稳定性、风控模型效果、风险策略等层面面临诸多挑战。因此造成了信息不对称,出现“惜贷、惧贷、恐贷”现象。借助多方安全计算和联邦学习技术,可以在保护用户信息不泄露的前提下,通过查询黑名单或建立联合风控模型,将来自支付应用的消费数据、交通出行数据等更多维度纳入联合风控模型中,从而构建更精准大数据风控模型从贷前、贷中、贷后查询或测算借款自然人的表现。
在贷前,通过隐匿查询技术,查询金融机构和征信机构的黑名单,是否包含待借贷用户;也可采用联邦学习,基于金融机构中用户贷款数据、存款数据、转账数据等,银联机构的银行卡支付数据以及电商平台中用户的交易数据等进行建模,从而判断用户是否违约,为是否借贷给用户提供决策依据。在贷中,联合运营商数据,通过有监督多分类模型,得到模型结果,从而预测用户的信用评级,判断贷款表现。在贷后,对金融机构中的用户借贷金额、时间等和电商的交易数据以及银联银行卡支付数据进行建模,通过有监督二分类模型,得到还款能力结果。
该信贷预警管理平台可以实现双方/多方数据不出域前提下进行隐匿查询或联合建模,提升模型效果;模型支持一键式部署,且对模型严格加密,避免策略泄露;为金融机构提供了从用户贷前、贷中、贷后全方位的风控方案,提前做好风险应对方案,减少应急成本或管理成本,实现降本增效。
此外,为推进数据要素有序化规范化发展,零数科技依托自身区块链及隐私计算专业优势,参与制定了40项国际、国家、团体标准,其中隐私计算与数据流通相关的标准、白皮书、报告有十余项,如隐私计算联盟主导的《隐私计算金融场景标准》、《隐私计算互联网场景标准》,《隐私计算高等教育》等。在行业内得到广泛点赞和高度认可。
当前,国际形势动荡,中美关系紧张,当务之急是提升自身实力,数据作为当下最重要的软实力,需要重点被保护起来,中国正在全力保护我国个人、企业、国家的信息数据安全。零数科技作为有责任有担当的企业,正在积极响应国家的号召,持续提升公司在隐私计算方面的投入研究,加速推进产品商业化落地,为中国在信息数据安全保护方面做出有力贡献。