近日,微众银行联邦学习 FATE 开源社区迎来了两位新贡献者——来自腾讯的刘洋及秦姝琦,作为云计算安全领域的专家,两位为 FATE 构造了新的功能点,并在 Github 上提交修复了相关漏洞。( Github 项目地址: https://github.com/FederatedAI/FATE
)从 FATE 的面世,到贡献者激励制度的推出,参与开源社区建设的数据安全行业从业者不断踊现,FATE 在业内的关注度、价值认可度逐步提升,联邦学习生态正进一步深化及拓展。
AI 时代数据安全问题严峻,联邦学习是必经解决路径
人工智能的发展与普及不断改变着人们的生活方式,但 AI 的实现离不开海量数据源的支撑。自大数据上升为国家战略后,其产业和应用得到了快速发展,但是在数据丰富程度、数据质量、数据共享、大数据平台安全和大数据产业生态等领域上,这一行业仍有许多亟待解决的问题。
作为一种基于多方安全计算的分布式机器学习技术,联邦学习能让参与各方可以在不披露底层数据和底层数据的加密(混淆)形态的前提下共建模型,在行业应用中帮助不同机构打破隔阂,进行 AI 协作,同时各方的数据都不出本地,让用户隐私得到保护。这样一种共赢的机器学习方式,让联邦学习成为了 AI 时代大数据安全及隐私保护的必备技术。
FATE ( Federated AI Technology Enabler )是全球首个联邦学习工业级开源框架,由微众银行 AI 团队推出,从 GitHub 开源,到贡献者激励机制的发布,微众银行 AI 团队期望拥抱所有从业者,以开放的姿态,共建联邦学习生态。(官网地址: https://www.fedai.org.cn/cn/)
FATE 直击业界痛点,搭建数据安全多方合作桥梁
新晋贡献者中,秦姝琦来自于腾讯神盾沙箱,在采访中她提到,目前行业面临着许多痛点,如为了牟取利益,部分手机 APP“越权”获取用户信息,衍生出规模庞大的黑灰产业链。甚至还有黑灰产组织对热门 app 进行反编译,修改源码后经伪装重新投放到应用市场来获取数据和利益。
除此以外,数据的确权也是一个难点。非法采集到的数据最后会就会成为黑产市场上的商品。而在数据流通这里,即使是合法授权给第三方使用数据,也无法保证第三方不会私下拷贝滥用数据。
而其团队研究构建的神盾沙箱,在结合 FATE 计算框架后,则可以解决数据流通中的隐私安全问题,同时为大数据产品和 AI 产品的结合提供隐私安全的解决方案。使得 APP 厂商减少对用户数据需求量同时也能获得更庞大、标注质量更好的数据集。
秦姝琦表示,联邦学习是应对大数据新时代下新问题的新解决方案,在数据安全多方合作领域,联邦学习 FATE 结合神盾沙箱的应用,可以通过技术手段使得数据流通合法合规,从而打破“信息孤岛”现状。
发力开源生态,推动数据安全从业者共建 FATE
据悉,腾讯神盾沙箱目前的核心计算模块由 FATE 提供,神盾沙箱项目团队在使用 FATE 框架、算法的过程中碰到的不足会主动寻求方法改进,并将其贡献到 FATE 开源项目中,这种合作形式同时促进了神盾沙箱的产品打磨和 FATE 项目的完善。
随着更多的人加入联邦生态,互相推动着打磨产品的进步,这种正循环将会使更多的人受益。一个有活力的开源生态离不开贡献,以及成员间的彼此的促进。
目前,FATE 开源社区激励制度已全面上线,参与建设的贡献者将获得官方证书与相应激励。作为联邦学习全球首个工业级开源社区,FATE 在 Github 上线仅数月,Star 数便突破 700,从知名高校香港科技大学学子敬清贺,到知名科技企业腾讯刘洋、秦姝琦纷纷参与贡献,无不表明 FATE 对数据安全强大的解决能力。最近腾讯云盾沙箱与 FATE 开展的进一步合作,更是彰显了 FATE 的可靠性与适配能力,FATE 正走向更开阔的行业领域。
联邦学习促进人工智能领域的开放协同,提升人工智能数据流通性,推动多组织机构高度协同合作,促进人工智能产业安全健康发展及赋能各个应用领域。在此背景下,无论是 FATE 的开源,还是腾讯云参与贡献,我们都可以窥见联邦学习生态的蓬勃发展。未来将会有更多产业领域受益,中国数据安全也将迈向新的台阶。