随着数据安全法的出台,数据隐私越来越受到重视,分布式隐私模型也变得越来越流行。

近期,在由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT 2022深度学习开发者峰会上,百度超级链技术负责人荆博重点介绍了如何使用链桨 PaddleDTX 打造基于区块链的分布式机器学习网络。

链桨PaddleDTX是百度超级链与飞桨联合推出的首款产业级可信分布式AI 开源产品,致力于促进分布式隐私模型技术的发展。链桨基于百度自主研发的XuperChain、去中心化存储、可信计算、分布式机器学习等核心技术,实现从数据采集、存储、计算到流通全流程的安全可信,保证分布式 AI 的训练过程全程可追溯、可审计。

链桨PaddleDTX是如何实现分布式机器学习网络全流程可信的呢?

数据层面,链桨使用去中心化存储来作为可信数据解决方案。首先,为每一份数据分别定制多副本、多节点策略,以结合加密分片副本保持证明,链桨拥有两种原创的存储保持证明机制,分别是时间优先的变种梅克尔树算法和空间优先的基于椭圆曲线双线性映射的副本保持证明算法,使其可以保障数据无篡改且存储方无法串谋单副本攻击,从而保证数据的真实性;其次,链桨根据副本保持证明挑战成功比例,与有效心跳频率对存储节点健康度进行评估,并根据节点健康度自动迁移数据,同时根据节点稳定性、历史表现与可用资源综合判断,动态调整分发策略。

算法层面,链桨通过在预测和训练过程中结合使用KMS+TEE,来确保数据隐私及模型的公正可审计。在非 TEE 环境中,我们部署 KMS 的公钥部分,并使用变种 ECDH 对数据进行加密,加密数据在 TEE 环境中的另一部分 KMS 完成解密,并传递给计算逻辑程序,最终产生计算结果与对应的度量报告,并将报告存储于区块链网络,区块链网络会通过调用去中心化预言机网络来核实计算环境的真实性,从而保证算法的可信。

最后,链桨使用DID 分布式可信数字身份来作为可信算力的解决方案。DID 是基于区块链技术的分布式数字身份,具有可验证性、自我主权等特征。链桨框架正在集成百度DID,从而支持用户通过 DID 对隐私数据进行自主控制,对可信算力进行自主验证,从而实现数据的存储安全可验证、共享可追溯、算力使用可管控等目标。

数据、算法、算力是人工智能的三大要素。基于区块链技术构建的分布式机器学习网络为可信数据、可信算法和可信算力提供基础设施保障,目前这一方案已运用到多个金融机构、工业互联网平台的建设之中,硕果颇丰。未来,链桨PaddleDTX将继续赋能产业,推动区块链+AI走向规模化应用,全面助力实体经济发展。

07bc5f5c2e694cbd12f7d796ea1e34df.png

百度超级链

+

微信号|XuperChain-Help01

新浪微博|百度超级链XUPER

Logo

XuperCore是百度超级链XuperChain内核技术,也是开放原子开源基金会首个开源项目,拥有623篇核心技术专利,致力于创建“更快、更通用、更好用” 的区块链底层技术。

更多推荐