基于区块链的联邦学习去中心化验证算法研究.pdf
成都信息工程大学硕士学位论文
基于区块链的联邦学习去中心化验证算法研究
摘要
联邦学习是一种面向分布式场景的机器学习范式,旨在利用网络中多参与方
的本地数据对统一的联邦学习全局模型进行分布式训练和迭代。为了有效地保护
数据隐私,参与方彼此之间无需进行数据传输和信息交互,仅需将训练后的模型
参数上传给指定的中心服务器,并由该中心服务器对全局模型进行优化和维护,
实现数据隐私保护下的多方共享计算。
联邦学习中主从架构的通信模式能够有效提高全局模型的训练效率,但这种
通信模式带来的安全性问题也将成为影响全局模型性能的主要因素之一。利用去
中心化的区块链替代传统的主从架构能够显著提高联邦学习的鲁棒性,然而现有
工作中参数合法性验证与数据持久化所产生的巨大通信成本和存储消耗已经成为
亟待解决的问题。针对上述问题,本文设计一种松耦合的去中心化联邦学习框架
(Loosely-coupledDecentralizedFederationLearningframework,LDFL),能够降低存
储开销并提升全局模型的安全性,主要贡献包括:
(1)针对训练者上传的模型参数,提出一种去中心化参数合法性验证机制。每
轮中的评估者和聚合者组成去中心化的验证委员会,对训练者工作进行合法性验
证,并将去中心化验证结果上传至可信的区块链底层。每轮迭代中参与节点的所
属角色由角色轮换机制(RolesRotationStrategy,RRS)进行分配,RRS基于贡献度对
参与节点进行角色轮换确保LDFL中参与节点的流动性。
(2)针对评估者和聚合者的共识决策,提出一种基于贡献度证明(Proof-of-
Contribution,PoC)的委员会共识机制。在验证委员会中,聚合者以异步方式缓解
参数交叉评估进程中的阻塞问题。PoC规定区块生成者的选举基于历史贡献度而
不采用竞争机制,从而有效避免了挖矿过程产生的区块生成延迟。每轮迭代结束
时,验证委员会中的评估者验证来自聚合者生成的区块,以确定其合法性并广播
给网络中的其他节点。
(3)针对参与节点的本地存储消耗,提出一种区块链分区存储策略。该策略使
用一种面向多副本的纠删编码块的平衡分配规则,能够有效降低节点的本地存储
代价。在数据恢复阶段,采用基于柯西矩阵的局部修复编码方法,实现了较高的
数据恢复效率。
(4)针对参与节点对于全局模型的贡献度,提出一种角色自适应奖励算法。该
算法基于节点的工作强度和LDFL所分配的角色,能够激励合法节点更加积极地
进行模型训练并有效地识别出恶意节点。为了保护数据隐私,本文设计一种隐私
兼容的群组夏普利值评估方法,以评估训练者对于全局模型的边际贡献数值。
关键词:联邦学习,区块链,共识机制,存储可扩展性,奖励算法
ii
成都信息工程大学硕士学位论文
ResearchonDecentralizedValidationAlgorithmof
FederatedLearningBasedonBlockchain
ABSTRACT
Federatedlearningisamachinelearningparadigmfordistributedscenarios,aiming
atdistributedtraininganditerationofaunifiedglobalmodeloffederatedlearningusing
localdatafrommultiplepartiesinthenetwork.Inordertoeffectivelyprotectdataprivacy,
participantsdon’tneedtotransferdataandexchangeinformationwitheachother,but
onlyuploadthetra