文档详情

基于区块链的联邦学习节点动态选择技术研究.pdf

发布：2025-05-04约8.92万字共63页下载文档

文本预览下载声明

摘要

随着数据安全、隐私保护相关的法律法规和行业要求的愈加严格，传统机器

学习算法面临缺乏高质量、大规模数据的挑战，产生数据孤岛问题。为了实现数

据“可用不可见”的新型交易范式，联邦学习(FederatedLearning，FL)技术被广

泛运用于模型训练过程。跨设备的联邦学习主要是多个设备客户端节点（以下简

称：设备节点）在不共享隐私数据的条件下，协同训练全局模型。然而，在跨设

备的联邦学习场景下，设备节点通常具有地理位置、标注能力、安全级别等差异，

导致其收集的数据面临非独立同分布(NonIndependentandIdenticallyDistributed，

Non-IID)以及恶意节点攻击等问题。一方面，非独立同分布问题使得各节点训练

的模型差异性大，给全局模型带来精度低、不收敛等问题；另一方面，恶意节点

攻击使得系统容易遭受中毒模型侵害，导致联邦学习系统的鲁棒性降低、甚至模

型失效。本文研究联邦学习中设备节点因非独立同分布(Non-IID)和恶意攻击行

为给联邦学习系统带来的负面影响和防范措施，聚焦于上述问题，本文展开如下

研究工作：

(1)首先提出基于特征权重的联邦学习节点分组选择方法FedFGC(Federated

Feature-basedGroupChoice,FedFGC)，该算法通过本地训练出的最优特征权重参

数向量进行设备节点分组集群选择，分组选择后进行集群内本地模型训练，得到

效果更好的全局模型。仿真实验证明了方法在独立同分布、非独立同分布、分组

集群数不同场景下的有效性，并对比了FedAvg、FedNova、FedProx三种联邦学

习算法，实验结果表明提出的方法在模型精度和鲁棒性方面更优。

(2)其次基于PoS（ProofofStake，PoS）的区块链联邦学习，提出了一种区

块链的信用机制支持的联邦学习节点动态选择算法CS-PoS(CreditScoreProofof

Stake，CS-PoS)。通过引入基于等级信用评分的机制来从多个指标评估每个设备

节点的可信度，确保信用值和奖励是正相关的，任何合法的节点都会遵循模型训

练规则来最大化利益。理论分析及在MNIST与CIFAR-10数据集上进行仿真实

验，均表明提出方法能够有效解决模型准确度低和数据安全等问题。

关键词：区块链，联邦学习，非独立同分布，设备节点选择，鲁棒性

Abstract

Withtheincreasinglystringentlaws,regulationsandindustryrequirementsrelated

todatasecurityandprivacyprotection,traditionalmachinelearningalgorithmsare

facedwiththechallengeoflackofhigh-qualityandlarge-scaledata,resultinginthe

problemofdatasilos.Inordertorealizethenewtransactionparadigmofavailablebut

notvisibledata,FederatedLearning(FL)technologyiswidelyusedinthemodel

trainingprocess.Cross-devicefederatedlearningmainlyinvolvesmultipledeviceclient

nodes(hereinafter:devicenodes)collaboratingtotrainglobalmodelswithoutsharing

privatedata.However,inthecross-devicefederatedlearningscenario,thedevicenodes

usuallyhavedifferencesingeographiclocations,annotationcapabilities,securitylevels,

etc.,whichl

显示全部

相似文档