文档详情

基于增量宽度联邦学习的快速分类算法研究及应用.pdf

发布：2025-06-09约9.91万字共63页下载文档

文本预览下载声明

哈尔滨理工大学工学硕士学位论文

基于增量宽度联邦学习的快速分类算法研究及应用

摘要

随着大数据时代的到来，数据孤岛和隐私问题受到社会广泛关注。联邦学

习（FL）是一种新兴的隐私计算方法，允许用户数据不离开本地设备，即可建

立一个更全面、多样化的模型，因此能有效解决数据孤岛和用户数据隐私问

题。然而，目前的主流联邦学习方法普遍基于深度网络，模型训练时间长，且

面临模型遗忘及多用户数据分布差异、不平衡的问题。因此，研究基于宽度网

络的联邦学习方法，实现高效的模型构建以及模型的动态更新，并解决多用户

数据分布差异、不平衡问题具有重要的实际意义。针对上述问题，本论文提出

一种快速宽度联邦学习分类算法，包含宽度联邦学习及其增量学习两个部分。

（1）提出一种宽度联邦学习算法。该算法以随机映射为核心构建宽度联

邦学习框架，解决多用户数据隐私保护且分布差异条件下的高效分类问题。具

体为：以宽度网络的简化表示方法为基础，将本地各用户数据通过随机映射加

密获得其随机特征，并在服务器端利用稀疏自编码器对随机特征进一步挖掘，

从而快速构建多用户联邦全局模型，实现模型的高效训练。

（2）提出一种数据增量的宽度联邦学习算法。该算法以宽度网络的增量

学习方法为核心，将全局模型参数与新增知识进行动态融合以解决模型遗忘问

题。针对多用户输入数据增加的场景，设置新增样本数量阈值，通过随机映射

方法构建新增加密特征集，提出利用Greville算法动态更新全局模型参数，无

需对模型进行重新训练，实现宽度联邦模型的数据增量学习。

所提方法在2种数据分布场景下，通过4种公开数据集在故障诊断、图像

分类等应用领域中进行了实验验证。与现有联邦学习方法相比，所提方法兼顾

了安全性、稳定性、高效性。实验结果表明，所提方法能够快速完成模型训

练，平均训练时间53.8s，是现有联邦学习方法训练时间的1.2%左右；所提方

法能够有效完成分类任务，平均测试准确率93.9%，同时能够利用新增数据动

态更新模型参数，在一定条件下有效提升模型分类精度。

关键词宽度网络；联邦学习；数据隐私；增量学习；随机映射

-I-

哈尔滨理工大学工学硕士学位论文

ResearchandApplicationofFastClassification

AlgorithmBasedonIncrementalBroad

FederatedLearning

Abstract

Withtheadventofthebigdataera,datasilosandprivacyconcernshave

receivedwidespreadattentioninsociety.Federatedlearning(FL)emergesasanovel

privacycomputingmethod,allowinguserdatatoremainonlocaldevices,thus

enablingtheestablishmentofamorecomprehensiveanddiversifiedmodel.

Therefore,iteffectivelyaddressestheissuesofdatasilosanduserdataprivacy.

However,thecurrentmainstreamFLmethodsrelyheavilyondeepneuralnetworks,

resultinginlongmodeltrainingtimesandfacingchallengessuchasmodelforgetting,

显示全部

相似文档