基于个性化联邦学习的皮肤镜影像分类方法研究.pdf
基于个性化联邦学习的皮肤镜影像分类方法研究
摘要
皮肤癌由于早期发病症状不显著,往往被患者忽视,疾病误诊率高。无论是我国
还是西方国家,皮肤癌的发病率在所有种类的癌症中都名列前茅。在早期诊断出皮肤
癌并进行手术治疗可以大大增加患者的生存率。因此,皮肤癌依然是我们需要重点关
注的癌症之一。为了更好地诊断皮肤癌,医务工作者使用皮肤镜采集可疑区域的影像
数据,目视判别皮损区域是否存在癌变。近年来,人工智能技术日趋发达,如果能大
量收集皮肤镜影像,针对皮肤镜影像中的疑似病变区域自动分类,便可大幅提高诊断
速度和减少患者死亡。但在实际医疗机构应用场景中,皮肤镜影像类别标签的获取是
基于病理活检的金标准,大规模采集难度大。且因为医学数据涉及患者隐私,根据相
关法律法规不能进行数据共享。此外由于不同国家和地区的人种分布、环境差异以及
医疗机构之间的设备差异,各医疗机构间的数据分布差异较大还会进一步放大各机构
联合训练的难度。
针对皮肤镜影像自动分类在落地的过程中的这一系列困难,本文开展一系列研究
如下:
(1)对于多个医疗机构数据高度非独立同分布且全局标签呈长尾分布导致模型收
敛精度变差的问题,本文提出了基于相互蒸馏的个性化联邦皮肤镜影像分类方法p-
MFC。p-MFC的核心是MD模块和PPA模块。首先PPA模块负责对各医疗机构上传的
模型进行个性化聚合,PPA模块通过控制个性化程度对训练优化目标进行控制,在全
局泛化和本地个性化之间取得了平衡。随后MD模块以高斯噪声为辅助,从各医疗机
构模型中提取全局知识,校准到PPA模块准备好的个性化模型中,并将个性化模型分
发至对应医疗机构。通过PPA模块粗聚合+MD模块精校准的思路,p-MFC为联邦皮肤
镜影像分类问题提供了一种无需额外辅助数据的个性化解决方案。
(2)p-MFC基于噪声进行蒸馏校准,其MD模块的性能受数据质量影响无法进一
步提高。针对这一点,本文在p-MFC的基础上引入生成对抗的思想,提出了基于对抗
相互蒸馏的个性化联邦皮肤镜影像分类方法p-AMFC。在p-AMFC中,为了提高MD模
块的性能,本文在服务器端引入一个条件生成器对MD模块进行服务。进一步地给出
了在服务器端无额外数据和判别器辅助的情况下,仅使用多个机构上传的皮肤镜影像
分类网络训练生成器的方法。同时,p-AMFC中还设计了AD模块,为训练提供对抗反
馈机制。与传统的生成对抗网络思想不同的是,本文提出的AD模块不会损害分类器的
哈尔滨工程大学专业学位硕士学位论文
性能,更适合无辅助数据场景下的联邦皮肤镜影像分类模型训练。
在高度异质的皮肤镜影像分类数据集ISIC2019中,p-AMFC在多个实验中均超过
了最新的联邦学习分类方法。验证了所提出方法在联邦皮肤镜影像分类任务中能取得
很好的效果。
关键词:个性化联邦学习;无数据知识蒸馏;相互学习;皮肤镜影像分类
基于个性化联邦学习的皮肤镜影像分类方法研究
Abstract
Skincancerisoftenoverlookedbypatientsduetoitslessprominentearlysymptoms,
resultinginahighmisdiagnosisrate.ItranksamongthetoptypesofcancerinbothChinaand
Westerncountries.Earlydiagnosisandsurgicaltreatmentcansignificantlyincreasethepatients
surviva