基于伪标签的卫星图像半监督语义分割方法研究.pdf
摘要
卫星图像语义分割是图像分割领域中的一项重要任务。随着卫星技术的发展,
人们可获取的卫星图像数目越来越多,这为进行相关领域的研究提供了充足的数
据支持。同时随着深度学习技术的发展,一些基于深度学习的语义分割模型相继
提出,并在特定的场景取得了显著的成果。然而在卫星图像语义分割任务中,存
在着标签数量不足的问题。且获取足量的标签,需要足够的专业知识,同时也会
消耗大量的时间和精力,因此现在的卫星图像数据集出现数据标签匮乏或者卫星
图像数据集标签数据齐全但数据集偏小的现象。这一现象导致现在的研究人员需
要耗费大量时间对获得的数据集进行标注。
针对这一现象,本文使用深度学习中的半监督学习方法,对卫星图像数据中
的语义特征进行学习,生成伪标签以替代未标签区域原本需要的人工标签数据,
并将伪标签编入数据集进行二次训练,以此来解决数据集中标签数据匮乏的问题。
本文针对数据集标签数据不足的问题进行研究,主要研究工作如下:
(1)使用MeanTeacher模型将一个语义分割任务拆分为一个伪标签生成任务
和一个有监督任务。传统的MeanTeacher模型是教师模型先进行训练且将其训练
结果用于生成伪标签,然后利用伪标签对学生模型训练,最终得到能够完成语义
分割任务的学生网络。传统的MeanTeacher模型两个网络间具有很强的直接关联
性,往往会出现教师模型的错误在学生模型中放大的现象。而本文提出一种双分
支的伪标签生成模型进行伪标签的生成,并将之作为学生模型进行整个模型的训
练。同时,将MeanTeacher模型的两个网络模型分离,执行不同的分割任务以提
高两个网络的独立性,将两个网络的直接联系降低,以减少伪标签的错误对最终
的预测结果造成的影响。
(2)针对伪标签的生成问题,即避免偏差较大的伪标签来训练学生模型,将
FixMatch模型中的置信度思想融入MeanTeacher模型中。本文借鉴FixMatch模型
和其他区域置信度模型的思路,设置二次置信和语义纠正模块,从而充分利用无
标签数据。并降低学习结果较差的语义类别的阈值,以鼓励模型从未标记数据集
中学习更多该语义类别的特征。此外,引入分割类别概率图与分割结果进行对比,
并从语义纠正的图像中提取低置信度图像作为负面对照样本,计算对比损失并与
交叉熵损失共同控制模型的预测结果,从而提高预测结果的准确性。
关键词:半监督学习,语义分割,区域置信度,伪标签,对比损失
Abstract
Assatellitetechnologycontinuestoadvance,thefieldofsatelliteimagese
manticsegmentationhasgainedsignificantimportanceinthebroaderrealmof
imagesegmentation.Theproliferationofsatelliteimages,duetotechnologicala
dvancements,hasresultedinanabundanceofdataresources,therebyfacilitatin
gextensiveresearchinrelateddomains.Theadvancementofdeeplearningtec
hnologyhasledtotheemergenceofvarioussemanticsegmentationmodels,w
hichhaveshownremarkableachievementsinspecificscenarios.Thesemodels,
builtupondeeplearningtechniques,havedemonstratedsignificantprogress,un
derscoringtheirpotentialforfurtheradvanceme