基于多源域适应的无监督行人重识别研究.pdf
基于多源域适应的无监督行人重识别方法研究
摘要
行人重识别是一种跨摄像头的检索技术,由于该技术能够对不同位置和时间出现
的行人进行识别和追踪,因此在智慧城市,智慧监控以及自动驾驶等领域有巨大的应
用潜力。然而在现实场景中,高昂的标注成本往往会对行人重识别的应用造成阻碍。
因此,无监督行人重识别,由于不需要在目标场景进行新一轮的数据标注,是更具备
研究价值与应用潜力的。在这之中以无监督多源域适应行人重识别的性能最优,但也
更具备挑战性,主要存在的问题包括基础模型特征提取能力不足,领域分布差异,伪
标签中噪声,计算开销较高等问题。本文基于深度学习,对以上问题进行了充分的分
析与解决。主要包括:
1.针对基础模型特征提取能力不足的问题,提出了对不同的主流模型在相关域适
应任务上进行了充分的实验对比,并基于实例归一化对模型结构进行优化,实现了性
能的提升。同时对通用的数据增强方案以及新兴的增强方法进行调研与实验,并选择
最优的组合作为后续研究工作的基础。
2.针对领域分布差异问题,提出了基于图卷积网络的领域融合方法来完成对分布
差异的消除,该方法能够实现对目标域的关注以及对领域之间高阶相关性的挖掘。首
先通过目标域优先的融合机制处理目标域的分布差异,随后为了能深度挖掘特征节点
之间的相关信息,使用高维边特征代替传统的边结构。最终通过二者的结合,有效地
实现了对不同领域特征的深度融合,并在不同的域适应任务上均取得了良好的成绩。
3.针对伪标签中存在噪声的问题,提出了基于伪标签约束的耐噪学习方法。该方
法通过构造软标签,一方面实现了更细粒度的聚类与监督训练,另一方面实现了对伪
标签生成过程的有效约束。
4.针对模型计算资源占用大、计算速度慢导致的无法实际应用问题,提出了混合
架构模型和相关剪枝算法对模型进行轻量化。一方面基于混合架构对模型结构进行优
化,另一方面基于剪枝算法对模型的参数量与计算量进行压缩。最终压缩后的模型不
仅能极大地削减计算成本,还能保证模型的精度损耗在一定范围内。从而为模型的实
际应用提供了可能。
关键词:无监督学习;行人重识别;图卷积网络;耐噪学习;模型轻量化
基于多源域适应的无监督行人重识别方法研究
ABSTRACT
Personre-identificationisacross-cameraretrievaltechniquethatcanrecognizeandtrack
pedestriansacrosscamerasappearingatdifferentlocationsandtimes.Therefore,ithasgreat
potentialinthefieldsofsmartcities,intelligentmonitoring,andautonomousdriving.
However,inreal-worldscenarios,thehighcostofannotationoftenimpedestheapplicationof
personre-identification.Therefore,unsupervisedpersonre-identification,whichdoesnot
requirenewroundofdataannotationinthetargetscene,ismorevaluableandhasgreater
researchandapplicationpotential.Amongthem,unsupervisedmulti-sourcedomainadaptive
personre-identificationhasthebestperformanceandisalsomorechallenging,including
problemssuchasbasicmodelselection,domaindis