文档详情

基于对比学习的无监督行人重识别算法研究.pdf

发布:2025-03-22约11.77万字共66页下载文档
文本预览下载声明

摘要

在计算机视觉领域中,行人重识别已成为非常关键的一个研究方向。行人重识别

是利用计算机视觉技术来识别图像或视频序列中是否存在特定行人的技术。行人重

识别不受摄像头固定位置带来的限制,每个摄像头只能捕捉到特定角度和范围内的

图像信息,无法全面观察整个场景,而利用行人重识别技术可以实现跨摄像头的目标

关联。现如今人口数量快速增长公共安全需求更加紧迫,监控摄像头数量也在不断增

加,行人重识别在智能监控系统中变得至关重要,具有重要的研究意义和应用价值。

有监督行人重识别现已取得较好的研究成果,但在实际应用场景中标签成本过

于昂贵。因此无监督行人重识别更受关注,即使没有任何标签信息,它仍然能够在不

同摄像头的图像中准确地检索到目标人员,有效降低了标签成本。然而,无监督行人

重识方法依然面临多重挑战:(1)在用聚类生成伪标签,会不可避免生成一些噪声

伪标签,提供错误信息影响模型的训练,导致模型难以识别同一行人;(2)现有方

法多使用传统的卷积神经网络提取图像特征,由于局部感受野的限制,有些全局信息

可能无法被捕捉到,而且在下采样后会丢失一些细节信息,可能会导致提取的特征质

量下降,从而影响模型的训练和测试精度。

针对以上问题,本文对无监督的行人重识别算法展开以下研究:

(1)提出基于伪标签规范化损失的无监督行人重识别算法。为解决挑战一中噪

声伪标签的问题提出了一种伪标签规范化损失函数,通过综合考虑聚类伪标签的可

信度和样本对之间的相似度,对聚类算法产生的错误伪标签施加约束。首先引入了由

聚类指引的注意力模块,结合由聚类生成的样本伪标签与其所在聚类中心的关联性

来判断样本伪标签的可信度,从而辨别出带有噪声的标签并赋予正确标签较高的权

重,以减少伪标签噪声对总体损失函数的影响。同时,利用聚类生成的伪标签来进行

样本挖掘,创建用于对比学习正负样本对,并通过计算为每个样本对赋予一个权重得

分。将上面的两种权重分数同时引入到损失函数中,能够有效减小伪标签噪声的影

响。

(2)提出基于Transformer自蒸馏的无监督行人重识别算法。针对挑战二中的

缺乏全局信息以及细节信息缺失的问题,本文将卷积神经网络替换为不需要下采样

操作的Transformer模型,有助于保留更多的信息并更好地处理全局信息,从而解决

了缺乏全局信息的问题。其次,本文引入自蒸馏机制,该机制随机选择一个中间块作

I

为目标中间块,计算目标中间块的输出与模型最终输出之间的损失。结合了全局信息

的捕捉和内部知识的利用,通过无监督方式训练模型,有效解决了行人重识别任务中

的全局信息缺失和细节信息不足的问题。

关键词:行人重识别;无监督学习;对比学习;伪标签噪声;Transformer

II

ABSTRACT

Inthefieldofcomputervision,personre-identificationhasbecomeacrucialresearch

topic.Personre-identificationaimstoidentifythepresenceofspecificpedestriansinan

imageorvideosequence.Inreal-lifesurveillancescenarios,thecamerapositionisfixedand

eachcameracanonlycaptureimagesfromaspecificangleandrange,whichthereforeis

unabletofullyobservetheentirescene.Personre-identificationcanaddressthisissueby

associatingthetargetpersonacrosscameras.Withthesurgeofpopulationandescalating

amountofsurveillancecameras,personre-identificationhasbec

显示全部
相似文档