基于深度学习的多目标跟踪方法研究.pdf
基于深度学习的多目标跟踪方法研究
摘要
多目标跟踪系统在自动驾驶、智能监控等领域扮演着关键角色。然而,现实场景中
光照变化、目标相互遮挡和非线性运动等因素影响了多目标跟踪系统的准确性和稳定性。
因此,提升多目标跟踪系统的抗干扰能力,增强其面对各种复杂环境的适应性,是当前
研究的重要方向之一。为了解决复杂场景下行人相互遮挡导致的身份嵌入准确性降低、
身份频繁切换的问题。首先,对FairMOT的网络结构进行改进,加强网络的重识别特征
提取能力并利用抗遮挡算法恢复被遮挡目标,最终提升模型的抗遮挡能力。其次,为了
进一步解决多目标跟踪系统在人群密集运动场景下,面临的身份嵌入表征相似、目标定
位重叠的问题。改进ByteTrack的数据关联算法,使多目标跟踪任务可以更好地区分被
遮挡目标,维持连续跟踪的稳定性。研究工作的具体内容如下:
(1)提出了一个基于FairMOT的抗遮挡多目标跟踪模型AOMOT。AOMOT首先
通过轻量化平衡模块解耦不同层次的语义信息,减少检测任务和重识别任务的语义冲突,
降低重识别任务的性能提升对检测任务的影响。其次应用自注意力结构提取行人的外观
特征,加强局部窗口下的类内特征的区分度,增强行身份信息的匹配一致性并减少身份
标识的频繁切换。最后优化身份关联算法挖掘低置信度目标中的被遮挡对象,将其重新
纳入目标身份关联并更新其重识别特征。在MOT17数据集上的实验结果表明AOMOT
具有优秀的抗遮挡能力,更少的身份切换。
(2)提出了一个基于ByteTrack的多目标跟踪模型BetterTrack,BetterTrack以关联
算法BYTE作为改进的核心提出算法BEETER。BEETER首先通过轨迹分类将清晰的无
遮挡的轨迹优先与高分检测框进行匹配,避免了其与因遮挡重叠的轨迹共同争抢高分检
测框。其次对于低分检测框中明显重叠的检测框,算法仅保留那些超出过滤阈值的低分
检测框进行轨迹关联。在MOT20数据集上的实验结果表明BetterTrack具有优秀的轨迹
连续性和跟踪稳定性。
关键词:计算机视觉;多目标跟踪;目标检测;重识别;关联算法
基于深度学习的多目标跟踪方法研究
Abstract
Multi-objecttrackingsystemsplayapivotalroleindomainssuchasautonomousdriving
andintelligentsurveillance.However,factorspresentinreal-worldscenarios,suchasvariations
inlighting,mutualocclusionamongtargets,andnonlinearmovements,significantlyimpactthe
accuracyandstabilityofthesemulti-objecttrackingsystems.Consequently,enhancingtheir
resistancetointerferenceandadaptabilitytovariouscomplexenvironmentsisoneofthecritical
researchdirectionsatpresent.Toaddresstheissueofdecreasedpedestrianidentityembedding
accuracyandfrequentidentityswitchescausedbymutualocclusionsincomplexscenes,
ImprovementstothenetworkarchitectureofFairMOTarefirstundertaken,bolsteringits
featureextractioncapabilitiesforreidentificationandemployinganti-occlusionalgorithmsto