基于知识蒸馏的目标检测算法压缩技术研究.pdf
摘要
近年来,随着深度学习的不断发展,计算机视觉也受到了越来越多的关注,目
标检测作为计算机视觉的基础任务之一,其精确度也在不断提高。然而随着检测模
型精度的不断提升,其计算开销也在成几何倍数地提升,如何保证模型既有较高的
精度又不会消耗过多的计算资源便成了一个研究热点。与此同时,学术界也在探索
着如何将模型变得更小,其中量化和剪枝作为两种常见的手段,常常受限于特定的
硬件以及定制化的算法实现,不同于近期出现的知识蒸馏,它作为一种特殊的知识
迁移技术,能够将大模型中的知识迁移到较小的模型中,在降低较小精度的同时大
幅度地减小模型的参数。尽管知识蒸馏在图像分类上有着不错的效果,但由于目标
检测任务输出的不固定难以编码,模型的不统一等问题,知识蒸馏在这类任务上的
效果却不是很理想。
为了解决上述问题,本文主要尝试采取新颖的蒸馏方式对不同种类的目标检
测算法分别进行蒸馏,主要包含骨干网络以及检测头这两个部分,以提高模型最终
的准确性。文章的研究内容主要分为以下几点:
首先,我们提出了一种基于多尺度特征融合表征的蒸馏方式,以解决蒸馏过程
中特征不突出,无效蒸馏的问题。该蒸馏方式主要是通过教师网络的中间层特征生
成通道及空间特征响应并得到对应特征掩码,学习教师网络中具有较大响应的显
著特征。同时我们将知识回顾的方式应用于该算法中,通过不同层次特征之间的融
合交互,提高网络的蒸馏效率。
其次,为了提高网络整体的蒸馏效率,在neck及检测头部分,我们采用了掩
码引导的蒸馏方法,通过教师网络检测头的分类输出得到特征的重要性权重,利用
该权重作为掩码的重要性依据分别对neck及检测头的输出进行蒸馏。
最后,为了验证提出方法的有效性,我们在MS-COCO数据集上进行了实验。
对比mAP指标,蒸馏后的模型相较于未蒸馏模型有不错的提高,与其他基线方法
相比具有明显优势,在精确度相当的情况下,蒸馏后模型的FLOPs以及模型参数
都显著减少,能够有效地部署于计算量更小的边缘设备。
关键词:目标检测,知识蒸馏,多特征融合,模型压缩
ABSTRACT
Inrecentyears,withthecontinuousdevelopmentofdeeplearning,computervision
hasalsoreceivedmoreandmoreattention.Asoneofthebasictasksofcomputervision,
theaccuracyofobjectdetectionhasbeengreatlyimproved.However,objectdetection
hasnottoomanylandingscenarios,oneofthereasonsisthatthecomputingperformance
ofedgedevicesisinsufficient.Howtoensuretheobjectdetectionalgorithmhasgood
performancewithouttoomuchcomputingresourceshasbecomearesearchhotspot.At
thesametime,theacademiccommunityisconstantlyexploringhowtomakemodels
smallerandfaster,wherequantizationandpruningaretwocommonmethods,often
limitedbyspecifichardwareandcustomizedalgorithmimplementation.Differentfrom
therecentknowledgedistillation,asaspecialknowledgetransfertechnology,itcan
transferknowledgefromlargemodeltosmallermodel,andgreatlyred