基于数据增强和度量学习的小样本图像识别技术研究.pdf
摘要
以深度学习为代表的人工智能技术在自动驾驶、生物特征识别、人脸识别、计
算机辅助诊断等图像识别领域取得了巨大成就,但该技术需要大规模高质量的标
注数据进行监督训练学习。然而,在某些特定的应用场景中,由于成本、个人隐私、
安全道德等问题,很难获得大规模高质量的标注数据集,对数据的依赖严重阻碍了
基于深度学习的图像识别技术的进一步发展。因此,如何使深度学习模型仅通过少
量样本进行有效学习和泛化,缩小人工智能技术和人类思维之间的差距,成为当前
深度学习领域中一个亟需解决的问题,该问题被称为小样本学习(Few-Shot
Learning),在图像识别领域中也被称为小样本图像识别(Few-ShotImage
Recognition)。为了提高小样本图像识别的准确率,本文从数据增强和度量学习两
个方向进行研究,主要内容如下:
(1)为了缓解小样本图像识别中因缺乏足够数据而导致的模型过拟合问题,本
文提出一种新的基于信息融合修正(IFR)的小样本图像识别算法,充分利用数据
之间的关系(基类数据与新类数据之间的关系和新类数据中支持集数据与查询集
数据之间的关系),对新类数据中支持集数据的分布进行修正,并在修正后的分布
上进行采样,扩充支持集样本的特征容量,达到数据增强的效果。实验结果表明,
与其他最优的图像增强算法的准确率相比,在miniImageNet数据集5-way1-shot
和5-way5-shot设置中,分别提高了1.33%和0.93%;在tieredImageNet数据集5-
way1-shot和5-way5-shot设置中,分别提高了3.22%和0.98%;在CUB数据集5-
way1-shot和5-way5-shot设置中,分别提高了1.38%和1.42%。
(2)为了约束模型的特征提取部分,使模型在小样本条件下生成的特征能更好
地用于相似度度量,提高模型的泛化能力,本文从“多维”度量的角度出发,在特
征层面上提出基于多尺度标签传播(MSLP)的小样本图像识别算法,在度量方式
上提出基于集成度量学习(EML)的小样本图像识别算法。前者通过构建多尺度特
征生成模块在不同尺度的深层特征上进行“多维”度量;后者通过集成不同的相似
度度量方法进行“多维”度量。实验结果表明,与对应基准模型的准确率相比,在
miniImageNet数据集5-way1-shot和5-way5-shot设置中,前者提高了2.77%和
4.02%,后者提高了0.65%和0.87%;在tieredImageNet数据集5-way1-shot和5-
way5-shot设置中,前者提高了1.16%和1.27%,后者提高了1.64%和1.17%。
关键词:小样本图像识别,数据增强,度量学习,多尺度特征,集成学习
ABSTRACT
Artificialintelligencetechnologyrepresentedbydeeplearninghasmadegreat
achievementsintheresearchofautomaticdriving,biometricrecognition,facerecognition,
computer-aideddiagnosisandotherimagerecognitionresearch,butthistechnology
requireslarge-scaleandhigh-qualitylabeleddataforsupervisedtrainingandlearning.
However,insomespecificapplicationscenarios,duetosomeproblemssuchascost,
personalprivacy,andsecurityethics,itisdifficulttoobtainlarge-scaleandhigh-quality
labeleddata,andthedependenceondataseriouslyhindersthefurtherdevelopme