基于深度学习的细粒度图像分类研究.pdf
哈尔滨工业大学工学硕士学位论文
摘要
近年来,随着数字多媒体技术的快速发展,图像数据的数量正在爆发增长。如
何有效的使用计算机视觉技术实现对图像数据的管理和分类已经成为计算机视觉
领域一个热门的研究课题。图像分类是实现图像管理的基础,而细粒度图像分类
属于图像分类范畴,由于其数据在表观上非常近似,同时存在类内差距大于类间
差距情况,使细粒度图像分类成为一个更困难也更值得研究的方向。
针对细粒度图像分类,我们把研究重心聚焦于以弱监督的方法挖掘细粒度图
像中的有判别力区域,并充分利用计算出的有判别力区域图像进行分类。在现有
的工作基础上,分别利用物体显著度和空间变换提出了固定尺寸和自适应尺寸这
两种有判别力区域计算方法。
在固定尺寸有判别力区域计算方法中,即基于物体显著图的弱监督细粒度图
像分类方法中,我们不使用额外的物体位置标注信息,利用模型对图像的注意力
机制,提出一种新的显著图计算方法,计算物体上精细的显著值,再结合卷积神经
网络的感受野和显著图计算出图像中多尺度的判别性区域,最后利用这些判别性
多尺度区域训练多尺度模型,通过组合不同尺度的分类模型,充分地利用物体级
的图像信息和物体局部的细节信息得到最优尺度组合。在数据集上
的实验结果表明我们提出的方法可以发现图像中的判别力区域并提高图像分类准
确率。
在自适应尺寸有判别力区域计算方法中,即基于自适应空间变换的弱监督细
粒度图像分类方法中,向卷积神经网络中引入空间变换层,通过训练模型自动学
习到每一张图像的空间变换参数,对输入图像进行了图像变换,去除无关背景等
干扰,得到图像中有判别力的区域,最后使用这些计算出的图像小块进行模型的
训练和测试,同时还引入了多尺度模型框架,将物体级尺度和局部级尺度的模型
联合一起进行训练,使卷积神经网络可以充分利用物体级的图像特征信息和物体
局部级的图像特征信息,最后使用交叉熵损失函数和损失函数对模型进行交
替训练,在数据集上的结果显示该方法有效地提高了模型的分类性
能。
关键词:细粒度图像分类;深度学习;弱监督;空间变换;显著图
哈尔滨工业大学工学硕士学位论文
ff
ffi