基于度量学习的水下图像识别方法研究.pdf
基于度量学习的水下图像识别方法研究
摘要
近些年来,海洋在国家经济发展格局和对外开放中的作用日益提升,对海洋资源
开发和相关技术研究提出了新的要求。水下视觉设备是人类探索海洋环境的重要手段,
在水下资源勘探、水下救援、水下军事活动等都有广泛应用。但是由于水下图像存在
质量退化的问题以及深度学习难以在水下小样本数据集上获得良好的训练效果,图像
识别准确率受到影响,应用表现不佳。度量学习因为简单高效,泛化性能良好,在小
样本数据集上获得了广泛关注。本文针对水下图像识别问题,采用度量学习方法展开
了深入研究,主要包括以下内容:
(1)针对水下图像在采集过程中出现的雾化、模糊、颜色失真等问题,设计了一
种基于红通道修正的算法对水下数据集进行图像增强,以提高图像质量。该算法利用
红通道信息修正背景光,并利用中值滤波优化透射率,得到的图像更加清晰且颜色自
然,符合人类视觉效果。
(2)水下图像背景复杂且主体姿态多变,针对现有模型难以快速定位判别性特征
及类别表达能力不强的问题,设计了基于坐标注意力机制与类原型增强的网络模型
(CoordinateAttentionandPrototypeEnhancementNetwork,CAPEN)。该模型利用坐标注
意力机制将位置信息嵌入到通道中,提升模型的特征提取能力,有助于快速地定位图
像重要信息。并且利用动态路由机制提升共有特征的权重值,强化类原型的代表能力,
以适应同类图像中存在较大差异的情况。实验结果证明,该网络在水下图像识别上有
良好表现,识别准确率得到大幅提升。
(3)水下物种丰富多样,经常出现类内差异大、类间差异小的情况。针对现有模
型单一度量方式易造成相似性偏差的问题,设计了基于多度量模块的网络模型(Multi-
MetricNetwork,MMN)。该模型融合图像-图像度量与图像-类别度量两种方式,获得更
为鲁棒、适应性更强的度量函数。并且图像-类别的度量能够充分利用同类图像中的局
部特征,加强类别表达,有助于扩大类间差异。实验结果证明,该模型比单一度量方
式获得了更好的识别效果,提升了水下图像识别的准确率。
关键词:水下图像识别;卷积神经网络;度量学习;小样本学习;原型网络
基于度量学习的水下图像识别方法研究
Abstract
Inrecentyears,theroleoftheoceaninthenationaleconomicdevelopmentpatternand
openinguphasbeenincreasing,whichputsforwardnewrequirementsforthedevelopmentof
marineresourcesandrelatedtechnologyresearch.Underwatervisionequipmentisan
importantmeansforhumanbeingstoexplorethemarineenvironment.Itiswidelyusedin
underwaterresourceexploration,underwaterrescue,underwatermilitaryactivitiesandsoon.
However,duetotheproblemofqualitydegradationofunderwaterimagesandthedifficulty
ofdeeplearningtoobtaingoodtrainingresultsonunderwatersmallsampledatasets,the
accuracyofimagerecognitionisaffectedandtheapplicationperformsisnotgood.Metric
learninghasgaineda