基于深度学习方法的图像篡改检测与定位研究.pdf
摘要
数字图像处理技术的普及使图像编辑软件在社会的各个领域中被广泛应用。
尽管人们可以轻而易举地修改出想要的图像,但篡改图像的不正当使用会带来
恶劣影响。对于图像篡改检测技术的研究在司法、新闻、网信等多个领域变得
尤为重要。随着人工智能的快速发展,基于深度学习的图像篡改检测方法取得
了令人满意的结果。然而,在分析相关研究后,本文针对现有方法存在的问题,
提出了两种基于深度学习的图像篡改检测与定位算法。现有方法存在问题的具
体描述以及本文的创新点包括以下几方面:
(1)现有基于深度学习的图像篡改检测技术大多依赖于连续卷积构成的深
层网络。然而,这种结构容易造成篡改信息丢失以及被篡改区域定位模糊。针
对该问题,本文提出了基于密集空洞卷积的图像篡改检测与定位算法,命名为
AT-DDCNet。为了尽可能地减少篡改信息的丢失,本文提出了一种密集空洞卷
积模块。它能够扩大卷积层的感受野并增强卷积层之间的信息流,尽可能地保
留图像中的篡改信息。为了准确定位到图像被篡改区域,AT-DDCNet引入了通
道空间注意力机制。它通过结合图像空间维度和通道维度的权重信息引导网络
有倾向性地学习篡改区域的细微伪影,以提高定位精度。经过实验结果证明,
该算法能够提高篡改检测精度和篡改区域像素级定位性能。
(2)现有方法通常利用卷积运算提取图像的空域特征,忽略了捕捉在篡改
区域具有显著变化的频域特征,导致难以充分获取的篡改区域纹理变化信息。
为了解决该问题,本文以AT-DDCNet为基础,提出了一种结合空域和频域信息
的篡改图像检测与定位算法,命名为TB-DDCNet。该算法利用小波变换分解和
提取图像的高频信息并增强、重构,重构后的图像经过特征提取网络的学习,
与AT-DDCNet提取到的空域特征融合,补充从空域中无法提取到的纹理信息。
同时,在DANet双注意力机制中引入像素值连续性,它能够抑制平滑纹理区域
的特征表达,增强网络对于纹理变化明显区域的关注程度。通过大量算法对比
实验证明本算法能够提高篡改检测精度和篡改区域像素级定位性能。
(3)本文研究了TB-DDCNet模型在边缘计算平台的部署与训练问题,进
一步验证了该算法的可实施性,推动了图像篡改检测算法在边缘计算平台的应
用。实验表明,提出的TB-DDCNet算法具备向NVIDIAJetsonAGXOrin开发者
套件上的移植能力,并且拥有优良的篡改检测精度和篡改区域定位能力,具备
良好的实用价值。
-1-
关键词:图像篡改检测,篡改区域定位,注意力机制,密集空洞卷积模块,高
频特征提取
-2-
Abstract
Thepopularizationofdigitalimageprocessingtechnologyhasledtothe
widespreaduseofimageeditingsoftwareinvariousfieldsofsociety.Althoughpeople
caneasilymodifythedesiredimages,themaliciouslyuseoftamperedimagescan
bringbadresults.Theresearchonimagetamperingdetectiontechniqueshasbecome
particularlyimportantinmanyfieldssuchasjustice,media,andsocialplatforms.
Withtherapiddevelopmentofartificialintelligence,deeplearning-basedimage
tamperingdetectionmethodshaveachievedsatisfactoryresults.However,after
analyzingtherelatedresearch,thispaperproposestwodeeplearning-basedimage
tamperingdetectionandloca