基于深度学习的医学图像分割方法研究.pdf
摘要
医学图像的精准分割是研究疾病形成机制的重要手段,对临床应用具有重要指
导意义。近几十年来,神经网络方法在医学影像处理领域以及辅助诊断方面取得了巨
大进步。其中卷积神经网络由于卷积操作固有的局部性无法在对复杂医学图像进行
特征提取时有效的捕捉到长距离依赖关系;而Transformer因为自注意力机制擅长捕
捉长距离依赖关系但缺乏对局部上下文的建模,同时计算复杂度也较高。为了将两者
进行互补,本文进行了以下研究:
(1)提出了一种基于双通道自注意力机制的超声图像分割网络,该网络通过结
合卷积神经网络和Transformer两种主流模型进而充分挖掘卷积神经网络在保留图像
细节特征上的优势以及Transformer在处理全局依赖关系方面的高效性来提升图像分
割的精度和鲁棒性。该网络主要包括三个部分:编码器、特征融合模块以及解码器。
在编码阶段,通过滑动窗口自注意力机制和传统卷积操作对图像进行深层特征提取。
特征融合模块通过门控双层特征融合策略整合不同层次的特征,以丰富特征表示。在
解码阶段,解码器逐层上采样并通过卷积操作对特征进行解码,将两个编码器分支提
取的特征进行融合,最终得到精确的图像分割结果。在甲状腺结节和乳腺癌超声数据
集上进行了实验,结果优于目前最先进的方法。
(2)在上述工作的基础上,进一步对卷积神经网络和Transformer进行融合,提
出了分层空间和通道自注意力引导的医学图像分割网络,通过进一步增强全局依赖
性并补充局部上下文,从而得到具有融合性的特征表示。在这些核心设计的基础上,
我们提出了两种特征融合模块并按层进行特征融合。此外,构造了新的损失函数,通
过每层的输出对损失函数权重进行动态调整。在6个不同模态的各种医学图像分割
任务中进行了实验,结果表明所提出的网络性能超过了所有最新和经典的对比网络。
此外,提出了一种精简版本的微型网络,在不明显降低分割性能的基础上使模型参数
减少了90%以上。
综上所述,本文所提出的两个基于卷积神经网络与Transformer结构的医学图像
分割网络,能够在低对比度,高噪声且结构复杂的条件下,有效结合卷积神经网络与
Transformer机制的优势,并且在多种医学图像分割任务中均实现了精准分割,验证
了本文所提出的模型的有效性。
关键词:医学图像分割;深度学习;自注意力;卷积神经网络
I
ABSTRACT
Accuratesegmentationofmedicalimagesisanimportantmeanstostudytheformation
mechanismofdiseasesandisofgreatsignificanceinguidingclinicalapplications.Inrecent
decades,neuralnetworkmethodshaveachievedgreatsuccessinthefieldofmedicalimage
segmentation.TheCNN-basedmethodshaveachievedimpressiveresultsinmedicalimage
segmentation,buttheyfailedtocapturethelong-rangedependenciesduetotheinherent
localityoftheconvolutionoperation.Transformer-basedmethodsarerecentlypopularin
visiontasksbecauseoftheircapacityforlong-rangedependenciesandpromising
performance.However,itlacksinmodelinglocalcontext.Inordertocomplementthetwo
models,thefollowingresearchisdevelopedinthispaper:
(1)Anultra