基于深度学习的眼底图像诊断和分割方法研究.pdf
基于深度学习的眼底图像诊断和分割方法研究
摘要
据相关调查显示,糖尿病、高血压等慢性疾病发病率逐年攀升,这些慢性
疾病的并发症会导致眼底发生相应的形态学变化,眼底图像的分析可以为这些
慢性疾病的诊断提供依据。然而,仅依靠眼科医生对眼底图像进行分析,存在
诊疗效率过低、浪费医疗资源等问题。因此,本文旨在研究利用深度学习方法
实现眼底图像糖尿病视网膜病变(DiabeticRetinopathy,DR)的严重程度诊断、端
到端的视网膜血管分割和视网膜血管动静脉分类,为人体慢性疾病的诊断提供
一种新思路。本课题的具体研究内容包括:
为解决DR的初期筛查问题,本文提出一种新颖的一维卷积核尺寸自适应
调整算法,并基于该算法提出了一种全局通道注意力机制(GlobalChannel
Attention,GCA)。本文将GCA结构与深度卷积神经网络相结合,构建了用于彩
色眼底图像DR严重程度诊断的模型GCA-EfficientNet(GENet)。在网络的训练
过程,使用了迁移学习技术和余弦退火学习率调整策略加速模型收敛。实验中
还使用OpenCV进行图像预处理和数据增强,避免发生过拟合问题。最终GENet
模型在Kaggle的DR数据集上准确率达到0.956,精确率达到了0.962,敏感度
达到了0.959,特异性达到了0.989。实验结果表明,基于GCA注意力机制的
GENet能有效地提取眼底图像病灶特征,提高DR严重程度分级的性能。
为进一步利用眼底图像中血管的形态学特征提取病理信息,本文首先提出
了一种新颖的视网膜血管分割方法,将分割目标确定为:动脉、静脉和血管三
类。针对这三个类别的分割,本文提出了一种新颖的Y型深度学习模型
AVSegNet,主干使用EfficientNetV2-S完成血管特征提取与分割,并使用对称
的级联Mini-UNet结构分别实现动脉和静脉分割。本文还提出了一种加权的三
类别二进制交叉熵(WBCE3)损失函数,分别对血管和动静脉使用不同的掩膜计
算损失,并基于迁移学习技术完成模型训练。本文将AVSegNet与GCA注意力
机制结合,并对输入的图像进行了增强,在公开的RITE数据集上完成实验验
证和可视化分析。最终AVSegNet血管分割任务的准确率达到0.961,敏感度达
到0.910,特异度达到0.986,F1分数达到0.836,DICE系数达到0.802,动脉
分割任务的AUC值达到了0.975,静脉分割任务的AUC值达到了0.978,均优
于传统的分割方法。实验结果表明,本文提出的方法可以有效实现端到端的眼
底图像视网膜血管分割和视网膜血管动静脉分类。
关键词:眼底图像,深度学习,糖尿病视网膜病变,视网膜血管分割,视网膜血
管动静脉分类
ResearchonFundusImageDiagnosisandSegmentation
MethodBasedonDeepLearning
ABSTRACT
Accordingtorelevantsurveys,theincidenceofchronicdiseasessuchas
diabetesandhypertensionisincreasingeachyear,andthecomplicationsofthese
chronicdiseaseswillleadtocorrespondingmorphologicalchangesinthefundus,
andtheanalysisoffundusimagescanprovideareferenceforthediagnosisofthese
chronicdiseases.However,onlyrelyingonophthalmologiststoanalyzefundus
imagessuffersfromlowefficiencyindiagnosisandtreatmen