基于深度生成模型的临床心电图数据增强方法研究.pdf
广西师范大学硕士学位论文
基于深度生成模型的临床心电图数据增强方法研究
研究生姓名:李佳佳导师姓名:周飞燕副教授
学科:软件工程研究方向:计算机辅助心电图分析年级:2021级
摘要
计算机辅助心电图(Electrocardiogram,ECG)分类是指运用计算机技术和机器
学习方法对心电图信号进行自动分类和识别,以实现对心脏相关疾病和异常心律等情
况的有效分类和诊断。近年来,深度学习技术在心律失常检测领域方面表现突出,弥
补了人工检测的不足,提供了更加精确可靠的诊断手段。然而,由于ECG数据库中
正常类样本的数量远多于异常类样本的数量,数据分布极度不均衡。这使得利用深度
学习模型进行心律失常分类时,模型更偏向于学习多数正常样本的特征,而忽略对少
数异常样本的学习,训练出的模型容易过拟合。解决ECG数据库数据不均衡的有效
策略之一是对少数异常类样本进行数据增强,以此确保模型能够充分学习每个类别样
本的特征,从而提升分类模型的整体性能。本文旨在探索对ECG数据进行数据增强
的有效方法,着重研究两种深度生成模型在该领域的效果。
(1)在生成对抗网络原始框架的基础上,设计了结合双向长短期记忆网络和卷
积注意力模块的生成器,以及基于卷积神经网络的判别器,将其称为BC-GAN。以
MIT-BIH心律失常数据库和中国心血管疾病数据库作为实验数据集。同时,利用可视
化技术和定量评价指标来评估生成结果的质量。最后,利用生成的ECG数据对训练
集进行扩充,并进行分类任务,以验证分类模型性能的改善效果。在MIT-BIH心律
失常数据库的15分类任务上,经过数据增强后,特异性指标从71.21%提升至91.91%,
总体准确率从99.03%提升至99.46%。在中国心血管疾病数据库的二分类任务上,数
据增强后室性早搏类灵敏度从50.70%上升到83.15%,总体准确率从99.03%提升至
99.15%。
(2)在去噪扩散概率模型的基础上,嵌入挤压-激励注意力机制来改进U-net骨
干网络,从而增强模型对整条ECG记录数据的处理能力。在中国心血管疾病数据库
的二分类任务上,数据增强后室性早搏类灵敏度从50.70%上升到86.69%,总体准确
率从99.03%提升至99.10%。
综上所述,采用生成模型来增强ECG数据具有显著的优势,能够有效提高分类
模型对少数异常类样本的识别能力,进而改善分类模型的整体性能。
关键词:生成对抗网络;心电图数据增强;去噪扩散概率模型;双向长短期记忆网络;
卷积注意力模块
I
广西师范大学硕士学位论文
Researchonclinicalelectrocardiogramdataaugmentation
methodbasedondeepgenerativemodel
Graduatestudent:JiajiaLi
Supervisor:A.P.FeiyanZhou
Major:SoftwareEngineering
Researchdirection:ComputerAidedElectrocardiogramAnalysis
Grate:2021
Abstract
Computer-aidedECGclassificationreferstotheuseofcomputertechnologyand
machin