文档详情

基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络模型分析.pdf

发布:2025-03-12约4.89万字共11页下载文档
文本预览下载声明

第50卷第4期吉林大学学报(医学版)Vol.50No.4

10442024年7月JournalofJilinUniversity(MedicineEdition)Jul.2024

[文章编号]1671‐587X(2024)04‐1044‐11DOI::10.13481/j.1671‐587X.202404019

基于心脑血管疾病发病风险预测的CatBoost算法和贝叶斯网络

模型分析

王爱民1,王凤琳1,黄一铭1,徐雅琪1,张文婧1,丛显铸1,苏维强1,王素珍1,高梦瑶1,李爽1,

孔雨佳1,石福艳1,陶恩学2

(1.山东第二医科大学公共卫生学院卫生统计学教研室,山东潍坊261053;2.山东第二医科大学基础

医学院,山东潍坊261053)

[[摘要]]目的目的::筛选影响心脑血管疾病发病的主要特征变量,基于排序前10位的特征变量构建心

脑血管疾病发病风险贝叶斯网络模型,为心脑血管疾病发病风险预测提供参考。方法方法::从英国生物样

本(UKBiobank)数据库中纳入315896例参与者和相关变量,通过类别型特征提升(CatBoost)算

法进行特征选择,将所有参与者按7∶3比例随机分为训练集和测试集,并基于最大最小爬山

(MMHC)算法构建贝叶斯网络模型。结果结果::本研究中人群心脑血管疾病患病率为28.8%。CatBoost

算法筛选的排名前10位变量分别为年龄、体质量指数(BMI)、低密度脂蛋白胆固醇(LDL-C)、总胆固

醇(TC)、甘油三酯-葡萄糖(TyG)指数、家族史、载脂蛋白A/B比值、高密度脂蛋白胆固醇(HDL-C)、

吸烟状态和性别。CatBoost训练集模型受试者工作特征(ROC)曲线下面积(AUC)为0.770,模型

准确性为0.764;验证集模型AUC为0.759,模型准确性为0.763。临床效能分析,训练集阈值范围

为0.06~0.85,验证集阈值范围为0.09~0.81。心脑血管疾病发病风险贝叶斯网络模型分析,年龄、

性别、吸烟状态、家族史、BMI和载脂蛋白A/B比值与心脑血管疾病直接相关,是心脑血管疾病发生

的重要风险因素,TyG指数、HDL-C、LDL-C和TC通过影响BMI和载脂蛋白A/B比值间接影响心

脑血管疾病的发生风险。结论结论::控制BMI、载脂蛋白A/B比值和吸烟行为,可以降低心脑血管疾病的

发病风险。贝叶斯网络模型可用于预测心脑血管疾病发病风险。

[[关键词]]心脑血管疾病;CatBoost算法;贝叶斯网络;风险推理

[[中图分类号]]R54;R743[[文献标志码]]A

CatBoostalgorithmandBayesiannetworkmodelanalysis

basedonriskpredictionofcardiovascularand

cerebrovasculardiseases

WANGAimin1,WANGFenglin1,HUANGYiming1,XUYaqi1,ZHANG

显示全部
相似文档