临床大数据挖掘 PPT.pptx
临床大数据挖掘;背景;全面推进健康中国建设:把保障人民健康放在优先发展的战略位置,……为人民提供全方位全生命期健康服务。
——《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》;精准医学
根据患者特征进行疾病预防和诊疗
对不同疾病易感性
疾病的发生及预后
对特定治疗的反应;GoogleFluTrends:检索词;临床数据;临床数据;临床数据;临床数据;TauxeW.Nature2015,527(7578):S102-S103;古埃及;~1000;1894;1975;1990、1995;1990、1995;2000;2000;2002;分类;数据挖掘:方法进展;2020~;研究范例
;研究范例
结构化数据;GilbertT,etal.Lancet.2018,391(10132):1775-1782;背景:老龄患者的衰弱风险评分;背景;三个主要步骤来建立和验证该评分体系;三个主要步骤来建立和验证该评分体系
能否根据ICD-10编码和资源消耗识别出具有衰弱特征的老年患者
用ICD-10编码构建评分???统来表征上述具有衰弱特征的患者人群
测试构建的医院衰弱风险评分能否预测急诊入院后的不良结局,以及是否和其他临床使用的衰弱工具识别出来的患者相似;方法和结果:;方法和结果:;方法和结果:;方法和结果:;GilbertT,etal.Lancet.2018,391(10132):1775-1782;;方法和结果:;;;步骤二:
用ICD-10编码构建评分系统来表征上述具有衰弱特征的患者人群
风险分层:
因变量:是否属于“衰弱”这个聚类(二分类变量)
自变量:ICD-10编码(二分类变量;在衰弱组患病率高于非衰弱组2倍及以上的诊断);GilbertT,etal.Lancet.2018,391(10132):1775-1782;;步骤二:
用ICD-10编码构建评分系统来表征上述具有衰弱特征的患者人群
风险分层:
因变量:是否属于“衰弱”这个聚类(二分类变量)
自变量:ICD-10编码(二分类变量;在衰弱组患病率高于非衰弱组2倍及以上的诊断)
Logistic回归:是否为衰弱的聚类类别(因变量)、ICD-10诊断(自变量);步骤二:
用ICD-10编码构建评分系统来表征上述具有衰弱特征的患者人群
风险分层:
因变量:是否属于“衰弱”这个聚类(二分类变量)
自变量:ICD-10编码(二分类变量;在衰弱组患病率高于非衰弱组2倍及以上的诊断)
Logistic回归:是否为衰弱的聚类类别(因变量)、ICD-10诊断(自变量)
惩罚系数:处理自变量间的自相关性;步骤二:
用ICD-10编码构建评分系统来表征上述具有衰弱特征的患者人群
风险分层:
因变量:是否属于“衰弱”这个聚类(二分类变量)
自变量:ICD-10编码(二分类变量;在衰弱组患病率高于非衰弱组2倍及以上的诊断)
Logistic回归:是否为衰弱的聚类类别(因变量)、ICD-10诊断(自变量)
惩罚系数:处理自变量间的自相关性
模型评价:cstatistic;步骤二:
用ICD-10编码构建评分系统来表征上述具有衰弱特征的患者人群
风险分层:
因变量:是否属于“衰弱”这个聚类(二分类变量)
自变量:ICD-10编码(二分类变量;在衰弱组患病率高于非衰弱组2倍及以上的诊断)
Logistic回归:是否为衰弱的聚类类别(因变量)、ICD-10诊断(自变量)
惩罚系数:处理自变量间的自相关性
模型评价:cstatistic
医院衰弱风险评分
低、中、高风险(5,5~15,15);步骤三:
测试构建的医院衰弱风险评分
验证:
全国数据(2014.4~2015.3)
Logistic回归:指标:30天死亡率,是否发生长时间住院(10天),出院30天内急诊再入院(校正:年龄,年龄,社会经济学指标,住院病史,Charlson共病指数,医院);与最低风险评分组的患者比较(n=429762,42·4%),最高风险评分组患者(n=202718,20·0%)的30天死亡率(OR1·71,95%CI1·68–1·75)、长时间住院(OR6·03,95%CI5·92–6·10)和30天再入院率(OR1·48,95%CI1·46–1·50)风险升高。;;研究范例
非结构化数据;LiangH.etal.NatMed.2019,25(3):433-438;背景:临床诊断思维;背景:临床诊断思维;方法和结果:;方法和结果:;方法和结果:NLP模型建立;;方法和结果:分级多分类诊断模型;方法和结果:分级多分类诊断模型;方法和结果