社会保障统计分析6.ppt
6.1生存分析简介
6.2寿命表分析
6.3Kaplan-Meier分析
6.4Cox回归分析;6.1生存分析简介;生存分析〔survivalanalysis〕是分析生存数据的方法,生存数据的特点是,在分析数据时所要研究的事件还未发生或过早终止,使要搜集的数据发生缺失。生存分析是将事件的结果〔终点事件〕和出现这一结果所经历的时间结合起来分析的一种统计分析方法。
生存分析与其它多元分析的主要区别就是生存分析考虑了每个观测出现某一结局的时间长短。;生存分析的主要研究内容;6.1.1生存分析根本概念;生存时间举例;;生存数据的类型;例如,某市医疗保险基金管理机构调查了2001-2005年间经手术治疗的参保大肠癌患者150例,对可能影响大肠癌术后生存时间的因素进行了调查,如性别、年龄、组织学分类、肿瘤大小、Dukes分期等。随访截止日期为2010年12月30日,
随访记录见下表。;编号性别年龄…手术日期随访终止日期随访结局生存时间(天)
1男45…2001.05.202005.06.04死亡1476
2男50…2002.01.122008.08.25死亡2417
3女36…2001.10.242004.03.18失访876+
4男52…2004.11.022010.12.30存活2250+
5女56…2004.06.252005.03.17死亡265
6女60…2003.12.052006.08.16死于其它985+
…;生存时间;6.1.1.2条件生存概率、累积生存率、生存曲线;累积生存概率〔生存函数〕观察对象经历t个单位时段后仍存活的可能性。;生存概率和累积生存率的计算;由例子可看出,累积生存率与生存概
率不同。生存概率是单个时段的
结果,而累积生存率是多个时段的累积结果。
例如,3年累积生存率是第1年存活,第2年
也存活,第3年还存活的可能性。;生存曲线〔survivalcurve〕
以观察〔随访〕时间为横轴,以累积生存率
为纵轴,将各个时间点所对应的累积生存率
连接在一起的曲线图。
生存曲线是一条下降的曲线,分析时
应注意曲线的高度和下降的坡度。平缓
的生存曲线表示高累积生存率或较长生存
期,陡峭的生存曲线表示低累积生存率或较
短生存期。;某医师收集20例脑瘤患者甲、乙两疗法
治疗的生存时间〔周??如下:
甲疗法组13371015152330
乙疗法组57+1313233030+38
424245+;6.1.1.3中位生存期;6.1.2生存资料统计学处理方法;;;;;;6.1.2.3整理资料
认真检查、核对原始数据,包括影响因素、生存时间和生存结局。
尽量防止缺失值。
建立数据库
FoxBase、Foxpro、VirualFoxpro等专业数据库
统计软件数据库〔SAS、SPSS等〕
Office办公软件中的Excel、Access;
大肠癌生存资料
序号X1X2X3X4X5X6X7时间事件
1021001028960
202100109921
3121100028110
4031101020521
5120100029750
612111118561
…
65