文档详情

2013年北京大学医学部《医学统计学基础》ppt课件合集.pdf

发布：2018-02-04约6.74万字共260页下载文档

文本预览下载声明

概论何平平北京大学医学部流行病与卫生统计学系 Tel 1.总体：总体是根据研究目的确定的同质观察单位的全体，更确切地说，是同质的所有观察单位某种变量值的集合。 2.样本：样本是从总体中随机抽取部分观察单位，其实测值的集合。所谓随机抽取亦就是总体中每一个观察单位都有同等可能性被抽到，随机抽样的目的是为了减少偏性，使样本对总体有代表性。在实际工作中经常从总体中抽取样本，目的是用样本信息来推断总体特征（即统计推断）。 3.概率：概率是描述随机事件发生的可能性大小的数值，常用P表示。所谓随机事件，亦就是在一定条件下，可能发生也可能不发生的事件。随机事件的概率在0与1之间，即0≤P≤1，常用小数或百分数表示。P越接近1，表明某事件发生的可能性越大，P越接近0，表示某事件发生的可能性越小。小概率事件：当一个事件的概率P≤0.05或P≤0.01 时，称为小概率事件。小概率事件表示某事件发生的可能性很小，在一次试验中基本上是不会发生的。 4.资料的类型：（1）数值变量又称为定量资料或计量资料，其变量值是定量的，表现为数值大小，一般有度量衡单位。（2 ）分类变量又称为定性资料，其变量值是定性的，表现为互不相容的类别或属性。有两种情况： 无序分类包括变量值取无等级顺序的二项分类或多项分类。 有序分类又称为等级资料，各类之间有程度的差别，给人以“半定量”的概念，即定性变量的变量值取有等级顺序的几类。 5.误差：（1）抽样误差是由于抽样原因引起的样本指标与总体指标间的差别。（2 ）随机测量误差（3 ）系统误差（4 ）过失误差抽样误差和随机测量误差是不能避免的，但可控制。系统误差和过失误差是可以避免的。 6.统计工作的基本步骤（1）设计（2 ）搜集资料（3 ）整理资料（4 ）分析资料 SPSS的基本数据管理功能（SPSS13.0 ）何平平北大医学部流行病与卫生统计学系 Tel 一、数据获取二、变量属性三、记录排序四、文件拆分五、筛选记录六、通过计算产生新变量七、重新赋值一、数据获取 Getting Data into SPSS 读取SPSS数据文件：*.sav , 常用的其他外部数据文件：*.xls , *.dbf , *.txt , *.dat, *.w*, *.sas7bdat, *.mdb …… 注意：医学领域常用数据库EpiData软件，先将数据文件*.rec转换为*.sps文件，然后在 SPSS的语法窗口运行，生成*.sav 文件。数据获取途径二、变量属性 Variable Properties 1.Name：变量名。允许用中文，但习惯上采用英文变量名。 2.Type：变量类型，常用数值型（Numeric ）、字符型（String ）、日期型（Date ）。 3.Width：变量宽度，默认为8。 4.Decimals：小数位数，默认为2。 5.Label：变量编码，又称为变量标签，用于注释变量名的含义。 6.Values：变量值编码，又称为变量值标签，用于注释变量值的含义。例如：变量sex ，变量标签为“性别”；变量值为1与2 ，变量值编码：1为“男性”，2为“女性”。 7.Missing：缺失值。默认为系统缺失值，用“.”表示。 8.Columns：列宽，默认为8。 9.Align：对齐方式。数值型变量默认右对齐（Right ），字符型变量默认左对齐（Left ）。 10.Measure：测度，包括三类：数值变量（Scale ），名义变量或无序分类变量（Nominal ），有序分类变量或等级变量（Ordinal ）。数据文件ex.sav （数据窗口……数据清单界面）数据清单变量清单数据文件ex.sav （数据窗口……变量清单界面）注意：一行对应一个“记录（

显示全部

相似文档