假设检验的基本步骤.doc
文本预览下载声明
假设检验的基本步骤
(二)假设检验的基本步骤
统计推断
建立假设检验,确定检验水准
H0和H假设都是对总体特征的检验假设,相互联系且对立。
H0总是假设样本差别来自抽样误差,无效 /零假设
H是来自非抽样误差,有单双侧之分,备择假设。
检验水准,a= 0.05
检验水准的含义
选定检验方法,计算检验统计量
选择和计算检验统计量要注意资料类型和实验设计类型及样本量的问题,
一般计量资料用t检验和u检验;
计数资料用X 2检验和u检验。
确定P值,作出统计推理
pw a,拒绝H0,接受H1
P a,按a= 0.05水准,不拒绝H0,无统计学意义或显著性差异
假设检验结论有概率性,无论使拒绝或不拒绝 H0,都有可能发生错误
两均数的假设检验(各种假设检验方法的适用条件及假设的特点、 计算公式、
自由度确定以及确定概率 P值并做出推断结论)
u检验适用条件
t检验适用条件
t检验和u检验
?样本均数与总体均数比较
配对资料的比较/成组设计的两样本均数的比较
配对设计的情况:3点
两个样本均数的比较
两个大样本均数比较的 u检验
两个小样本均数比较的 t检验
假设检验的两类错误及注意事项(I和H类错误)
两类错误
拒绝正确的H0称I型错误—弃真,用检验水准a表示,a= 0.05,犯I型错误概率
为0.05,理论上平均每100次抽样有5次发生此类错误;
接受错误的Ha称H型错误—存伪。用卩表示,(1—3 )为检验效能或把握度,意 义为两总体有差异,按a水准检出差别的能力, 1—3= 0.9,若两总体确有差别,理论
上平均每100次抽样有90次得出有差别的结论。
两者的关系:a愈大3愈小;反之a愈小3愈大。
假设检验中的注意事项
随机化:代表性和均衡可比性
选用适当的检验方法
正确理解统计学意义
结论不绝对
单侧与双侧检验的选择
四?分类变量资料的统计描述
相对数常用指标及其意义
率
构成比
相对比
相对数应用注意事项
?观察例数要足够多
?不能犯以比代率的错误
?计算加权平均率或合并率
?可比性,消除混杂因素的影响(可采用标准化方法或分层分析方法。)
6 ?样本估计总体,假设检验
分类变量资料的统计推断
率的抽样误差、总体率的可信区间及其估计方法
率的抽样误差与标准误
率的标准误计算
2 ?总体率的可信区间及估计方法
正态近似法:n足够大,P或1-P均不太小,nn和n(1- n )均大于5,或nP 和n(1-P)均大于5
95%可信区间:P± 1.96Sp
99%可信区间:P± 2.58Sp
查表法n较小,nW 50, P接近于0或1
u检验和x 四格表资料的x 检验R行C
四格表资料的x 检验
R行C列的理论数:Trc =(n r x n c)/ n
n40且每个格子T5,可用基本公式或专用公式,不用校正;
n40但是出现只要有一个格子 1T5,用校正值公式
n40,或T1,用直接概率法
配对四格表资料的x 2检验
两个率的比较米用u检验,亦可米用x 2检验,两者关系为u2=x 2°
行X列表资料x 2检验
R2 , C=2; R2, C2
多个率比较,若x 2x 2a(v) , PVa结论拒绝H)时,只能说明总体率之间没有差别
u检验:适用条件
样本率与总体率比较
两个样本率比较
x 2检验
(1)X 2检验
适用范围:两个及两个以上率或构成比的比较;两分类变量间相关关系分析 四格表资料
四格表资料基本数据的构成, 一定是相互对立的两组数据。四格表资料自由度永远
为1。
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d
但不能认为它们彼此之间都有差别。
注意事项:2点
直线相关和回归
(一) 直线相关分析用途、相关系数和意义
用途
相关系数r :描述两随机变量是否具有直线型关系、关系的方向和密切程度。
r为正,说明X与Y为正相关,变化趋势同向
r为负,说明X与Y为负相关,变化趋势反向
(二) 直线回归分析的作用、回归系数及意义
1?作用:研究两个连续变量 X与Y之间的数量依存关系,找出最合适的直线回归方 程
直线回归方程
Y= a+bX
a为截距
回归系数b:即斜率,描述变量 X每变化一个单位,Y平均改变b个单位。
相关系数确定直线回归方程的原理是最小二乘法, 即保证各实测点至回归直线的纵
向距离平方和最小。
回归系数的统计学意义,确定回归方程的原理。
统计表和统计图
(一) 统计表的基本结构和要求 标题、标目、线条、数字、备注
(二) 统计图型的选择 选择
连续性资料一一线图,最大值和最小值相差悬殊一一半对数线图
连续性资料,用升降表示动态变化速度一一半对数线图
数值变量频数表——直方图
资料相互独立一一直条图
百分构成比一一圆形图或百分直条图
双变量连续性资料一一散点图
地区性资料一统计地图
2.制图通则
正
显示全部