第五章 单个样本数据参数估计.doc
文本预览下载声明
第五章 单个样本数据的参数估计
一、均数(率)的抽样误差
在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,由于抽样而产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。在抽样研究中,抽样误差是不可避免的,只要存在抽样,就有抽样误差;因为抽样误差产生的根本原因是客观存在的个体变异。
(一)样本均数标准误
从正态总体N((, (2)中,随机抽取样本含量为n的若干样本,各样本均数的分布服从正态分布N((,),各样本均数的总体均数为( ,标准差为。 可按下列公式计算
为样本均数的标准差,又称为标准误,它反映了样本均数之间的离散程度,也反映了均数抽样误差的大小。
在实际应用中,总体标准差( 常常未知,需要用样本标准差s来估计。因此均数标准误的估计值为
由公式,当样本含量n固定时,均数的标准误与标准差成正比;当标准差固定时,均数的标准误与样本含量n的平方根成反比,即在同一总体中随机抽样,样本含量n越大,抽样误差越小。所以在实际工作中减小均数抽样误差的一个重要途径是增加样本含量n。
(二)率标准误
从一个阳性率为 ( 的总体中,随机抽取样本含量为n的若干个样本,得到各样本率之间的差异以及样本率与总体率的差异,用率的标准差,又称率的标准误来描述。
样本率p 的标准差,它反映了样本率之间的离散程度;也反映了率抽样误差的大小。
在实际应用中,总体率( 常常未知,需要用样本率p作为总体率 ( 的估计值 。
二、t分布的特征
t 分布是一簇曲线,因为t值的分布与自由度( 有关。其图形有如下特征:
以0为中心,左右对称的单峰分布。
自由度( = n(1越小,则t值越分散,曲线变得越低平,尾部翘得越高。
③随着自由度( 逐渐增大时,t分布逐渐逼近标准正态分布;当( 趋于( 时,t分布就完全成为标准正态分布。
t界值表与自由度 ( 有关。在相同自由度时│t│值越大,概率P越小;在相同t值时,双侧概率P为单侧概率P的两倍。
三、参数估计的概念
抽样研究的目的是用样本的信息推断总体特征,这叫统计推断。统计推断包括:参数估计和假设检验。参数估计是指用样本指标(称为统计量)估计总体指标(称为参数)。
用样本均数估计总体均数以及用样本率估计总体率。
点估计
直接用样本的统计量估计总体参数的估计值的方法称为点估计。
点估计的方法简单,但缺点是没有考虑抽样误差,而抽样误差在抽样研究中是不可忽视的。
区间估计
区间估计:按一定的概率估计总体参数所在的范围的方法。
可信区间:总体参数的所在范围,该区间以一定的概率(如95%或99%)包含总体参数。
四、可信区间的计算
总体均数可信区间的计算
根据总体标准差( 是否已知及样本含量n的大小,总体均数可信区间的计算有t分布和u分布(标准正态分布)两种方法。
t分布方法
当总体标准差(未知时,根据t分布的原理得到总体均数可信区间为
((t(/2, ( ,+ t(/2, ()或缩写为( t(/2, (
u分布方法
(1)当总体标准差( 已知时,根据u分布的原理得到总体均数可信区间为
((u(/2,+ u(/2)或缩写为( u(/2
即总体均数的95%可信区间为(1.96,99%可信区间为(2.58。
(2)当( 未知但n足够大时(n ( 50),t分布近似u分布,可以用u(/2代替t(/2, (,
总体均数可信区间为:
((u(/2,+ u(/2)或缩写为( u(/2
即总体均数的95%可信区间为(1.96,99%可信区间为(2.58。
总体率可信区间的计算
根据样本含量n和样本率p的大小,可以采用查表法和正态近似法。
第六章 样本均数比较的假设检验
一、假设检验的基本原理和基本步骤
建立检验假设,确定检验水准
1.建立检验假设:
①无效假设,H0。例6.1 H0:μ=μ0,两总体均数相等。
②备择假设,H1。例6.1 H1:(((0,两总体均数不相等。有时为单侧检验。
2.确定检验水准:检验水准,(。( 是预先规定的概率值,它是“是否拒绝H0的界限”。研究者可以根据研究目的规定(的大小,通常(取0.05。
选定检验方法,计算检验统计量
要根据统计推断的目的、研究设计的类型和样本量的大小等适用条件,选用不同的检验方法和计算相应的统计量。
3.确定P值,作出推断结论
P值是指从H0所规定的总体中作随机抽样,获得等于及大于(或等于及小于)现有样本的检验统计量值(如t值或u值)的概率。
将概率P与检验水准(比较,从而得出结论:
当P ( ( 时,按所取检验水准(,拒绝H0,接受
显示全部