抽样与参数估计.pptx
第六章抽样分布与假设检验6.1抽样与抽样分布6.2假设检验的基本方法6.3总体均值的假设检验
抽样推断是根据观测到的样本数据对总体作出推测,这种推测伴随某种不确定性,需要用概率来表示其可靠程度,这是统计推断的一个重要特点。
总体均值、比例、方差等总体样本样本统计量例如:样本均值、比例、方差
二、抽样方式、方法
抽取样本的方式重复抽样:也叫放回抽样,抽样过程中总体单位的总数不变,每个抽中单位有再次被抽中的可能在重复试验中,样本可能个数是Nn。不重复抽样:也叫无放回抽样,每个单位只有一次被抽中的机会,总体单位数不断减少。
简单随机抽样01.分层抽样01.整群抽样01.系统抽样01.多阶段抽样01.概率抽样01.方便抽样01.判断抽样01.自愿抽样01.滚雪球抽样01.配额抽样01.非概率抽样01.抽样方法01.抽样方法
三、抽样分布(一)样本均值的抽样分布
从一个总体进行随机抽样:从无限总体中可抽取无限多个随机样本。从容量为N的有限总体:样本容量为n,有Nn个所有可能样本。每个样本可得一平均数:,构成一新的总体,平均数为新总体的变量。每一平均数会有差异,所以平均数新总体也有其分布,称为平均数的抽样分布。
从一个正态总体抽出的随机样本的平均数分布01总体标准差已知时的平均数分布-U布02从一个正态总体抽出的随机样本,无论样本容量大小,其样本平均数的抽样分布必呈正态分布03
若总体不是正态分布,但具有一定量的μ和σ2,只要样本容量n足够大(一般n30),从总体抽出的样本平均数也近似地服从正态分布N(μ,σ2/n),称为中心极限定理。
01该抽样分布的平均数与母总体的平均数相等该抽样分布的方差与母总体方差间存在如下关系:02即:
标准化:01其中,n为样本容量,是样本平均数分布的标准差,称为标准误(差),可以度量抽样分布的变异02
例:从N=3(2,4,6),以n=1,2,4,8复置抽样
n=1n=2n=4n=8ffff2122122.0122.00122.258182.54102.5036902.751123083263.010303.002667983.2550416383.516563.5078427443.751016381041443124.019764.001251516724.5078435284.75504239452105.010505.0026613305.251125885.54225758466166166.0166.00166总和31293681324656126244均数12/3=(4)36/9=(4)324/81=(4)26244/6561=(4)方差8/34/32/31/3
总体标准差未知(或虽然总体标准差已知,但总体不呈正态,且n较小)时的平均数分布-t分布总体σ2未知,可以用样本标准差代替总体标准差,标准化变量不服从正态分布,而是服从自由度为n-1的t分布020103
其中,为标准误。
t分布也是一组对称密度函数曲线分布,它只有一个参数-自由度确定其分布。与正态曲线相比,t分布曲线稍微扁平,峰顶略低,尾部稍高。1理论上,随着自由度的增大,t分布趋于正态分布:υ30时接近正态曲线,υ=∞时,与正态曲线合一。2
。。正态分布t分布ν=40。。正态分布t分布ν=4000.10.20.30.4123-3-2-1正态分布曲线与t分布曲线的比较
t分布的平均数和标准差:
t分布的累积函数:
总体分布正态分布非正态分布大样本小样本正态分布正态分布t分布绝域和检验统计量两类错误和显著性水平原假设与备择假设备单侧检验与双侧检验6、2假设检验的基本方法
什么是假设?
(hypothesis)?对总体参数的具体数值所作的陈述总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!
什么是假设检验?
(hypothesistest)概念:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程逻辑上运用反证法,统计上依据小概率原理
原假设与备择假设
原假设
(nullhypothesis)1、用于检验的假设,以其为前提可以计算试验结果出现的概率。指总体参数与其假设值之间无实质性差异,其差异由抽样误差造成。记作:H0。2、又称“0假设”、“无效假设”3、符号?,?或??为什么叫0假设??
无效假设被否定后必须接受的假设。记作:HA也称“研究假设”符号?,??或?注:H0和HA为对立事件,即:P(H0+HA)=1备择假设(alternativ