抽样误差和统计推断.ppt
第1页,共30页,星期日,2025年,2月5日第一节抽样研究与抽样误差抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。第2页,共30页,星期日,2025年,2月5日?
均数的分布及其标准误数理统计的中心极限定理和大数定理表明:①从正态总体N(μ,σ2)中随机抽取含量为n的样本,其样本均数服从正态分布;即使从偏态总体中随机抽样,当n足够大时(如n30),样本均数也近似正态分布;②从均数为μ,标准差为σ的总体中随机抽取含量为n的样本,则样本均数的均数也为μ,样本均数的标准差为。第3页,共30页,星期日,2025年,2月5日第4页,共30页,星期日,2025年,2月5日例3-1某地随机抽取20岁健康男性20名,求得其血中葡萄糖样本均数=39.5mg/100ml,标准差S=0.69mg/100ml,问其抽样误差是多少?本例:s=0.69mg/100ml,n=20,将其代入公式得即该研究的抽样误差为0.15mg/100ml。第5页,共30页,星期日,2025年,2月5日第6页,共30页,星期日,2025年,2月5日第7页,共30页,星期日,2025年,2月5日t值的分布与自由度?有关(实际是样本含量n不同)。t分布的图形不是一条曲线,而是一簇曲线。υ=∞(标准正态分布)υ=5υ=1012345-1-2-3-4-5f(t)0.10.20.3不同自由度下的t分布图第8页,共30页,星期日,2025年,2月5日t分布的图形有如下特征:①单峰分布,以0为中心,左右对称,类似于标准正态分布。②自由度?越小,则越大,t值越分散,曲线的峰部越矮,尾部越高;③随着自由度?逐渐增大,t分布逐渐逼近标准正态分布;当?趋于?时,t分布就完全成为标准正态分布,故标准正态分布是t分布的特例。第9页,共30页,星期日,2025年,2月5日统计学家将t分布曲线下的尾部面积(即概率P)与横轴t值间的关系编制了不同自由度?下的t界值表(附表2)。t界值表:横标目为自由度?,纵标目为概率P。t临界值:表中数字表示当?和P确定时,对应的值。单侧概率(one-tailedprobability):用t?,υ表示双侧概率(two-tailedprobability):用t?/2,υ表示第10页,共30页,星期日,2025年,2月5日例如,当?=16,单侧概率P=0.05时,由表中查得单侧t0.05,16=1.746;而当?=16,双侧概率P=0.05时,由表中查得双侧t0.05/2,16=2.120。按t分布的规律,理论上有 单侧:P(t??t0.05,16)=0.05和P(t?t0.05,16)=0.05双侧:P(t??t0.05/2,16)+P(t?t0.05/2,16)=0.05第11页,共30页,星期日,2025年,2月5日更一般的表示方法如图(a)和(b)中阴影部分所示为:单侧:P(t??t?,?)=?和P(t?t?,?)=?双侧:P(t??t?/2,?)+P(t?t?/2,?)=?第12页,共30页,星期日,2025年,2月5日第13页,共30页,星期日,2025年,2月5日总体样本抽取部分观察单位统计量参数统计推断统计推断
statisticalinference如:样本均数样本标准差S样本率P如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)包括:点估计与区间估计2.假设检验(testofhypothesis)第14页,共30页,星期日,2025年,2月5日参数估计参数估计的概念参数估计:指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计(pointestimation)区间估计(intervalestimation)第15页,共30页,星期日,2025年,2月5日参数估计点估计:用样本统计量直接作为总体参数的点估计值,即直接用随机样本的样本均数作为总体均数?的点估计值,用样本频率p作为总体概