统计学抽样与抽样分布.ppt
*二、抽样误差?实际应用中,有三个密切联系而又相互区别的抽样误差的概念实际抽样误差抽样平均误差抽样极限误差第29页,共67页,星期日,2025年,2月5日*二、抽样误差(二)抽样平均误差(抽样标准误)抽样平均误差是反映抽样误差一般水平的指标(因为抽样误差是一个随机变量,它的数值随着可能抽取的样本不同而或大或小,为了总的衡量样本代表性的高低,就需要计算抽样误差的一般水平)。通常用样本估计量的标准差来反映所有可能样本估计值与其中心值的平均离散程度。第30页,共67页,星期日,2025年,2月5日*二、抽样误差(二)抽样平均误差?抽样平均误差可衡量样本对总体的代表性大小。即:抽样平均误越小,则样本估计量的分布就越集中在总体参数的附近,平均来说,样本估计值与总体参数之间的抽样误差越小,样本对总体的代表性越大。第31页,共67页,星期日,2025年,2月5日*抽样平均误的计算公式在总体方差已知,总体单位总数为N,样本容量为n,简单随机抽样条件下,抽样平均误的计算公式为:重复抽样不重复抽样估计均值估计成数总结影响抽样误差大小的四因素。第32页,共67页,星期日,2025年,2月5日*二、抽样误差(三)抽样极限误差抽样极限误差是指一定概率下抽样误差的可能范围,也称为允许误差。用Δ表示,由定义知其表达式:在一定概率下,上式表示,在一定概率下可认为样本估计量与相应的总体参数的误差的绝对值不超过。第33页,共67页,星期日,2025年,2月5日*抽样极限误差用、分别表示平均数和比率(成数)的抽样极限误差,则在一定概率下有:估计均值的置信区间:估计成数(比例)的置信区间:第34页,共67页,星期日,2025年,2月5日*对抽样极限误差的解释:抽样极限误差是抽样误差的可能范围,而不是完全肯定的范围。所以,这一可能范围的大小是与其估计的可靠程度的大小(即概率)紧密联系的。在抽样估计中,这个概率叫置信度,习惯上也称为可靠程度、把握程度或概率保证程度等,用1-α表示。显然在其他条件不变的情况下,抽样极限误差越大,相应的置信度也就越大。第35页,共67页,星期日,2025年,2月5日*抽样误差率:?与抽样极限误差相关的两个概念是:抽样误差率和抽样估计精度抽样误差率=(抽样极限误差/估计量)×100%抽样估计精度=100%-抽样误差率第36页,共67页,星期日,2025年,2月5日*估计精度(准确性)与可靠程度的关系:估计精度与估计的可靠程度是矛盾的。也就是说,如果精度很高,则会由于估计区间太窄而使错误估计的可能性大增,从而大大降低估计的可靠程度,使估计结果没有多大的作用;如果置信度很高,则意味着允许误差范围较大,而使估计精度太低,这时尽管估计的可靠程度接近或等于100%,但抽样估计本身也会失去意义。实际中,只能依据具体情况,先满足一方面,然后确定另一方面。第37页,共67页,星期日,2025年,2月5日*抽样分布的概念?样本指标是一种随机变量,它有若干可能取值,每个可能取值都有一定的可能性(即概率),从而形成它的概率分布,即统计上所谓的抽样分布。简言之,抽样分布就是指样本统计量的概率分布。样本统计量是由n个随机变量构成的函数,故抽样分布属于随机变量函数的分布。第38页,共67页,星期日,2025年,2月5日*一、抽样分布的概念举例:四名学生的月生活费支出(480,560,720,800元)。现按不重复取样的方法,随机抽取两位构成一个样本,则全部可能的样本及其各样本的均值如下表所示:第39页,共67页,星期日,2025年,2月5日*序样本变量样本平均数平均数离差离差平方
x-E()[-E()]2
1480,560520-12014400
2480,720600-401600
3480,80064000
4560,480520-12014400
5560,72064000
6560,800680401600
7720,480600