文档详情

第四章 理论分与抽样分布.ppt

发布:2019-04-08约1.05万字共84页下载文档
文本预览下载声明
6.  事件的独立性   若事件A发生与否不影响事件B发生的可能性,则称事件A和事件B相互独立。 例如花色与产量无关的例。 三、正态分布的概率计算 ?根据正态分布的性质,变量在两个定值间取值的概率等于曲线与其x轴在该区间围成的面积。 ?因此概率的计算即正态分布概率密度函数的定积分计算。 ? 是一个曲线系统。为了一般化的应用,需将正态分布标准化。 前人已计算出从-3到3之间各个u值的FN(ui) 值,列入P357附表2。 【例如】有一批玉米种子,其发芽率为70%,如每窝播种4粒,问出苗数为2和3时的概率分别为多少? 三 二项总体的抽样分布 (一) 二项总体的分布参数 为了说明二项(0,1)总体的抽样分布特征,以总体内包含5个个体为例,每一个体,y=0或y=1。若总体的变量为:0,1,0,1,1,则总体平均数和方差为: μ=(0+1+0+1+1)/5=3/5=0.6 σ2=[(0-0.6)2+(1-0.6)2+(0-0.6)2+(1-0.6)2+(1-0.6)2]/5=0.24 σ=0.241/2 =0.49 二项总体的平均数为 μ= p 方差为 σ2= p(1-p)= pq 标准差为 其中p为二项总体中要研究的属性事件发生的概率,q=1-p。 (二) 样本平均数(成数)的抽样分布 从二项总体进行抽样得到样本,样本平均数(成数)的分布为二项式分布。样本平均数抽样分布的参数为: 平均数 μx= p 方 差 σ2x= p(1-p)/n= pq/n 标准误 σx=(pq/n)1/2 样本观察值中有“0”和“1”两种观察值,将样本观察值总加起来后除以样本容量(n)得到的平均数实际上就是“1”所占的比例数,即成数,或百分数。 (三) 样本总和数(次数)的抽样分布 从二项总体进行抽样得到样本,样本总和数(次数)的分布为二项分布。样本总和数的抽样分布参数为: 平均数 μ∑x= np 方 差 σ2∑x= npq= np(1-p) 标准误 σ∑x=(npq)1/2=[np(1-p)]1/2 [例] 棉田盲椿象危害棉株分为受害株与未受害株。假定调查2000株作为一个总体,受害株为704株。计算出受害率p=35.2%,σ=47.76%。现从这一总体抽样,以株为单位,用简单随机抽样方法,调查200株棉株,获得74株受害。观察受害率(就是成数,或者说是样本平均数)py=74/200=37.0%,试问样本平均数与总体真值的差数的概率为多少? 总体真值p=0.352,差数 = px-p=0.370-0.352=0.018 成数的标准差σx=(pq/n)1/2=0.034 二项式分布中当n大时计算比较繁复,但由于二项分布在np及np大于5时,趋近于正态分布,本例样本较大可看为正态分布,采用正态离差u查出概率。 u=(px-p)/σx =0.018/0.034=0.53 查附表3,当u=0.53,概率值为0.59,即获得这种|py-p|的概率(两尾概率)为0.59 这就说明样本估计的受害率为37.0%有代表性(可以近似代表总体的受害率)。 如果以次数资料(或称为“样本总和数资料” )表示也可得到同样效果。总体调查2000株受害株有704株,调查200株的理论次数应为 npx=200×0.352=70.4株 现观察受害株为74株(总和数), 差数=(npx-np)=70.4-74=-3.6株 u=(npx-np)/(npq)1/2= -3.6/6.754=0.53 查附表3,获得这种差数的概率为0.59。 是 的无偏估计值; 是 的无偏估计值; 以n为分母得到的样本方差 不是 的 无偏估计值; S不是 的无偏估计值; 因此,为了得到 的无偏估计值,估算样本方差时,必须以自由度df=n-1而不用n做分母。 抽样结论 二、样本平均数的分布 按上述抽样方法,再以n=4,从上述有限总体2,3,3,4中抽出全部所有样本,同样可以计算出所有样本的平均数、方差和标准差。 各种不同样本容量的样本平均数 的抽样分布 n=1 2 3 4 f 1 2 1 n=2 f 2.0 2.5 3.0 3.5 4.0 1 4 6 4 1 n=4 f 2.00 2.25 2.50 2.75
显示全部
相似文档