概率论中的大数定律及中心极限定理.doc
文本预览下载声明
概率论中的大数定律及中心极限定理
唐南南
摘要 概率论是从数量上研究随机现象的规律的学科,概率论的特点是先提出数学模型,然后去研究它的性质,特点和规律。它在自然科学,技术科学和社会科学等科学中有广泛的应用。而大数定律和中心极限定理的内容是概率论中极限理论极为重要的一部分内容。在这篇文章中,我们从贝努力试验中的频率出发,讨论了独立随机变量和分布的极限问题。在一定条件下,这些分布弱收敛于退化分布,这就是大数定律。在另一些条件下,这些分布弱收敛于N(0,1)分布,这一类收敛于N(0,1)分布的定理统称为中心极限定理.大数定律说明了随机现象都具有稳定性而中心极限定理是研究相互独立随机变量序列的部分和的分布,在适当条件下向正态分布收放的问题。在这篇文章里,我们只介绍了一些定理的提出,内容以证明以及在其他学科上的应用,而大数定律和中心极限定理还有许多更深入,更广泛的内容,限于篇幅这里就不再介绍了。掌握定理的结论是重要的,这些结论一方面使频率稳定于概率,n次观察的算术平均值稳定于数学期望都有了明确的含义和理论依据;另一方面,又将给数理统计中大样本的统计推断等提供理论依据。
关键词 大数定律 中心极限定理 随机现象 随机变量
引言
大数定律和中心极限定理是概率论中重要的一部分内容,但对读者来说,多数人对于这部分内容感到很难掌握,这篇文章就是对这部分内容进行浅入的分析,但对其内容进行详细的说明,而且进行了归纳性的总结,指出了各定律之间的联系及其差别,希望通过本篇文章内容的介绍,能使读者对于这部分知识有一个清晰的印象,能整体地把握这部分内容。
一 、大数定律
(一)、问题的提法(大数定律的提法)
重复实验中事件的频率的稳定性,是大量随机现象的统计规律性的典型表现。人们在实践中认识到频率具有稳定性,进而由频率的稳定性预见概率的存在;由频率的性质推断概率的性质,并在实际应用中(当n充分大时)用频率的值来估计概率的值。这些都是概率的公理化定义的实际背景。概率的概念以及在此基础上建立的理论应该与实际相符合。因此,我们需要对频率的稳定性这一实际作理论的说明。
其实,在大量的随机现象中,不但事件的频率具有稳定性,而且大量随机现象的平均结果一般也具有这稳定性:单个现象的行为对大量随机现象共同产生的总平均效果几乎不发生影响,这就是说,尽管单个随机现象的具体实现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消,补偿和拉平,致使总的平均结果趋于稳定。例如,在分析天平上称量一质量为u的物品,以……,表示n次重复测量的结果。经验告诉我们,当n充分大时,它们的算术平均值对u的偏差却很小,而且一般n越大,这种偏差越小。如果把一连串的观察结果……,看成随机变量,则上述直观现实表明,当n充分大时,在一顶的收敛意义下,有,它就是大量随机现象的平均结果稳定性的数学表达式。
频率的稳定性也可以表达成这种形式。为此令
i=1,2……,n。
那么,是n次试验中A出现的频数。频率的稳定性指的是随着n无限增大,频率趋于稳定概率附近,即在一定的收敛意义下。概率论中,一切关于大量随机现象的平均结果稳定性的定理,统称为大数定律,按收敛性的含义不同,大数定律有弱大数定律和强大数定律之分。
(二)、大数定律的内容及证明
在证大数定理时,我们经常用到著名的切比雪夫不定式,首先我们来讲这个不定式。
设随机变量X有期望和方差,则对于任意 0,有或
证明:(1):
x是离散型随机变量的情形。
()
(2)x是连续随机变量的情形。
设x的密度函数是,则有
积分区域如图:
P(x)
E(x)- E(x) E(x)+
由于
即 于是有
切比雪夫不定式给出了在随机变量x的分布未知的情况下,对事件
(或事件的概率的一种估计方法。例如在式子中令,并令,则有()
式子给出了离差不小于的概率的上界,而式子给出了离差不小于的概率的下界,而且二个式子对任何具有方差的随机变量都成立。从第二个式子中又可以看到,越小,概率就越大,说明x取值集中于其期望周围的程度越高;越大,概率就越小,说明x取值集中于平均值附近的程度越低,这就使我们方差定义的含义有了进一步的理解。
对小麦品种做发芽试验,种子发芽的概率未知,问要用多少颗小麦做试验才能认为发芽的概率与P相差不超过1/10的概率达到95%?
解:用Sn表示试验的n颗种子中发芽的颗数,则发芽的频率是,我们要确定n,使得n满足或。
因为Sn服从二项分布,所以,E(Sn)=nP, D(Sn)=nP(1-P).
又因为P(1-P)=-P2+P
显示全部