第三章重要的概率分布.doc
文本预览下载声明
第三章 重要的概率分布
正态分布;
分布;
t分布;
F分布。
3.1 正态分布
对于连续型随机变量而言,正态分布(normal distribution)是最重要的一种概率分布。
经验表明:对于依赖于众多微小因素;且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。
如人的体重,因为遗传、骨骼结构、饮食、锻炼、等都对人的体重有影响,但又没有一种因素起到压到一切的主导作用。与此相类似,人的身高、考试分数等都近似地服从正态分布。
通常用:
X~N(u, ) (3 - 1)
表示随机变量X服从正态分布。N表示正态分布,括号内的参数u, 称为正态分布的总体均值(或期望)和方差。
3.1.1 正态分布的性质
(1) 正态分布曲线以均值u为中心,对称分布。
(2) 正态分布的概率密度函数呈中间高、两边低,在均值u处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。
(3) 正态曲线下的面积约有68%位于u ±两值之间;约有95%的面积位于u±2之间;而约有99.7%的面积位于u±3之间。
★ (4) 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。
令X和Y相互独立:
X~N(uX,)
Y~N(uY,)
现在考虑两个变量的线性组合:W=a X+b Y
则 W~N(uW,) ( 3 - 2 )
其中,
uW =(auX+buY) ( 3 - 3 )
= (+) (3 - 4)
例3.1
令X表示在下沙高教区一花店每日出售玫瑰花数量, Y表示在下沙镇一花店每日出售玫瑰花的数量,假定X和Y服从正态分布,且相互独立,并有:
X~N( 100,64 ),Y~N( 150,81 )
求两天内两花商出售玫瑰花数量的期望及方差?
W=2X+2Y
根据式( 3 - 3 )
E(w)=E( 2X+ 2Y) = 5 0 0,
Var (w) = 4var(X) + 4var(Y) = 5 8 0
因此,W服从均值为5 0 0,方差为5 8 0的正态分布,即W~N( 5 0 0,5 8 0 )。
★★3.1.2 标准正态分布
两个正态分布可能因为期望或方差的不同,或是期望和方差均不同而相区别。如何比较各种不同的正态分布呢?
定义一个新的变量Z:
如果变量X的均值为u,方差为,则根据式(3 - 4),变量Z的均值为0,方差为1。称之为标准正态变量(standard normal variable) 。
即若X~N(u,),那么变量Z就是标准正态变量,用符号表示为:
Z~N(0,1) (3 - 5)
证明:
均值为0
因为有E (aX+b) = a E(X) + b,所以
(2)方差为1
因为有var ( aX +b ) = a2var ( X ) ,所以
图3 - 3a和3 - 3b分别给出标准正态分布的概率密度函数和累积分布函数。
例3.2
变量x表示花房每日出售的玫瑰花量,假定它服从均值为70、方差为9的正态分布,即X~N( 70,9 ),求任给一天,出售玫瑰花数量大于75支的概率。
服从标准正态分布,求P(Z 1 . 6 7 )。
从附录表可知, Z位于区间( 0 , 1.3 )的概率为0.4032,位于( 0,2.5 )的概率为0.4938。由正态分布的对称性可知,Z位于区间(-1.3 , 0 )的概率也为0.4032,位于(-2.5 , 0 )的概率为0.4938。由于这种对称性,在标准正态分布表中一般仅给出Z取正值的情形。也就是说,标准正态密度函数,在Z=0的左右面积均为0.5,整个面积(或概率)为1。
根据正态分布表得:
P( 0≤Z≤1.67)=0.4525
因此,
P(Z1.67)=0.5000-0.4257=0.0475
即每天出售玫瑰花的数量超过75支的概率为0.0475。(参见图3-3a )
例3.3
继续例3. 2 ,现假定要求每天出售玫瑰花数量小于或等于7 5支的概率。
概率为: 0.500 0+0.452 5=0.952 5 (见图3-3b )。
例3.4
求每天出售玫瑰花数量在在65与75支之间的概率。
查表得,
P(-1.67≤Z≤0)=0.4525
P(0≤Z≤1.67)=0.4525
由正态分布的对称性得到,
P(-1.67≤Z≤1.67)=0.9050
即每天出售面包的数量介于65条与75条之间的概率约为90.5% (见图3-3a )。
上面的例子表明:一旦知道某一正态变量的期望与方差,先将其转化为标准正态变量,然后根据正态分布表求得相应的概率。
★★3.2样本
显示全部