文档详情

概率论及数理统计随机变量的数字特征.ppt

发布:2017-04-18约9.67千字共124页下载文档
文本预览下载声明
若X1,X2, …,Xn两两独立,,上式化为 D(X+Y)= D(X)+D(Y)+ 2Cov(X,Y) 4. 随机变量和的方差与协方差的关系 协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受X与Y本身度量单位的影响. 例如: Cov(kX, kY)=k2Cov(X,Y) 为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 . 二、相关系数 为随机变量X和Y的相关系数 . 定义: 设D(X)0, D(Y)0, 称 在不致引起混淆时,记 为 . 若 则称X与Y不相关 相关系数的性质: 证: 由方差的性质和协方差的定义知, 对任意实数b,有 0≤D(Y-bX)= b2D(X)+D(Y)-2b Cov(X,Y ) 令 ,则上式为 D(Y- bX)= 由于方差D(Y)是正的,故必有 1- ≥ 0,所以 | |≤1。 2. X和Y独立时, =0,但其逆不真. 由于当X和Y独立时,Cov(X,Y)= 0. 故 = 0 但由 并不一定能推出X和Y 独立. 请看下例. 例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, (请课下自行验证) 因而 =0, 即X和Y不相关 . 但Y与X有严格的函数关系, 即X和Y不独立 . 不难求得, Cov(X,Y)=0, 例2.设随机变量X的概率密度为 试证 X与 不相关,但不独立. 证明: 对任意常数a有: 从而X与 不独立. 存在常数a,b(b≠0), 使P{Y=a+bX}=1, (详细证明自看,见教材 .) 即X和Y以概率1线性相关. 考虑以X的线性函数a+bX来近似表示Y, 以均方误差 e =E{[Y-(a+bX)]2} 来衡量以a+bX近似表示Y的好坏程度, e值越小表示 a+bX与Y的近似程度越好. 用微积分中求极值的方法,求出使e 达到最小时的a,b . 相关系数刻划了X和Y间“线性相关”的程度. =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) e =E{[Y-(a+bX)]2 } 解得 这样求出的最佳逼近为 L(X)=a0+b0X 这样求出的最佳逼近为L(X)=a0+b0X 这一逼近的剩余是 若 =0, Y与X无线性关系; Y与X有严格线性关系; 若 可见, 若0| |1, | |的值越接近于1, Y与X的线性相关程度越高; | |的值越接近于0, Y与X的线性相关程度越弱. E[(Y-L(X))2]= D(Y)(1- ) 下面四个是等价的: 但对下述情形,独立与不相关等价 若(X,Y)服从二维正态分布,则 X与Y独立 X与Y不相关 前面,我们已经看到: 若X与Y独立,则X与Y不相关, 但由X与Y不相关,不一定能推出X与Y独立. 例2 设随机变量X和Y相互独立且X~N(1,2), Y~N(0,1). 试求Z=2X-Y+3的概率密度. 故X和Y的联合分布为正态分布,X和Y的 任意线性组合是正态分布. 解: X~N(1,2),Y~N(0,1),且X与Y独立, D(Z)=4D(X)+D(Y)=8+1=9 E(Z)=2E(X)-E(Y)+3=2+3=5 即 Z~N(E(Z), D(Z)) Z~N(5, 32) 故Z的概率密度是 Z~N(5, 32) 这一讲我们介绍了协方差和相关系数 相关系数是刻划两个变量间线性相关程度 的一个重要的数字特征. 注意独立与不相关并不是等价的. 当(X,Y)服从二维正态分布时,有 X与Y独立 X与Y不相关 若二维随机变量(X,Y)具有概率密度 记作( X,Y)~N( ) 则称( X,Y)服从参数为 的二维正态分布. 其中 均为常数,且 第四讲 二维正态分布 二维正态分布的两个边缘密度仍是 正态分布 . 留给同学们自己证明. 可以证明,对二维正态分布,已知 X=x下,Y 的条件分布,或者已知 Y=y下,X的条件分布都仍是正态分布. 概率论与数理统计是研究随机现象统计规律性的学科. 随机现象的规律性只有在相同的条件下进行大量重复试验时才会呈现出来. 也就是说,要从随机现象中去寻求必然的法则,应该研究大量随机现象. 第五讲 大数定
显示全部
相似文档