茆诗松概率论与数理统计教程课件第二章创新.ppt
文本预览下载声明
第七节 分布的其它特征数 除了前面介绍的数学期望和方差之外, 我们还有其它一些重要的数字特征: 1. k阶矩(kth moment) 例一. 例二. 2. 变异系数(Coefficient of Variation) 方差(或标准差)反映了变量取值的离散程度, 但在比较两个随机变量的离散程度时, 单纯比较它们的方差(或标准差)是不科学的. 分析: 单纯比较σ, 则会得出品种B比品种A整齐的结论, 显然这时不合理的, 因为品种A的均数比B大得多, 相对于120变化5的程度比相对于70变化4的程度小. 3. 中位数与分位数(median and Quantile) 数学期望EX, 即X的均值, 刻画了变量X取值的“中心位置”, 除此而外, 我们还能用别的数字特征来描述此“中心位置”, 中位数就能起到这个作用. 例三. 例四. 教材中所指的p分位数, 除特别说明, 均是指下侧p分位数, 所以有时下侧p分位数也简称为p分位数. 对于一些常用分布, 能快速准确找出其分位数, 在统计学中是十分重要的, 这些分位数是进行有关统计推断所必须的. 4. 偏度系数与峰度系数(Skewness Kurtosis) (1)当β10时,X的分布为正偏, 所谓正偏,就是正方向的尾巴特别长.见右图. (1)当β20时,意味着该分布比同均值同方差的正态分布更尖峭(尾部厚); 例六. §2.7 作业 教材第138页 习题 6, 8 * * * K阶矩 变异系数 中位数与分位数 偏度系数与峰度系数 原点矩和中心矩之间有着密切的联系. 事实上, 借助于二项展开式, 有 据此, 前四阶中心矩可用原点矩表示如下: 所以, 应使用下面定义的变异系数特征数来比较不同变量取值的离散程度. 回到刚才的例子, 所以说小麦品种A长的较为整齐. 中位数对于不存在数学期望的变量而言, 显得尤为重要. 即使对于数学期望存在的变量, 中位数也是一种相当重要的数字特征. 中位数x0.5的图形如下: 将中位数的概念加以推广, 就得到p分位数的概念. p分位数与上侧p分位数可以从图形中直观看出其意义: 一些常用的分布, 如卡方分布, t分布和F分布, 教材都特意编制了它们的分位数表, 分别列于附表3, 附表4, 附表5里, 今后我们讲授到如何用这些分布进行统计推断时再详加讨论. 下面就大家已经熟悉的正态分布, 谈谈如何求其分位数的问题. 标准正态分布的p分位数 对于给定的p, up的查找可以通过附表2, 标准正态分布函数表进行, 即进行与我们以前求概率操作的反向操作. 例如, 求0.975分位数u0.975, 先从表中的概率部分,即表中值,找出0.975, 然后再找出对应的数1.96. 所以u0.975=1.96. 同法可以找出其它常用的分位数如: u0.95=1.65, u0.99=2.33. 一般正态分布的p分位数 借助于这个关系式, 可求得任意正态分布的分位数. 例如, 求N(20,22)的0.95分位数为 x0.95=20+2u0.95=20+2*1.65=23.3 定义: 偏度系数是衡量变量X分布的偏斜程度的特征数, 简称为偏度, 记为β1,其计算公式为 (2)当β1=0时,X的分布关于其均值EX对称. (3) 当β10时,X的分布为负偏.见右图. 定义: 变量的峰度系数是衡量X分布的陡峭程度(厚尾程度)的特征数, 简称为峰度, 记为β2,其计算公式为 变量的峰度衡量变量分布的厚尾性, 而“厚尾”的程度是相对于正态分布而言的. 所以, 任何正态分布的峰度均等于0. (2)当β2=0时,意味着该分布与同均值同方差的正态分布尾部厚度相当. (3) 当β20时,意味着该分布比同均值同方差的正态分布更为平坦(尾部轻). 所以, 一个分布的峰度β2如果 即指数分布与同均值同方差的正态分布相比正偏且较为厚尾, 这可以从其密度函数曲线上较为清晰地看出来. *
显示全部