统计学第三章分布.ppt
文本预览下载声明
本章重点 第一节 数据分布 频数分布 频率 概率 累计 分组 离散型变量:单值式(single value)、组距式(interval) 连续型变量:组距式 单值式分组可完全保留原始信息 频数分布 频数:数据分组、汇总后,各组分配到的次数 分布:各组的分配情况。用以反映数据在各组间分配的频繁程度 可以用频数分布表和直方图显示频数分布 詹姆斯 频数分布表(单值式) 直方图(单值式) 频数分布表(组距式) 直方图(组距式) 茎叶图(stem and leaf) 将数据以“茎”和“叶”整理排列以后的图 茎叶图即能保留原始信息,组数又不至于太多 茎叶图 练习 茎叶图 IQ 频数分布表 直方图 样本容量扩大 频率(relative frequency) 频率分布表 频率直方图 随机试验 随机试验 概率(probability) 概率是指事件发生的可能性 概率的统计定义:频率的极限值 可以用频率估计概率 概率的探索 连续变量可以 密度(density) 密度 累计(cumulative) 累计 累计频率(概率)和分位数 累计频数 累计频率 累计频率(组距式) 练习 计算频率和累计 质量变量的分布 质量变量只能单值式分组编制分布。其分布可以用条形图和饼形图显示 条形图(bar plot):用条形长度(高度)表示频数、频率(概率) 饼形图(pie plot):用扇形的面积(角度)表示频数、频率(概率) 受教育程度 条形图(频数) 条形图(频率) 饼形图 品牌支持率 饼形图 条形图 条形图 0-1变量 为简化问题,有些质量变量可改为0-1变量 0-1变量分布 练习 某公司从一批产品中随机抽取100件进行调查,发现其中有10件不合格 将合格品量化为1,试求该0-1变量的均值和标准差 第二节 理论分布 离散变量的分布 连续变量的分布 实际到理论 样本 变量 频率 频率密度 均值 方差 实际到理论 实际到理论 离散变量分布 离散变量要用概率分布,如果概率分布为一函数,称为概率质量函数(probability mass function, pmf) 均匀分布(uniform distribution) 0-1分布 分布表 均匀分布 分布图 均匀分布 累计分布 均匀分布 累计分布 均匀分布 均值 均匀分布 方差 均匀分布 练习 随机变量服从以下概率分布 计算该变量的概率分布表(i取到5),并根据该表绘概率分布图、计算累计概率、均值和方差 连续变量分布 连续变量要用概率密度分布,如果概率密度为一函数,也称概率密度函数(probability density function, pdf) 均匀分布 正态分布 例 均匀分布 概率密度函数图 均匀分布 累计分布 先计算概率 再累计(积分) 累计 均匀分布 累计分布函数 累计分布函数(cumulative distribution function, cdf) 累计概率 均匀分布 百分位数 累计分布函数 若F(x)为百分数,则x为第F(X)个百分位数。即分位数函数 均值 均匀分布 方差 均匀分布 练习 随机变量概率密度函数如下 计算该变量小于1、2的概率、求该变量的中位数、四分位数、均值和方差 标准正态分布 累计 查表 标准变量的百分位数 设 百分数 ,满足 则称 为标准变量第 百分位数 正态分布的标准化 如果变量服从以 为均值, 为标准差的正态分布,则 正态分布标准化 普通正态分布的概率 普通正态分布的变量可先化为标准正态分布,然后求其概率 练习 正态分布的概率 回顾 频数分布 频率、概率 密度 累计 均匀分布 正态分布及其应用 正态分布 正态分布 正态分布 正态分布 均值为0,标准差为1的正态分布称作标准正态分布(standard normal distribution) 服从标准正态分布的变量称之为标准变量(standard variable) 98 1 61 57 3 28 97 1 49 54 4 27 96 1 43 50 5 26 95 1 42 45 9 25 94 1 39 36 4 24 93 3 38 32 2 23 90 2 37 30 7 22 88 3 36 23 5 21 85 3 35 18 1 20 82 3 34 17 3 19 79 3 33 14 3 18 76 6 32 11 5 17 70 4 31 6 2 15 66 6 30 4 3 13 60 3 29 1 1 7 累计 频数 得分 累计 频数
显示全部