第三章第一节数据的整理与显示教案分析.ppt
文本预览下载声明
Shape Concerned with extent to which values are symmetrically distributed. Kurtosis The extent to which a distribution is peaked (flatter or taller). For example, a distribution could be more peaked than a normal distribution (still may be 慴ell-shaped). If values are negative, then distribution is less peaked than a normal distribution. Skew The extent to which a distribution is symmetric or has a tail. Values are 0 if normal distribution. If the values are negative, then negative or left-skewed. 分组数据—直方图(histogram) 用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积来表示各组的频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1 分组数据的图示(直方图的绘制) 140 150 210 直方图下的面积之和等于1 某电脑公司销售量分布的直方图 190 200 180 160 170 频 数 (天) 25 20 15 10 5 30 220 230 240 分组数据—直方图(直方图与条形图的区别) 条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的 直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义 直方图的各矩形通常是连续排列,条形图则是分开排列 条形图主要用于展示分类数据,直方图则主要用于展示数值型数据 分组数据—折线图(frequency polygon) 折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的 分组数据的图示(折线图的绘制) 折线图与直方图 下的面积相等! 140 150 210 某电脑公司销售量分布的折线图 190 200 180 160 170 220 230 240 频 数 (天) 25 20 15 10 5 30 数值型数据的图示 未分组数据—茎叶图和箱线图 未分组数据—茎叶图(stem-and-leaf display) 用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高位数值作树茎,低位数字作树叶 树叶上只保留一位数字 对于n(20? n ?300)个数据,茎叶图最大行数不超过 L = [ 10 × lg(n) ] 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 未分组数据—茎叶图(例题分析) 未分组数据—茎叶图(扩展的茎叶图) 未分组数据—箱线图(box plot) 用于显示未分组的原始数据的分布 箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成 其绘制方法是: 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 未分组数据—单批数据箱线图(箱线图的构成) 中位数 4 6 8 10 12 Q U Q L X 最大值 X 最小值 简单箱线图 未分组数据—单批数据箱线图(例题分析) 最小值 141 最大值 237 中位数 182 下四分位数 170.25 上四分位数 197 140 150 160 170 180 190 200 210 220 230 240 某电脑公司销售量数据的箱线图 分布的形状与箱线图 对称分布 Q L 中位数 Q U 左偏分布 Q L 中位数 Q
显示全部