数据的图表展示解析.ppt
文本预览下载声明
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 时间序列数据—线图(line plot) 表示时间序列数据趋势的图形 时间一般绘在横轴,数据绘在纵轴 图形的长宽比例大致为10 : 7 一般情况下,纵轴数据下端应从“0”开始,以便于比较。数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断 时间序列数据—线图 (例题分析) 【例2.7】1990—2010年我国城乡居民家庭的人均可支配收入数据如表。试绘制线图 时间序列数据—线图 (例题分析) 两个变量间的关系—二维散点图(2D Scatterplots) 展示两个变量之间的关系 用横轴代表变量x,纵轴代表变量y,每组数据(xi , yi)在坐标系中用一个点表示,n组数据在坐标系中形成的个点称为散点,由坐标及其散点形成的二维数据图 温度 / 0C 降雨量/mm 产量/kg/hm2 6 25 2250 8 40 3450 10 58 4500 13 68 5750 14 110 5800 16 98 7500 21 120 8250 两个变量间的关系—二维散点图(2D Scatterplots) 两个变量间的关系—散点图矩阵(2D Scatterplots) 温度 降雨量 产量 三个变量间的关系—三维散点图(3D Scatterplots) 三个变量间的关系—气泡图(bubble chart) 显示三个变量之间的关系 图中数据点的大小依赖于第三个变量 也称为蜘蛛图(spider chart) 显示多个变量的图示方法 在显示或对比各变量的数值总和时十分有用 假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比 可用于研究多个样本之间的相似程度 多变量数据—雷达图(radar chart) ? 设有n组样本S1,S2,… , Sn,每个样本测得P个变量X1,X2 ,… , XP,要绘制这P个变量的雷达图,其具体做法是 多变量数据—雷达图(雷达图的制作) 先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示 将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图 多变量数据—雷达图 (例题分析) 【例2.9】2003年2010年我国按收入等级分城镇居民家庭平均每人全年消费性支出数据如表 多变量数据—雷达图 (例题分析) 数据类型及图示 (小结) 数据类型 品质数据 数值型数据 汇总表 原始数据 分组数据 时序数据 多元数据 条形图 饼图 茎叶图 箱线图 直方图 折线图 线图 散点图 气泡图 雷达图 环形图 2.4 合理使用图表 2.4.1 鉴别图形优劣的准则 2.4.2 统计表的设计 第 2 章 数据的图表展示 一张好的图表应包括以下基本特征 显示数据 让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况 鉴别图表优劣的准则 统计表的结构 2002~2003年城镇居民家庭抽样调查资料 项目 单位 2002年 2003年 调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均一名就业者负担人数 平均每人全部年收入 #可支配收入 平均每人消费性支出 户 人 人 % 元 元 元 元 45317 3.04 1.58 51.97 1.92 8177.40 7702.80 6029.88 48028 3.01 1.58 52.49 1.91 9061.22 8472.20 6510.94 资料来源:《中国统计年鉴2004》,中国统计出版社,2004,第359页。 注:本表为城市和县城的城镇居民家庭抽样调查资料。 行标题 列标题 数字资料
显示全部