数据分布特征的描述.ppt
含义:每一天的销售量与平均数相比,平均相差21.58台样本标准差
(例题分析)离散系数04离散系数
(coefficientofvariation)01单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。标准差与其相应的均值之比02单击此处添加正文,文字是您思想的提炼,请尽量言简意赅地阐述观点。对数据相对离散程度的测度03用于对不同组别数据离散程度的比较计算公式为消除了数据水平高低和计量单位的影响在什么情况下使用离散系数呢?当两个数列的性质相同且均值相等的情况下用标准差说明平均数代表性的高低。当两个数列的性质不同或均值不同的情况下需要用离散系数说明平均数代表性的高低。离散系数
(例题分析)【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度Company某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0离散系数
(例题分析)536.25=0.577v2=09=0.710结论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度v1=单击此处添加正文,文字是您思想的提炼,为了演示发布的良好效果,请言简意赅地阐述您的观点。309.19单击此处添加正文,文字是您思想的提炼,为了演示发布的良好效果,请言简意赅地阐述您的观点。32.5215例题:有甲、乙两个品种的粮食作物,经播种实验后得知乙品种的平均亩产量为998公斤,标准差为162.7公斤,甲品种实验资料如下,试研究两个品种的平均亩产量,确定哪一品种具有较大稳定性,更有推广价值。亩产量(公斤/亩)100095011009001050播种面积(亩)121110984.3分布偏态与峰度的测度偏态与峰态分布的形状扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!偏态及其测度(skewness)统计学家Pearson于1895年首次提出数据分布偏斜程度的测度偏态系数=0为对称分布偏态系数0为右偏分布偏态系数0为左偏分布计算公式:偏态系数
(例题分析)某电脑公司销售量偏态及峰度计算表按销售量份组(台)组中值(Mi)频数fi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~240145155165175185195205215225235491627201710845-256000-243000-128000-27000017000800002160002560006250007290000256000027000001700001600000648000031250000合计—120540000偏态系数
(例题分析)结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数峰态及其测度(kurtosis)统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=3扁平峰度适中峰态系数3为扁平分布峰态系数3为尖峰分布计算公式结论:偏态系数小于3,但与3的差异不大,说明电脑销售量为轻微扁平分布峰态系数
(例题分析)4.4茎叶图与箱线图茎叶图箱线图茎叶图
(stem-and-leafdisplay)用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。以该组数据的高位数值作树茎,低位数字作树叶树叶上只保留一位数字(个位数)。茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具体的数值。茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。茎叶图
(例题分析P22表2.7)茎叶图
(扩展的茎叶图0~4,5~9)箱线图
(boxplot)用于显示未分组的原始数据的分布。箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成。