数据分布特征的测度.ppt
异众比率(variationratio)1. 对分类数据离散程度的测度;2. 非众数组的频数占总频数的比例;3. 计算公式为:4.用于衡量众数的代表性。第38页,共63页,星期六,2024年,5月异众比率(例题分析)解:在所调查的50人当中,购买其他品牌饮料的人数占70%,异众比率比较大。因此,用“可口可乐”代表消费者购买饮料品牌的状况,其代表性不是很好。不同品牌饮料的频数分布饮料品牌频数比例百分比(%)可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100第39页,共63页,星期六,2024年,5月极差(range)一组数据的最大值与最小值之差;离散程度的最简单测度值;易受极端值影响;未考虑数据的分布。R=max(xi)-min(xi)计算公式为:第40页,共63页,星期六,2024年,5月平均差各变量值与其平均数离差绝对值的平均数;能全面反映一组数据的离散程度;数学性质较差,实际中应用较少。计算公式为:未分组数据组距分组数据0第41页,共63页,星期六,2024年,5月..根据表4-6:试问A、B两组那一组学生的平均考分更有代表性?学生序号考分(分)xAxB甲乙丙丁戊65707580856870768081合计375375离差-10-50510—解:离差绝对值离差离差绝对值∵MDA>MDB故,B组学生平均考分比A组学生平均考分更有代表性。105051030-7-5156—7515624第42页,共63页,星期六,2024年,5月方差和标准差
(varianceandstandarddeviation)数据离散程度的最常用测度值;反映了各变量值与均值的平均差异;根据总体数据计算的,称为总体方差或标准差,记为?2(?);根据样本数据计算的,称为样本方差或标准差,记为s2(s)。第43页,共63页,星期六,2024年,5月..总体标准差总体标准差的计算方法1.简单标准差2.加权标准差(未分组数列)(分组数列)第44页,共63页,星期六,2024年,5月样本方差和标准差未分组数据组距分组数据未分组数据组距分组数据方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第45页,共63页,星期六,2024年,5月..根据表4-7:学生序号考分(分)xAxB甲乙丙丁戊65707580856870768081合计375375离差离差平方离差离差平方-10-50510—10025025100-7-5156492512536—136250试问A、B两组那一组学生的平均考分更有代表性?解:故,B组学生平均考分比A组学生平均考分更有代表性。∵σA>σB第46页,共63页,星期六,2024年,5月样本标准差(例题分析)表4-8某电脑公司销售量数据标准差计算表按销售量分组组中值(Mi)频数(fi)140~150150~160160~170170~180180~190190~200200~210210~220220~230230~2401451551651751851952052152252354916272017108454023022021020210220230240250264008100640027000170040007200640012500