文档详情

数据的描述统计数值法.ppt

发布:2025-02-03约5.05千字共50页下载文档
文本预览下载声明

*********************************************世界的基尼系数:2009第28页,共50页,星期六,2024年,5月中国的基尼系数:1978-2008第29页,共50页,星期六,2024年,5月第30页,共50页,星期六,2024年,5月3.3百分位数、四分位数与盒式图将数据递增排序,对于某个数值X,如果有p%的数据小于它,则称X为第p百分位数(percentile)第10百分位数第90百分位数第31页,共50页,星期六,2024年,5月第25百分位数称为下四分位数或第一四分位数(firstquartile)记为Q1中位数、第50百分位数、第二四分位数第75百分位数称为上四分位数或第三四分位数(thirdquartile)记为Q3(Q3-Q1)内距或四分位差(interquartilerange)记为IQR第32页,共50页,星期六,2024年,5月计算百分位数将数据按递增排序计算指数i=(p/100)n,n为样本容量如果i不是整数,取比i的整数,这个整数表示p百分位数的位置如果i是整数,则p百分位数是递增顺序排列中位置i与i+1的平均值第33页,共50页,星期六,2024年,5月Example(p=10thPercentile)i=(10/100)12=1.2不是整数,取2第10百分位数为11,0707,52411,07018,21126,81736,55141,28649,31257,28372,81490,416135,540190,250第34页,共50页,星期六,2024年,5月五数概括法最小值第一四分位数Q1中位数Md第三四分位数Q3最大值第35页,共50页,星期六,2024年,5月盒子-胡须图

(Box-and-WhiskersPlots)五数概括的一种扩展,用Q1、Md、Q3以及四分位差绘制随机抽取20顾客对某品牌电脑的满意度进行评分(1-10分)135578888889999910101010第36页,共50页,星期六,2024年,5月计算Q1=7.5,Md=8,Q3=9,IQR=1.5内栏(innerfence):(Q1-1.5IQR)至(Q3+1.5IQR)区间外栏(outerfence):(Q1-3IQR)至(Q3+3IQR)区间胡须的画法:找到Q1到内栏间的最小值以及Q3到内栏间的最大值第37页,共50页,星期六,2024年,5月找出异常值轻微异常值(mildoutlier):内栏与外栏间的数值极端异常值(extremeoutlier):外栏之外的数值第38页,共50页,星期六,2024年,5月Figure3.19第39页,共50页,星期六,2024年,5月MegaStat绘制的盒式图第40页,共50页,星期六,2024年,5月3.4加权与分组数据某些数值相对于其它数值可能更重要变量值的重要程度,通常称为权重(weight)加权均值与加权方差第41页,共50页,星期六,2024年,5月案例:支持率的计算民调地区选民(百万)支持率东北部26.940.1%南部50.647.2%中南部34.645.1%西部32.539.2%第42页,共50页,星期六,2024年,5月分组数据的统计描述概括成频数分布或直方图的数据原始数据无法观测到,只能看到每组的上下限和频数利用组中值和频数计算均值和方差属于加权形式第43页,共50页,星期六,2024年,5月分组数据的均值和方差第44页,共50页,星期六,2024年,5月3.5几何平均数(geometricmean)n个变量值乘积的n次方根适用于对比率数据的平均,尤其是时序数据主要用于计算平均增长率、平均收益率计算公式为5.可看作是均值的一种变形第45页,共50页,星期六,2024年,5月一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率算术平均:几何平均:案例:股票投资平均收益率第46页,共50页,星期六,2024年,5月平均发展速度、增长速度通常用几何平均法求得。计算公式为:第47页,共50页,星期六,2024年,5月案例:人口2000年-2007年平均增长率2000年2001年200

显示全部
相似文档