统计学原理课件--第4章-数据特征的描述.ppt
第4章数据分布特征的测度;学习目标;数据分布的特征;数据分布特征的测度;§4.1集中趋势的测度;数据分布特征的和测度
(本节位置);集中趋势
(Centraltendency);下面是一个小故事:
一个人到某公司求职,经过调查,得出关于该公司工资的一些数据,如果是你,应该如何选择?;挠头的数值;我们有三种方法选择集中趋势:
〔1〕根据频数:哪个变量值出现次数越
多,就选择哪个变量值,比方民主决策的表决
机制。
〔2〕根据居中:比方一个城镇居民的生活
水平,居中的是小康家庭,那么就用小康家庭
来代表该城镇的生活水平。
〔3〕根据平均:用平均数来代表变量的
平均水平。;分类数据:众数;众数
(mode);众数
(不唯一性);分类数据的众数
(例题分析);顺序数据的众数
(例题分析);1.单项数列确定众数。
只需要直接判断哪一组的次数最多,该组的变量值即为众数,用Mo表示。
2.组距式分组资料计算众数
在组距式分组资料中,众数的计算就带有一定的假定性。先根据数列次数最多的组确定为众数所在组,再利用插补法求其众数近似值。形成了两个计算公式,即上限公式和下限公式:
;;式中:Mo表示众数
????????????L表示众数所在组的下限
????????????U表示众数所在组的上限
?????△1是众数所在组的次数f2与其下限邻近组的次数f1之差
?????△2是众数所在组的次数f2与其上限邻近组的次数f3之差
???????????i表示众数所在组的组距
;顺序数据:中位数和分位数;中位数
(median);中位数
(位置确实定);顺序数据的中位数
(例题分析);数值型数据的中位数
(9个数据的算例);数值型数据的中位数
(10个数据的算例);四分位数
(quartile);四分位数
(位置确实定);顺序数据的四分位数
(例题分析);数值型数据的四分位数
(9个数据的算例);数值型数据的四分位数
(10个数据的算例);数值型数据:均值;均值
(mean);简单均值与加权均值
(simplemean/weightedmean);已改至此!!;加权均值
(权数对均值的影响);教学案例3:辛浦森(SimpsonsParadox)悖论;总的看,白人有19/160=12%的被告被判处死刑,与之对应,黑人只有17/166=10%的被告被判死刑,白人死刑率要高一些.但如果考虑受害者的种族,结论就相反了.当受害者是白人时,有11/63=17.5%的黑人被告被判死刑,而只有19/151=12.6%的白人被告被判死刑.当受害者是黑人时,白人被告没一个人(0%)被判死刑,而黑人被告确有6/103=5.8%的被判死刑.;案例〔2〕:航班延误;;案例〔3〕:录取中有无歧视?;工程系财经系;案例〔4〕:房价真下跌了吗?;;房价指数;辛浦森悖论;均值
(数学性质);调和平均数
(harmonicmean);调和平均数
(例题分析);几何平均数
(geometricmean);几何平均数
(例题分析);几何平均数
(例题分析);众数、中位数和均值的比较;众数、中位数和均值的关系;众数、中位数和均值的特点和应用;;;实例:一些银行要求顾客在每个窗口等待,而另一些银行分发号码,相当于顾客在一个大队列中等待,在什么不同吗?;银行一〔一列等待〕
平均数=7.15
中位数=7.20;§4.2离散程度的测度;数据的特征和测度
(本节位置);离中趋势;分类数据:异众比率;异众比率
(variationratio);异众比率
(例题分析);顺序数据:四分位差;四分位差
(quartiledeviation);四分位差
(例题分析);数值型未分组数据的四分位差(算例);数值型数据:方差和标准差;极差
(range);方差和标准差
(varianceandstandarddeviation);总体方差和标准差
(计算公式);样本方差和标准差
(计算公式);前面银行的例子;样本标准差
(例题分析);样本标准差
(例题分析);样本方差
自由度(degreeoffreedom);相对位置的测量:标准分数;标准分数
(standardscore);标准分数
(性质);标准化值
(范例);标准化值
(范例);经验法那么;【例】假定某学校在校大学生每月的生活消费支出近似服从正态分布,其月生活消费支出的均值为500元,标准差为50元。对于大学生生活消费支出的分布情况