统计调查与整理.ppt
若把上表改变为如下统计表,则基本上能准确反映总体的分布特征。某班学生统计学考试成绩表考试成绩(分)人数(人)比重(%)50-6025.060-70717.570-801127.580-901230.090-100820.0合计40100.0好的分组能体现组内同质性和组间差异性第85页,共121页,星期日,2025年,2月5日2.确定组限和组中值⑴关于组限问题组限组距两端的数值。分为上限和下限。全距分组数列中最大值与最小值之差。第86页,共121页,星期日,2025年,2月5日因数列两端组限形式不同分:开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。闭口式组距:例40-60分,90-100分。第87页,共121页,星期日,2025年,2月5日上组限不在内对连续变量,组数也要连续。在登记次数时,习惯上遵守:对不连续变量,组与组间是间断的。第88页,共121页,星期日,2025年,2月5日⑵关于组中值问题闭口式分组的组中值求法:组中值组的上限和下限的中间值。第89页,共121页,星期日,2025年,2月5日⑵关于组中值问题开口式分组的组中值求法:第90页,共121页,星期日,2025年,2月5日3.等距分组和异距分组等距数列中各组组距都是相等的异距数列中每组的组距是不全相等的。第91页,共121页,星期日,2025年,2月5日向下累计——先列出各组的下限,然后由标志值高的组向标志值低的组依次累计。向下累计频数表明某组下限以上的各组单位数之和是多少,某组下限以上的各组单位数之和占总体单位数的比重。向上累计——先列出各组的上限,然后由标志值低的组向标志值高的组依次累计。向上累计频数表明某组上限以下的各组单位数之和是多少,某组上限以下的各组单位数之和占总体单位数的比重。累计次数分布第92页,共121页,星期日,2025年,2月5日例考分次数向上累计次数
(上限)向下累计次数
(下限)人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50-6025.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090-100820.040100.0820.0合计40100.0----某班统计学考试成绩次数分配第93页,共121页,星期日,2025年,2月5日直方图(或次数分配曲线图)仍以上例考试成绩数据,画成如下直方图:405060708090100110第94页,共121页,星期日,2025年,2月5日若组距不等的话,用标准组距人数,然后据此画直方图:按工人年龄分组(岁)组距人数(人)标准组距人数(人)频数密度=频数/组距15-20517173.420-25528285.625-30540408.030-355707014.035-45106532.56.545-50510102.0合计-230--第95页,共121页,星期日,2025年,2月5日直方图例10152025303540455055第96页,共121页,星期日,2025年,2月5日折线图在直方图的基础上连接各条形顶边的中点成折线图。如下图红笔围成的,即为次数分配曲线图:405060708090100110第97页,共121页,星期日,2025年,2月5日折线图还可用来表示累计次数分布(仍以上例数据):曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。向下累计向上累计第98页,共121页,星期日,2025年,2月5日2.次数分布的主要类型两头小中间大钟型分布第99页,共121页,星期日,2025年,2月5日YY右偏型(上偏型)左偏型(下偏型)XX很多是偏态分布曲线,或称偏态曲线第100页,共121页,星期日,2025年,2月5日还有其他形态J型分配曲线U型分配曲线第101页,共121页,星期日,2025年,2月5日第五节统计表一统计表的结构和内容