上机1用EXCEL对原始数据进行分组汇总指南.doc
文本预览下载声明
上机 用Excel对原始数据进行分组汇总
[实验目的]
掌握用EXCEL进行数据的整理
[实验内容]
编制变量数列
对原始数据进行简单与交叉(复合)分组汇总
[操作指导]
例1:对品质型原始数据进行简单分组汇总。资料见上机训练数据“性别与年龄构成工作表”
方法之一:利用countif函数。
方法之二:利用数据透视表。
例2:用对数值型型原始数据进行简单分组汇总。资料见上机训练数据“能力测试分工作表”。(编制变量数列)
方法一:利用countif函数。(等距或异距均可)
方法二:利用直方图分析工具。(一般是等距,异距也可但不宜直接作图)
步骤:
第一步——打开Excel,在某一空白列中输入需要编制变量数列的所有原始数据,每一单元格输入一个变量值;
第二步——利用函数找出原始数据中的最大值(用函数max)与最小值(用函数min)。
第三步——利用公式求出极差(即最大值与最小值之差),依据数据类型、多少与分布特点确定组数与组距以及组限。
第四步——选择一空列,定组限名如“按能力分分组”,输入除最后一组以外的各组的上限值(注意,Excel默认的是上限在本组内);
第五步——单击“工具”下拉式菜单,选定“数据分析”选项,在弹出的对话框中选定“直方图”,再单击“确定”,得到如下图所示的对话框:
第六步——在对话框中“输入区域”框内键入原始数据所在单元格,绝对、相对引用均可。)
在“接收区域”框内键入组限所在单元格)
选中“标志”(当引用单元格未包括标志所在单元格时,不选)
可在“输出区域”框内键入一空列的某一单元格
可选择“累积百分率”
选择“图表输出”
单击“确定”
第七步——为了把变量数列转化为平常表达习惯,需将表中的“频率”改成次数名称“人数”,将各组上限值依次改为区间,在与最后一组相邻的下一行单元格写上合计,选定“合计”单元格右邻的单元格并在工具栏上双击“∑”符号;还可在与次数相邻的列计算“比重”[计算时注意公式中单元格的相对引用(分子)与绝对引用(分母)]
第八步——默认直方图形式为柱形图,可以调整为标准的直方图形式。具体方法是:在图中“柱”上右击弹出菜单,选“数据系列格式”命令,再选“选项”,将其对话框中的“间距宽度”调整为“0”即可。 输出结果如下:
特别提醒:由于每一组对数据值小于或等于上限的数据进行计数,所以在确定组限时,如果上组限不包含在本组内,一定要选择小于上组限的数。
方法三:利用频数分布函数。(一般是等距,异距也可但不宜直接作图)
步骤:
第一步——打开Excel,在某一空白列中输入需要编制变量数列的所有原始数据,每一单元格输入一个变量值;
第二步——利用函数找出原始数据中的最大值(用函数max)与最小值(用函数min)。
第三步——利用公式求出极差(即最大值与最小值之差),依据数据类型、多少与分布特点确定组数与组距以及组限。
第四步——选择一空列,定组限名同前。注意,Excel默认的是上限在本组内);
第五步——方式一:选定一列多行单元格区域(注意行数与组数对应),单击“插入”下拉式菜单,选定“函数”选项,在弹出的对话框中选定“统计”类别下的frequency(如下图1),再单击“确定”,得到对话框。在date_array旁边的方框内输入原始数据所在单元格;在bins_array旁边的方框内输入组限所在单元格(也可以直接输入各组组限,注意要用大括号括住且各组限之间用分号隔开)(如下图2),然后同时按Ctrl/shift/enter键,则得到各组频数。方式二:也可以选定一列多行单元格区域(注意行数与组数对应)后,直接输入“=frequency(原始数据所在单元格,组限所在单元格)”, 然后同时按Ctrl/shift/enter键,则得到各组频数。
图1
图2
方法之四:利用数据透视表。详见课堂上机操作讲解。(宜等距)
例3:对原始数据进行交叉分组汇总。
方法之一:利用数据透视表。详见课堂上机操作讲解。
方法之二:利用数组求和函数sum。
A不定义名称
如例子中,在性别为“男”,年龄为25岁的单元格中输入:
=SUM(($B$3:$B$52=$I4)*($C$3:$C$5225)),然后同时按ctrl、shift、enter键,则得到25岁以下男性人数。
同理,依次在25-35岁、35-45岁、45-55岁及=55岁的单元格中以下相应公式:
=SUM(($B$3:$B$52=$I4)*($C$3:$C$52=25)*($C$2:$C$5235))
=SUM(($B$3:$B$52=$I4)*($C$3:$C$52=35)*($C$2:$C$5245))
=SUM(($B$3:$B$52=$I4)*($C$3:$C$52=45)*
显示全部