SPSS数据的预处理实验报告.pdf
SPSS数据的预处理实验报告--第1页
实验报告
姓名学号专业班级
课程名称统计分析SPSS软件实验室
成绩指导教师
实验名称SPSS数据的预处理
一、实验目的:
学会SPSS数据的基本预处理:排序、分组、分类汇总、变量计算、筛选数据
二、实验题目:
根据数据文件“住房状况调查根据数据文件“住房状况调查,完成以下要求:
(1)按现住面积(降序)、家庭收入(降序)、年龄(升序)进行多重排序。
(2)根据家庭收入的数据分布状况,选择恰当的组数和组距进行分组。
(3)根据从业状况进行分类汇总,计算各行业的现住面积的平均值和标准差
(4)计算人均收入、人均住房面积、计划面积和现住面积的差。
(5)将数据文件分成两份文件,第一份数据文件要求是“常住人口不少于3人”且“现住
面积在50平方米以下平方米以下的调查数据;第二份数据文件要求是按照简单随机抽样所选取的70%的样
本数据.
三、实验步骤(最好有截图):
(1)打开“住房状况调查.sav”文件。选择菜单:【Data】→【SortCases】,再指定现住面积
变量到【Sortby】框中,并选择【SortOrder】框中的选项指出该变量按降序排序,并依次指
定第二家庭收入变量按降序排列,最后再指定第三年龄变量按升序排列。按“OK”键确定。最后
保存文件。
至此,数据编辑窗口中的数据便自动按用户指定的顺序重新排列并显示出来,如下图
(2)打开“住房状况调查。sav”文件。选择菜单:【Transform】→【RecodeintoDifferent
Variables】,选择分组变量到【NumericVariable-〉Output】框中。这里选择“家庭收入”。
在【OutputVariable】框中的【Name】后输入存放分组结果的变量名,并按“Change”按钮确
认,这里的变量名为收入分布。按“OldandNewValues”按钮进行分组区间定义,按组距10000,
组数4进行分组。最后保存文件。如下图
SPSS数据的预处理实验报告--第1页
SPSS数据的预处理实验报告--第2页
(3)打开“住房状况调查.sav”文件。选择菜单:【Data】—【Aggregate】,指定从业状况分类
变量到【BreakVariable(s)】框中,指定现住面积汇总变量到【AggregatedVariables】框中。
对现住面积求平均值和标准差.按“Function”按钮指定对汇总变量计算哪些统计量。最后保存
文件。如下图
(4)打开“住房状况调查.sav”文件.选择菜单:【Transform】→【ComputeVariable】,在【Numeric
Expression】框给出SPSS算术表达式和函数。在【TargetVariable】框中输入存放计算结果
的变量名。这里,输入变量名差值1。新变量的变量类型默认为数值型。定义变量差值1、2,
计算人均住房面积、计划面积和现住面积的差。最后保存文件。如下图
SPSS数据的预处理实验报告--第2页
SPSS数据的预处理实验报告--第3页
(5)打开“住房状况调查。)打开“住房状况调查。文件。选择菜单:【Data】→【SelectCases】,在【Select】
框中选择选取方法。应选择【Ifconditionissatisfied】项,先选择条件使“常住人口〉=3