spss数据的预处理.pptx
文本预览下载声明
第三章 SPSS数据的预处理;为什么要进行数据的预处理; 数据的排序
变量计算
数据选取
计数
分类汇总
数据分组
数据预处理的其他功能:转置、加权、数据拆分、缺失值处理、数据排秩、定义变量集。;3.1 数据的排序;
数据排序便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等;
通过数据排序能够快捷的找到数据的最大值和最小值,进而可以计算出数据的全距,初步把握和比较数据的离散程度;
通过数据排序能够快捷地发现数据的异常值,为进一步明确它们是否会对分析产???重要影响提供帮助。; SPSS数据排序的基本操作步骤
(1)选择菜单Data-Sort Cases
(2)将主排序变量从左边的列表中选到Sort by框中,并在Sort Order框中选择按该变量的升序还是降序排序。
(3)如果是多重排序,还要一次指定第二、第三排序变量及相应的排序规则。;在左边的源变量框中选择排序变量进入Sort by框。如果选择2个以上的变量,观测量的排序结果与排序变量在Sort by框中的顺序有关。列于首位的为第一排序变量。; 1、数据排序是整行数据排序,而不是只对某列变量排序;
2、多重排序中指定排序变量的次序很关键。先指定的变量优先于后指定的变量。多重排序可以在按某个变量值升序(或降序)排序的同时再按其他变量值降序(或升序)排序;
3、数据排序后,原有数据的排序次序必然被打乱。;数据排序应用举例;3.2 变量计算;3.2.1 变量计算的目的;指出按照什么方法计算变量;
SPSS算术表达式(Numeric Expression)是由常量、变量、算术运算符、圆括号、函数等组成的式子。
字符型常量应当用引号括起来
变量是指那些已存在于数据编辑窗口中的原有变量
算术运算符主要包括+、-、*、/、**(乘方)
在同一算术表达式中的常量及变量,数据类型应该一致,否则无法计算 ;在变量计算中通常要求对不同的个案分别按照不同的方法进行计算,于是就需要通过一定的方式来指定个案;
SPSS条件表达式是一个对条件进行判断的式子。其结果有两种取值:如果判断条件成立,则结果为真;如果判断条件不成立,则结果为假。条件表达式包括简单条件表达式和复合条件表达式。;(1)简单条件表达式
由关系运算符、常量、变量以及算术表达式等组成的式子。其中关系运算符包括、、=、~=(不等于)、=、=。(nl35)
(2)复合条件表达式
又称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。其中,逻辑运算符号包括或AND(并且)、|或OR(或者)、~或NOT(非)。NOT的运算优先级最高,其次是AND,最低是OR。可以通过圆括号改变运算的优先级。(nl=35)and not (zc3);SPSS函数是事先编好并存储在SPSS软件中,能够实现某些特定计算任务的一段计算机程序。这些程序都有各自的名字称为函数名。执行这些程序段得到的计算结果称为函数值。
函数书写的具体形式为:函数名(参数); 其中,函数名是SPSS已经规定好的,参数可以是常量(字符型常量应用引号括起来),也可以是变量或算术表达式。参数可能是一个,也可能是多个,各参数之间用逗号分隔。
SPSS函数大致可以分成八大类:算术函数、统计函数、分布函数、逻辑函数、字符串函数、缺失值函数、日期函数和其他函数。;(1)选择菜单Transform-Compute,弹出Compute Variable对话框如下:
;(2)在Target框中输入存放计算结果的变量名。该变量可以是一个新变量,也可以是已经存在的变量。如果指定存放计算结果的变量为新变量,SPSS会自动创建它;如果指定产生的变量已经存在,SPSS会提问是否以计算结果覆盖原有值。新的变量默认为数值型,用户可以根据需要单击TypeLabel按钮修改,还可以对新变量加变量名标签。
(3)在Numeric Expression框给出SPSS算术表达式。可以手工输入,也可以按窗口的按钮以及函数下拉菜单输入。;(4)如果希望对符合一定条件的个案进行变量计算,则单击If按钮,出现下面的窗口,选择Include if case satisfies condition选项,然后输入条件表达式。对不满足条件的个案,将不进行变量值计算,对新变量取值为系统缺失值。
;
1、利用职工基本情况数据,依据职称级别计算实发工资。假设职称1至4职工的工资分别上调50%,30%,20%,10%。
2、利用满意度数据将反向问题X2数据进行正向转换。;3.3 数据选取;(1)选取全部数据(All cases)
(2)按指定条件选取( If condition is satisfied )
显示全部