spss-复习资料-可直接打印版.doc
创立/翻开方式:
手工:File—new/open—syntax
自动:Editor—options—opensyntaxwindowsatstart-up
语句窗口组成:窗口主菜单、工具栏、spss程序编辑区、状态栏四局部组成
SPSS数据文件组成:数据结构和内容
两项任务,即描述数据的结构〔变量视图〕和录入编辑数据〔数据视图〕。
首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。
2.变量名的字符个数最好不多于8个;变量名不区分大小写字母。
3.SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能ALL,BY,AND,NOT,OR等。
三种根本数据类型:数值型、字符型和日期型
标准型〔Numeric〕列宽8位,包括正负号、小数点和小数位在内
字符型数据的默认显示宽度为8个字符,不能进行算术运算,区分大小写字母。
数值型变量默认为右对齐,字符型变量默认为左对齐。
定距型数据通常指连续型数据,如身高、体重;
定序型数据职称、职务、对某事物的赞同程度
定类型民族、宗教信仰、性别、党派。
按变量值定位:Edit+Find
恢复删除或修改前数据Edit+Undo
Writevariablesnamestospreadsheet写入Excel工作表的第一行上。
Indicatecasesourceasvariable默认source01取值0〔第一份数据〕或1(第二份数据)的变量。
第三章
条件表达式:简单条件表达式和复合条件表达式。
NOTANDOR
filter_$的新变量,取值为1或0。1表示本个案被选中,0表示未被选中。
Filtered:未被选中的个案号码上打一个“\”标记
成绩为优:90throughhighest,成绩为良:80through89,不及格:Lowestthrough59
数据分组方法:单项式分组;组距分组
全距:最大值与最小值之差
组距=全距÷组数。
Lowestvalue表示升序;Highestvalue表示降序。
数据转置行列互换Data-Transpose
加权处理例用户满意度测评Data-WeightCases。[frequency]
(1)一旦指定了加权变量,那么以后的分析处理中加权是一直有效的,直到取消加权为止。取消加权应选择Donotweightcases选项。(2)加权后,数据编辑窗口中的数据并没有变化,仅在状态栏有已经加权〔weighton〕的提示信息。
数据拆分Data-SplitFile。排序和分组。数据拆分将对后面的分析一直起作用
SPSS变量集包括系统变量集和用户变量集。SetinUse框中应至少有一个变量集。
SPSS缺失值处理
〔1〕选择菜单Transform-replacemissingvalues
〔2〕将需要插补的变量单击按钮送到NewVariables框中,该变量自动会生成一个新的变量,变量名为原变量名_1
〔3〕在Method中选择插补方法。
第四章
频数分析根本任务
〔1〕编制频数分布表:频数〔Frequency〕;百分比〔Percent〕:即各频数占总样本数的百分比;有效百分比〔ValidPercent〕;累计百分比〔CumulativePercent〕
〔2〕绘制统计图Chart
计算其他根本描述统计量
〔1〕描述集中趋势。1〕均值〔Mean〕〔2〕中位数〔Median〕〔3〕众数〔Mode〕次数最多的数据值
〔2〕描述离散程度。1〕全距〔Range〕:也称极差。数据的最大值与最小值之间的绝对离差2〕方差〔Variance〕:3〕标准差
〔3〕描述分布形态。〔1〕偏度〔Skewness〕:①对称分布时,正负总偏差相等,偏度值等于0;②偏度值大于0,右偏;偏度值小于0,左偏。③偏度绝对值越大,表示数据分布形态的偏斜程度越大。
〔2〕峰度〔Kurtosis〕:①与标准正态分布的陡峭程度相同,峰度值等于0;②峰度大于0数据分布更陡峭,尖峰分布;③峰度小于0数据分布平缓,平峰分布。
交叉分组下的频数分析的根本操作
〔1〕菜单项选择项Analyze-DescriptiveStatistics-Crosstabs
Counts框中的Expected期望频数反映的是行列变量互不相干下的分布。
Unstandardized为非标准化剩余,定义为:观测频数-期望频数
卡方统计量观测值的大小取决于两个因素:①列联表的单元格子数;②观测频数与期望频数的总差值。值越大时,卡方值越大,实际分布与期望分布的差距越大,说明行列变量之间越相关;反之