社会学研究方法--风笑天--第十一章.ppt
第十一章定量资料分析;目录;第一节资料的整理与录入;资料的审核
?资料研究者对所收集的原始资料〔主要是)问卷进行初步的审阅,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷。
?资料审核的目的:使原始资料具有较高的准确性、完整性和真实性,从而为后续资料的整理录入与统计分析工作打下较好的根底。;资料审核的内容:
检查出问卷资料中的问题
重新向被调查着核实
资料审核的方法:
实地边收集边审核,一旦发现填答错误,或漏填误填,或其他问题,及时进行询问。
集中审核〔系统审核〕:将全部资料收集回来后集中时间进行审核。;?两种资料审核方法的优缺点:
–实地优点:及时,审核质量高。缺点:组织工作要安排好,调查员的素质要求高。
–集中优点:组织工作好安排,对调查员的要求低,审核的标准一致。缺点:整个工作的周期较长,某些个案的重新询问和核实会由于时间相隔较长或地域太远而无法落实。
?资料审核的根本原那么:如果有一支训练有素的调查员队伍,且人数可观,那么采用实地审核,否那么集中审核,此时应考虑增加样本大小。;资料的转换
?资料的转换:将问卷中的答案用代码表示,用以后面计算机软件的处理。
?转换方法:
–定量数据:代码就是变量的值,必须是阿拉伯数字。
–定性数据:定类:代码仅仅表示不同的类,所以可以用阿拉伯数字也可以是符号;定序:代码不仅表示类,也表示强弱、好坏、上下、大小,因此,此时要注意阿拉伯数字代表的含义在整个问卷中有统一的含义;资料的转换—编码
?编码手册的用途:由于社会研究的样本很大成百上千,而一份问卷中就包含几十上百的问题,于是转换的工作十分繁重,容易造成转换误差。为了保证数据转换的质量,研究者要编制一份编码手册发给编码员。
?编码手册的内容:工程名称、变量名、含义、宽度、栏码、答案赋值等。;数据录入
数据录入有两种方式:
直接输入
先将问卷上的编码转录到专门的登记表上,再录
入计算机。
数据清理
数据清理:
?有效范围清理
?逻辑一致性清理
?数据质量???查。
;第二节单变量统计分析;单变量描述统计
?集中趋势分析:
–均值(Mean)、众数(Mode)、中位数(Median)
?离散趋势分析:
–全距(Range)、标准差(StandardDeviation)、异众比率、四分位差(InterquartileRange)。
–离散系数:CV=标准差/均值*100%
用于比较:同一总体不同变量的比较;不同总体同一变量的比较。;单变量推论统计
1.区间估计
2.假设检验;第三节双变量统计分析;交互分类
?交互分类〔Cross-tabulation〕:专门用来分析两个定性变量之间关系的统计分析方法。
卡方检验
?是否显著与数据分布和样本规模有关。;
不同层次变量的相关测量与检验
?卡方检验说明在总体中两定性变量是否相互独立。
?相关测量说明两种变量在样本中的相关程度。
?相关检验说明在总体中两种变量是否相互独立。;消减误差比例
?在解释或预测社会现象的变化中难免会有误差。对于两个有关系的变量〔X和Y〕来说,知道X值去预测Y值时所存在的误差〔E2〕,显然比不知道X值去预测Y值所产生的误差〔E1〕要小。
?消减误差比例(Proportionatereductioninerror,PRE):知道X值时所减少的误差〔E1-E2〕与总误差的比。即PRE越大,表示以X值去预测Y值时能够减少的误差所占的比例越大,或X与Y越相关。
?比方:PRE=0.70,表示以X预测Y时能够减少70%的误差,说明二者的相关程度较高。PRE=0.09,那么表示只消减了9%的误差,即X与Y的关系很弱。;消减误差比例;不同层次变量相关测量系数;不同层次变量相关测量检验;回归分析
?指简单线性回归
?R=r;第四节多变量统计分析;阐释模式
阐释模式〔Elaboration):关心两个变量之间的关系,通过引入并控制第三个变量,来进一步了解和探讨原来两变量之间关系性质的统计分析方法。
类型:
因果分析
说明分析
条件分析;阐释模式---因果分析;阐释模式—说明分析;阐释模式—条件分析;阐释模式
?从操作上看三种分析方法都是相同的。
?具体的分析是属于哪一个?
–取决于研究者的理论假设和理论分析框架。即在理论分析框架中,第三变量处于什么位置,扮演什么角色。
?注意:如果一个分析要控制多个第三变量,那么分表就会很多,与此对应的是每一个分表中所能够包含的个案个数就会很少,那么两变量之间关系就会测不准确。所以,研究者往往只能选择几个相对重要的第三变量,而不能随意把所有可的变量都引入进来。;复相关分析
?复相关分析:用一个统计值来简化多个自变量和一个因变量的关