教育多元统计学与SPSS软件6-7相关回归概要.doc
文本预览下载声明
第六章 相关分析
我们在实际工作中所遇到的变量,都是相互联系、相互制约的,从而它们之间存在着一定的关系。人们通过各种实践,发现变量之间的关系大致可以分为两种:
① 确定性的关系,即函数关系;
② 非确定性的关系,即相关关系。
相关分析是研究相关关系的一种常用的统计方法,分为简单相关分析与偏相关分析。
第一节 简单相关分析
1.相关系数
相关关系:变量之间有关,但又不能由一个或几个变量去完全惟一确定另一个变量取值的关系(或很难用函数关系表达出来)。
相关关系的密切程度用简单相关系数(在不引起混淆的情况下,简称相关系数)反映,用r表示,其值在-1到+1之间,绝对值愈接近1,表明密切程度愈高,关系愈密切;愈接近0,表明密切程度愈低,关系愈不密切。这里的密切是指线性关系,当r的值很小时,只能说明无线性关系,事实上有可能存在其他的关系,如曲线关系等。
r的符号表示两个变量的相关方向:r0时,两变量存在着正相关关系,一个变量的取值随着另一个变量取值的增大而增大;r0时,两变量存在着负相关关系,一个变量的取值随着另一个变量取值的增大而减小。
r的计算公式为:
Lxy
r=
LxxLyy
其中:Lxy=Σ(x-x)(y-y), Lxx=Σ(x-x)2, Lyy=Σ(y-y)2
=Σxy-1/n×ΣxΣy =Σx2-1/n×(Σx)2 =Σy2-1/n×(Σy)2
在用相关系数分析问题时,要进行检验。
原假设:ρ=0
对显著性水平α,自由度n-2,查表得临界值rα,若|r|rα,则显著。
注:若n很大,即使r很小,也很容易得到“显著”的结论。因而在相关分析的过程中,除说明是否显著外,还应对r 的大小加以说明。
一般情况下,可以这样判断:
|r|≥0.7,高度相关;
0.4≤|r|0.7,中度相关;
|r|0.4,低度相关。
2.SPSS软件操作步骤
选择“Analyze”→“Correlate”→“Bivariate”项,弹出如图6.1.1所示的对话框。
图6.1.1 相关系数计算对话框
2.1 Variables框
存放变量。
2.2 Correlation Coefficients项
⑴ Pearson
积差相关,用于连续变量或等间距测度的变量。
⑵ Kendall′s tau-b
等级相关,计算分类变量间的秩相关。
⑶ Spearman
等级相关,计算斯皮尔曼相关。
当变量不服从正态分布或总体分布未知时,可使用Kendall′s tau-b 或Spearman相关。
2.3 Test of Significance项
⑴ Two-tailed
双尾检验,用于事先不知道相关方向(即正相关还是负相关)的情况。
⑵ One-tailed
单尾检验,用于事先知道相关方向的情况。
双尾、单尾检验也称为双侧、单侧检验。双侧检验时,当原假设被拒绝后,还有两种可能,显著性水平α分布在图形的两侧。有时在进行检验前,可以判定一种情况不成立,当原假设被拒绝后,只剩下一种情况了。
在同一显著性水平下,由于单侧检验的临界值比双侧检验的临界值靠近总体均值,因此,容易检验出显著性差异来。
2.4 Flag significant Corrlations项
在相关系数右上方用“*”标出检验结果。“*”表示显著性水平为0.05;“**”表示显著性水平为0.01。
2.5 Options按钮
图6.1.2 Options对话框
⑴ Statistics项
① Means and standard deviations
输出均值与标准差。
② Cross-product deviations and covariances
输出叉积离差阵和协方差阵。
⑵ Missing Values项
① Exclude cases pairwise
剔除本计算变量含有缺失值的数据。
② Exclude cases listwise
剔除所有计算变量含有缺失值的数据。
3.应用举例
例6.1.1 为研究学生的平时作文成绩x与高考作文成绩y的关系,随机抽取50名考生,数据见表6.1.1,试进行相关分析。
表6.1.1 平时作文成绩x与高考作文成绩y
序号 1 2 3 4 5 6 7 8 9 10 x 80 78 90 92 82 72 90 84 64 76 y 29 24 30 32 28 25 27 30 15 25 注:为节省篇幅与输入量,本例只取了10人,实际问题中应尽量多取一些。
选择“Analyze”→“Correlate”→“Bivariate”项,将变量x、y放入“Variables”框;选中“pearson”、“Two-tailed”。
按“
显示全部