第章 变量间的相关分析.doc
文本预览下载声明
第6章 变量间的相关分析
主要内容
第一节、相关关系含义
第二节、相关关系的种类
第三节、线性相关分析
本章你将会学到什么
相关的含义、相关的种类?
什么是相关系数,相关系数如何应用?
如何计算简单的相关系数?
如何解释相关系数的值?
其它类型的相关。
记者的性别与其所选的新闻故事题材之间有无关联性?
广播听众每天收听广播时间的长度与听众的文化水平或收入水平有无关联性?
不同的媒介接触行为和生活形态是否为影响媒介传播效果的主要因素?
在媒介的议程设置中,是媒介决定了“议程”,还是受众对各个问题重要性的看法决定了媒介对议程的“排序”?
这些研究都要涉及到两个或多个变量间的关系以及相关关系和因果关系
注意,统计中所指的变量间的相关联性,一般并不是如同物理定律或数学公式中所表现的那种准确的数量关系。
比如:质量m,物体所受的力F与其所获得的加速度之间的准确的线性关系F=ma
统计中的相关联性一般指的是在“平均来说”意义上的关系。
例如受众的“性别”和“所喜欢的电视节目”之间有相关联性,因为平均来说,女性比男性更喜欢电视剧、港台电影和生活服务类等节目。不过就个体来说,有些男性可能比女性更喜欢电视剧之类的节日。因此在研究或描述变量间的相关联性时,要注意“平均来说”这种特性。
如果两个变量之一的值较大时,另一个变量的值也往往比较大:称X和y为正相关;
如果两个变量之一的值较大时,另一个变量的值往往反而比较小。称X和y为负相关
例如,以往的研究表明,“文化程度”与“对新闻类节目的喜爱程度”一般呈正相关的关系
文化程度越高的受众,平均来说,对新闻类节目的喜爱程度得分也较高。
变量间的关系(相关关系)
(1)变量间关系不能用函数关系精确表达;
(2)一个变量的取值不能由另一个变量唯一确定;
(3)当变量 x 取某个值时,变量 y 的取值可能有几个;
(4)各观测点分布在直线周围。
相关关系的例子
第二节、相关关系的种类
(一)按相关关系的程度:完全相关,不完全相关和不相关。
(二)按相关形式:线性相关和非线性相关。
1.正相关:两个相关现象间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少),即同方向变化。
例如收入与消费的关系。
2.负相关:当一个变量的数值增加(或减少)时,而另一个变量的数值相反地呈减少(或增加)趋势变化,即反方向变化。
例如物价与消费的关系。
相关关系的种类
(一)按变量之间相关的程度
1、完全相关 2、完全不相关 3、不完全相关
(二)按相关关系涉及变量的多少
1、单相关 2、复相关 3、偏相关
(三)按变量之间相关关系的表现形式
1、线性相关 2、非线性相关
(四)对线性相关,按相关的方向
1、正相关 2、负相关
偏相关分析的概念
线性相关分析计算两个变量间的相关关系,分析两个变量间线性关系的程度。往往因为第三个变量的作用,使相关系数不能真正反映两个变量间的线性程度。
如身高、体重与肺活量之间的关系。如果使用相关计算其相关系数,可以得出肺活量与身高和体重均存在较强的线性关系。但实际上,如果对体重相同的人,分析身高和肺活量,是否身高越高,肺活量就越大呢?
否。原因是身高与体重有线性关系,体重与肺活量存在线性关系,因此得出身高和肺活量之间存在着较强的线性关系的错误结论。
偏相关分析的任务就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。
分析身高与肺活量之间的相关性,就要控制体重在相关分析中的影响。
可以在控制了销售能力与各种其他经济指标的情况下,研究销售量与广告费用之间的关系等。
偏相关分析的SPSS过程和实例
菜单:Analyze+Correlate+Partial
Variables:分析变量
Controlling for:控制变量
实例:使用四川绵阳地区3年生中山柏的数据,分析月生长量hgrow与月平均气温temp、月降雨量rain、月平均日照时数hsun、月平均湿度humi这四个气候因素的哪个因素有关。
将月生长量hgrow作为分析变量,
然后分四次,分别将其中的一个因素作为分析变量,而其他三个作为控制变量
用Pearson相关系数
结果:中山柏生长量与气温temp关系最为密切,相关系数0.9774;其次是湿度humi,相关系数0.7310;
日照时数hsun,相关系数0.6318;
与降雨量没有线性关系,降雨量过大,还会影响其生长。
第三节 线性相关分析
一、相关表
二、相关
显示全部