统计学-第七章-相关分析与回归分析.pptx
第七章相关分析与回归分析第一节:相关分析第二节:一元线性回归分析第三节:多元线性回归分析*
第一节相关分析1.相关关系的种类(1)按相关程度划分完全相关:Y的变化完全由X的变化确定;不相关:Y与X不相互影响,各自独立变化;不完全相关:Y与X之间有一定程度的相互影响。(2)按相关方向划分正相关:X与Y同时变大或变小;负相关:X变大,Y变小或X变小,Y变大。(3)按相关形式划分线性相关:Y与X的关系呈现出线性关系;非线性相关:Y与X的关系呈现出非线性关系。
第一节相关分析1.相关关系的种类(4)按变量多少划分单相关:指两个变量间的相关关系;复相关:指三个以上变量间的相关关系;偏相关:指多个变量情形下,固定其他变量,只考虑其中两个变量间的相关关系。(5)按相关性质划分真实相关:两个变量确实存在内在的相关关系;虚假相关:两个变量只是表现为数量上相关,并不存在内在的联系。
第一节相关分析2.相关表和相关图(1)相关表将某一变量按其数值的大小顺序排列,然后再将与其相关的另一变量的对应值平行排列,便可得到相关表。
第一节相关分析2.相关表和相关图(2)相关图相关图又称散点图,是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量相对应的成对数据用坐标点的形式描绘出来,用于反映两变量之间的相关关系的图形。
1相关系数的定义变量x与变量y之间的相关关系,可用数量指标来表示。2通常以字母表示总体的相关系数,以表示样本的相关3系数。定义如下:4式中,是变量X与变量Y的协方差。第一节相关分析3.相关系数及其计算方法
第一节相关分析3.相关系数及其计算方法(2)相关系数的特点a.r的取值介于-1到1之间;b.当r=0时,X与Y的样本观测值之间没有线性关系;c.在大多数情况下,。r0,说明X与Y正相关;r0,说明X与Y负相关。r值越接近1,X与Y的相关程度越高。微弱相关:低度相关:显著相关:高度相关:
第一节相关分析logo3.相关系数及其计算方法(3)相关系数的计算具体计算相关系数时,通常利用以下公式:【例7-2】基于表7-1中的数据,求广告费与年销售收入间的相关系数。可见,广告费与销售收入间存在高度的相关关系。
12543在二维总体(X,Y)服从正态分布的前提下,Fisher给出了检验简单相关系数(Pearson)显著异于0的t统计量如下:式子中,n是样本容量,r是简单相关系数(Pearson)。设定假设:H0:r=0,H1:r≠0这是一个双尾检验问题。12345第一节相关分析4.样本相关系数(Pearson)显著异于0的T检验
【例7-3】根据表7-3资料计算的相关系数,检验该公司广告费和年销售收入之间的相关系数是否显著(设定显著水平α=0.05)?解:第一步,提出假设:H0:;H1:第二步,计算检验的统计量第三步,统计决策。从下式中可以看出,相关系数显著。01样本相关系数(Pearson)显著异于0的T检验02第一节相关分析
剔除了一个变量Z的影响后,X、Y的偏相关系数此时的偏相关系数计算公式为:式中,是普通样本相关系数。剔除两个变量Z1,Z2的影响后,X、Y的偏相关系数此时的偏相关系数计算公式为:式中,是固定z1的偏相关系数。第一节相关分析
偏相关系数显著异于0的t统计量如下:,服从分布式中,n是样本容量,k是剔除了的变量数,r是偏相关系数。偏相关系数显著异于0的T检验第一节相关分析
第二节一元线性回归分析1.相关分析与回归分析的关系相关分析通过计算相关系数来确定两个变量之间的相关方向和密切程度,回归分析则是选择一个合适的数学模型,对具有相关关系的两个或多个变量之间的具体数量关系进行测定,以实现对因变量的估计或预测。相关分析无需考虑变量作用顺序,回归分析则要考虑;相关分析将变量都视为随机变量,回归分析则只将因变量视为随机变量,自变量被认为是非随机的。
2.一元线性回归模型与回归函数总