回归分析模型.doc
文本预览下载声明
回归分析模型
回归的概念
随机变量与变量 (它可能是多维向量)之间的关系,当自变量确定
之后,因变量的值并不随着确定,而是按一定的统计规律(即随机变量的分布)取值,这时我们将他们之间的关系表示为
其中 是一个确定的函数,称之为回归函数,
为随机项,且 服从
2、回归分析的主要任务之一是确定回归函数,当是一元线性函数时,称之为一元线性回归,当是多元线性函数时,称之为多元线性回归,当是非线性函数时,称之为非线性回归。
3、一元线性回归:设
取定一组不完全相同的值,作独立实验得到对观察结果
其中,是处对随机变量观察的结果。
将数据点代入,有
回归分析的首要任务是通过观察结果来确定回归系数的估计,一般情况下用最小二乘法确定回归直线方程: 中的未知参数,使回归直线与所有数据点都比较接近。即要使残差和或最小。其中
4、化为一元回归
在某些非线性回归方程中,为了确定其中的未知参数,往往可以通过变量代换,把非线性回归化为线性回归,然后用线性回归的方法确定这些参数。下表列出了常用的可线性化回归曲线方程。
曲线方程 变换公式 变换后的线性方程 5、问题:下表是1957年美国旧轿车价格的调查资料,今以表示轿车的使用年数,表示相应的平均价格,试根据这些数据建立一个数学模型,分析旧轿车的平均价格与旧轿车的使用年数之间的关系(实际上是求关于的回归方程)。
(实验报告书写方法可参照课本10.1节模型)
使用年数 1 2 3 4 5 6 7 8 9 10 平均价格 2651 1943 1494 1087 765 538 484 290 226 204 解:作散点图:
x=1:10;
y=[2651,1943,1494,1087,765,538,484,290,226,204];
for i=1:10
plot(x(i),y(i),ok);
hold on
end
%xlabel(x);
%ylabel(y);
看起来与呈指数相关关系,于是令
记,并做的散点图,
x=1:10;
y=[2651,1943,1494,1087,765,538,484,290,226,204];
z=zeros(size(y));
N=length(y);
for i=1:N
z(i)=log(y(i));
plot(x(i),z(i),ok);
hold on
end
xlabel(x);
ylabel(y);
可见各点基本上处于一条直线附近,故可认为
运用matlab计算得:
从而有
x=1:10;
y=[2651,1943,1494,1087,765,538,484,290,226,204];
z=zeros(size(y));
N=length(y);
for i=1:N
z(i)=log(y(i));
end
[p,s]=polyfit(x,z,1)
p =
-0.2977 8.1646
s =
R: [2x2 double]
df: 8
normr: 0.2362
显示全部