应用多元统计朱建平第二版第四章8、9、10答案[.doc
文本预览下载声明
4.8某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。
销售情况
产品序号
销售价格
口味评分
信任度评分
畅销
1
2.2
5
8
2
2.5
6
7
3
3.0
3
9
4
3.2
8
6
平销
5
2.8
7
6
6
3.5
8
7
7
4.8
9
8
滞销
8
1.7
3
4
9
2.2
4
2
10
2.7
4
3
= 1 \* GB2 ⑴ 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。
= 2 \* GB2 ⑵ 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。
解:贝叶斯判别法,由SPSS可得表1和表2
表1
分类函数系数
销售情况
畅销
贫销
滞销
销售价格
-11.689
-10.707
-2.194
口味评分
12.297
13.361
4.960
信任度评分
16.761
17.086
6.447
(常量)
-81.843
-94.536
-17.449
Fisher 的线性判别式函数
如表1所示,销售情况栏中的每一列表示样品判入相应列的贝叶斯判别函数系数。则各类的贝叶斯判别式函数如下:
第一组: F1=–81.843–11.689X1 + 12.297X2 + 16.761X3
第二组: F2=–94.536–10.707X1 + 13.361X2 + 17.086X3
第三组: F3=–17.449–2.194X1 + 4.960X2 + 6.447X3
将样品的自变量代入上述三个贝叶斯判别函数,得到三个函数值,分别为:
F1=65.271 ,F2=65.661 ,F3=47.884
比较三个值,可以看出F2=65.661最大,据此可以得出该待判样品应该属于第2组。则改新品牌的饮料在该超市试销的销售情况是贫销。
表2
按照案例顺序的统计量
案例数目
最高组
判别式得分
P(Dd | G=g)
实际组
预测组
p
df
P(G=g | D=d)
到质心的平方 Mahalanobis 距离
函数 1
函数 2
初始
1
1
1
.513
2
.932
1.337
2.766
-1.626
2
1
1
.995
2
.829
.011
2.080
-.725
3
1
1
.531
2
.974
1.268
1.153
-1.528
4
1
2**
.734
2
.714
.619
1.948
.791
5
2
1**
.535
2
.633
1.249
1.394
.176
6
2
2
.951
2
.822
.100
2.954
.721
7
2
2
.342
2
.985
2.148
3.816
1.911
8
3
3
.260
2
1.000
2.695
-4.112
-.961
9
3
3
.538
2
1.000
1.239
-6.386
.548
10
3
3
.811
2
1.000
.418
-5.613
.693
11
未分组的
2
.165
2
.597
3.598
.825
.969
**.错误分类的案例
由表2可得,产品4和产品5实验组和预测组数据不同,且预测组数据上带有**,其中**表示错误分类的案例。产品4实际被分为第一组“畅销”中,预测出来的却被分到第二组“贫销”中;产品5实际是被分入第二组“贫销”中,预测出来的结果却被分到第一组“畅销”中;其他产品实际结果和预测结果保持一致。
4.9银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄()、受教育程度()、现在所从事工作的年数()、未变更住址的年数()、收入()、负债收入比例()、信用卡债务()、其它债务()等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据, = 1 \* GB2 ⑴根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。 = 2 \* GB2 ⑵某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。
目前信用好坏
客户序号
已履行还贷责任
1
23
1
7
2
31
6.60
0.34
1.71
2
34
1
17
3
59
8.00
1.81
2.91
3
42
2
7
23
41
4.60
0.94
.94
4
39
1
19
5
48
13.10
1.93
4.36
5
35
1
9
1
34
5.00
0.40
1.30
未履行还贷责任
6
37
1
1
3
24
15.10
1.80
1.82
7
显示全部