判别分析预测模型与综合评审.doc
文本预览下载声明
5.1判别分析
5.1.1二级判别分析的基本思想
当一个系统的发展变化只有两个方向的时候,根据对占有资料的分析,确定系统某状态下发展方向的方法叫二级判别。如果系统存在多种发展方向,根据对占有资料的分析,确定系统某状态下的发展方向叫多级判别。
举例。某房地产商准备开发一新型住宅,为了确定消费群体状况,以售价和消费水平作为分析影响销售情况的因素,现把消费者购买意向按有意向和无意向两种情况分别汇总整理,得出下表,并以消费水平为,价格水平为 ,做出预计销售状况散点图。
消费者购买意向
组别 消费水平(月收入) 价格水平(元/平米) 有意向 … … … 无意向 … … …
从散点图看,C0+C1X1+C2X2上方为有意向点,下方为无意向点。用数学描述C0+C1X1+C2X20或C1X1+C2X2-C0为有意向;C0+C1X1+C2X20或C1X1+C2X2-C0为无意向.
求出该直线即可解决问题:
Y=C1X1+C2X2称为判别函数。
Y=C0称为判据。-C0是判别准则。
关键在于确定C1、C2、C0。
5.1.2最优判别准则、判别函数和判据的确定
设影响系统的因素有p个,则对系统的综合评价指标可表示为:
Y=C1X1+C2X2+…+CpXp
把系统发展方向分为两组,一组称为A组,数据组,综合评价指标表示;一组成为B组,数据组,综合评价指标表示。
分组数据表
组别 序号 … A组 1 … 2 … … … … … … … B组 1 … 2 … … … … … … …
;
;
费歇尔原理分类原则:如果两组指标的差距越大则判断越容易,同时如果组内综合评价指标差距越小,则它们越集中在附近,越有利于判别,即
因为L是Cj的函数,微分法,,推导得
(5.1式)
由上述式子即可求得Cj,计算综合平均指标的加权平均数Yc
当取一组数据时,,
如果且,则此组数据属于A组;
,则此组数据属于B组;
如果且,则此组数据属于B组;
,则此组数据属于A组。
5.1.3判别分析检验
当预测指标接近Yc时,误判的可能性增大,需对模型进行检验。
检验方法:
(1)根据,确定
(2)按下式计算F值
其中
,S为(5.1式)的系数矩阵。
(3)比较F和,如果F,则判别效果良好,否则判别效果较差。
5.1.4多级判别
步骤:
(1)将问题先分成两大类,建立二级判别模型,求出判据;
(2)在上述的每类中,再分成两类,建立二级判别模型,求出判据;
(3)重复(2),直到满足分级需要为止;
(4)对预测对象先按第一级判别函数和判据确定从属的子类,一直到确定出明确归属为止。
5.1.5判别分析的应用
某市郊区镇进行土地定级工作,依据土地定级规程并结合本镇的具体情况,拟采用网格法,以繁华程度、交通便捷度和文化氛围三个指标作为土地质量评价指标见下表1。网格设置为100m×100m,并以网格中心至商、服中心的距离作为评价繁华度的因素,以距主要交通枢纽站的距离作为评价交通便捷度的因素,以距主要文化设施的距离作为评价文化氛围的因素。现选择12块典型宗地进行详细调查,并按下表2将实际距离转换成分值。现依据典型宗地的分值和定级状况建立判别分析模型对该镇土地定级。
表1 土地质量评价指标
级别 繁华度分值 交通便捷度分值 文化氛围分值 Ⅰ 9 8 7 Ⅰ 7 6 6 Ⅰ 10 7 8 Ⅰ 8 4 5 Ⅰ 9 9 3 Ⅰ 8 6 7 Ⅰ 7 5 6 平均值 Ⅱ 9 8 7 Ⅱ 7 6 6 Ⅱ 10 7 8 Ⅱ 8 4 5 Ⅱ 9 9 3 平均值
表2 距离----分值转换表
距离/m 分值 距离/m 分值 1000以内 1 3000~3500 6 1000~1500 2 3500~4000 7 1500~2000 3 4000~4500 8 2000~2500 4 4500~5000 9 2500~3000 5 5000~5500 10
步骤1 根据(5.1式)求S矩阵:
步骤2 解方程
得
步骤 3 建立判别函数:
步骤4 求判据
步骤5 检验(略)
步骤6 预测。
如某宗地数据为:,
则
因2.4911.725,且,故该宗地属于Ⅱ级。
5.2综合评审
显示全部