聚類分析-城市分类.docx
文本预览下载声明
江苏省13个城市分类表1-1 江苏省各市要素信息城 市常住人口(万人)GDP(亿元)面积(平方公里)第一产业比重第二产业比重第三产业比重南??京771.314230.2665823.05%45.64%51.31%无??锡619.574991.7247881.88%56.82%41.30%徐??州868.192390.161125810.46%52.26%37.29%常??州445.182519.9343853.64%56.74%39.62%苏??州936.957740.2084881.85%58.75%39.41%南??通713.372872.8080018.23%55.96%35.81%连云港444.6594141%46.29%37.30%淮??安481.491121.751007215.24%48.27%36.49%盐??城748.181917.001697217.24%48.19%34.58%扬??州449.551856.3966347.80%56.13%36.06%镇??江306.941672.0838474.49%58.20%37.32%泰??州466.611660.9257978.05%56.78%35.17%宿??迁472.5182630%46.30%34.39%注:数据来源为江苏统计局网站2009年各市数据,常住人口是根据2009年人口变动情况抽样调查数据推算的。一 、史密斯法1.1计算根据各市第二产业、第三产业所占GDP的比重,做出散点图。然后算出13个市第二、三产业比重的平均数,分别向Y轴和X轴做辅助线。分类成果如图:1.2分类徐州、盐城、宿迁、连云港分为一类扬州、南通、泰州、镇江分为一类苏州、无锡、常州分为一类南京为一类1.3局限性本方法过于机械,分类精度较粗,比如徐州和其他苏北城市有一定的差异,但是还被分在同一类。二、纳尔逊法2.1计算计算出江苏省13个城市三次产业的平均数和标准差。表2 -1 第一产业比重第二产业比重第三产业比重平均数0.0905 0.5279 0.3816 标准差0.0619 0.0509 0.0445 方差0.0038 0.0026 0.0020 观测数1313132.2分类对每个城市分类,第一产业超过超过全省平均值一个标准差,为第一级,超出两个标准差,为第二级,以此类推。表2-2城市第一产业等级第二产业等级第三产业等级南京 0-12无锡 -100徐州 000常州 000苏州 -110南通 000连云港1-10淮安 100盐城 100扬州 000镇江 010泰州 000宿迁 1-102.3局限性受到样本容量的限制,容易受到异常值的影响。三、聚类分析将南京、无锡、徐州、常州、苏州、南通、连云港、淮安、盐城、扬州、镇江、泰州、宿迁分别表示为:G1、G2、G3、G4、G5、G6、G7、G8、G9、G1、0G11、G12、G13。第一步:将所有6项指标标准化。结果如下:表3-1人口标准化面积GDP标准化第一产业比重标准化第二产业比重标准化第三产业比重标准化G1 0.7371 0.2084 0.4923 0.0688 0.0000 1.0000 G2 0.4962 0.0717 0.6024 0.0017 0.8528 0.4080 G3 0.8909 0.5647 0.2261 0.4928 0.5050 0.1709 G4 0.2194 0.0410 0.2449 0.1026 0.8467 0.3087 G5 1.0000 0.3536 1.0000 0.0000 1.0000 0.2957 G6 0.6451 0.3165 0.2959 0.3656 0.7872 0.0834 G7 0.2186 0.2783 0.0165 0.8344 0.0496 0.1715 G8 0.2771 0.4743 0.0427 0.7673 0.2006 0.1236 G9 0.7004 1.0000 0.1577 0.8814 0.1945 0.0106 G10 0.2264 0.2123 0.1489 0.3415 0.8002 0.0982 G11 0.0000 0.0000 0.1223 0.1513 0.9580 0.1721 G12 0.2534 0.1486 0.1206 0.3553 0.8497 0.0455 G13 0.2628 0.3587 0.0000 1.0000 0.0503 0.0000 第二步:求相应个点对应的距离,其中的距离为绝对值距离。G1G2G3G4G5G6G7G8G9G10G11G12G13G10G21.99950G32.53442.340D=(dij)13*13=G42.50430.8
显示全部