文档详情

模式识别大作业-k近邻.doc

发布:2016-12-24约6.98千字共10页下载文档
文本预览下载声明
姓名: 学号: 题目 对sonar和wdbc中数据表分类实验结果表 表1 实验数据维数个数wdbc 2 30 =357 =212 sonar 2 60 =98 =110 解: 实验结果 准确率 Sonar 0.5569 Wdbc 0.8514 K-Means聚类算法 一.算法思想 K-均值算法的主要思想是先在需要分类的数据中寻找K组数据作为初始聚类中心,然后计算其他数据距离这三个聚类中心的距离,将数据归入与其距离最近的聚类中心,之后再对这K个聚类的数据计算均值,作为新的聚类中心,继续以上步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。 在本次算法实现中,选择在两类样本点中随机选择两个点作为两类数据的初始聚类中心,然后在开始迭代,计算,直至找到最优分类。 二.算法流程图 三.程序运行结果 1、对sonar数据进行k均值聚类 表一:sonar(Kmeans) 运行次数 准确率 1 0.5913 2 0.6030 3 0.5048 4 0.5817 5 0.4904 6 0.5192 7 0.6731 8 0.5721 9 0.5096 10 0.5240 平均准确率 0.5569 程序迭代次数:6 得到第一类聚类中心是 (0.0325 0.0443 0.0469 0.0585 0.0717 0.0983 0.1162 0.1306 0.1742 0.1990 0.2179 0.2389 0.2562 0.2737 0.2965 0.3458 0.3568 0.3937 0.4486 0.5130 0.5266 0.4825 0.4894 0.5234 0.5312 0.5745 0.5790 0.6056 0.5951 0.5803 0.5220 0.4791 0.5020 0.5387 0.5508 0.5327 0.4823 0.4541 0.4271 0.3914 0.3547 0.3225 0.2724 0.2381 0.2208 0.1799 0.1263 0.0908 0.0525 0.0223 0.0161 0.0144 0.0118 0.0118 0.0107 0.0091 0.0091 0.0089 0.0094 0.0073) 得到第二类聚类中心是 (0.0264 0.0336 0.0413 0.0501 0.0781 0.1097 0.1263 0.1383 0.1811 0.2159 0.2510 0.2596 0.2874 0.3155 0.3397 0.4055 0.4647 0.5007 0.5511 0.6043 0.6771 0.7411 0.7769 0.7957 0.7943 0.8032 0.8037 0.7669 0.6808 0.5814 0.4900 0.4060 0.3473 0.2916 0.2621 0.2630 0.2661 0.2453 0.2422 0.2450 0.2353 0.2418 0.2252 0.1943 0.1778 0.1447 0.1193 0.0919 0.0514 0.0189 0.0160 0.0126 0.0098 0.0102 0.0081 0.0075 0.0068 0.0072 0.0067 0.0058) 2、对wdbc数据进行k均值聚类 表二:wdbc(Kmeans) 运行次数 准确率 1 0.8514 2 0.8514 3 0.8514 运行了几次程序,发现准确率一直保持不变,分析可能是由于两类数据比较集中而类间距离又足够大导致,随机选择的样本点对数据分类没有产生什么影响。 程序迭代次数:11 得到的第一类聚类中心是: 1.0e+003 * (0.019
显示全部
相似文档