文档详情

模式识别K均值聚类简单实现.doc

发布：2017-03-21约小于1千字共4页下载文档

文本预览下载声明

实验三 K均值算法实验目的：对有一个初步的理解，能够根据自己的设计对算法有一个深刻地认识；理解。实验条件PC微机一台和MATLAB软件。实验原理给定一个数据点集合和需要的聚类数目k，k由用户指定，k均值算法根据某个距离函数反复把数据分入k个聚类中。是d维特征向量，j = 1，2，…，n ；已知类别数K和初始聚类中心的距离；相似性测度可以采用欧氏距离；聚类准则采用误差平方和准则，其准则函数为是第i类的聚类中心。步骤如下：初始化：给定类别数K，初始化聚类中心第次迭代的修正：逐个将样本按照最小距离原则分配给K个聚类中心的某一个。若，则是聚类中心为的样本集。计算新的聚类中心：其中为第一个聚类所包含的样本个数。用均值向量作为新的聚类中心，可使准则函数最小。若令转（2）;将样本逐个重新分类，重复迭代计算。若算法收敛，计算完毕。实验内容：用MATLAB得出30个随机二维向量通过K均值算法kmeans对30个随机二维向量进行分类实验程序及结果： clc; clear; x1=1.2*randn(10,1)+3 y1=1.1*randn(10,1)+3 a=[x1,y1]; x2=1.2*randn(10,1)+6 y2=1.1*randn(10,1)+6 b=[x2,y2]; x3=1.2*randn(10,1)+9 y3=1.1*randn(10,1)+9 c=[x3,y3] figure(1);plot(x1,y1,k.,x2,y2,k.,x3,y3,k.);%用黑点画出30个随机点； X=[a;b;c] [idx,c]=kmeans(X, 3)%kmeans进行分类 figure(2);plot(X(idx==1,1),X(idx==1,2),r.)%用红点画出第一类 hold on plot(X(idx==2,1),X(idx==2,2),b.)%用蓝点画出第二类 hold on plot(X(idx==3,1),X(idx==3,2),g.)%用绿点画出第三类效果图：实验总结：通过本次实验我进一步熟悉了K均值算法的相关知识。此外还在一定程度上锻炼了我的编程能力及对matlab的使用。

显示全部

相似文档