文档详情

·编写K-均值聚类算法程序,对下图所示数据进行聚类分析(选k=2).doc

发布:2017-08-27约2.31千字共4页下载文档
文本预览下载声明
· 编写K-均值聚类算法程序,对下图所示数据进行聚类分析(选k=2): 解:用matlab编写k-均值聚类程序: % kmean.m % k-均聚类算法 clear; % main variables dim = 2; % 模式样本维数 k = 2; % 设有k个聚类中心 fid = fopen(test.txt); PM = fscanf(fid,%g %g,[2 inf]); PM = PM; % 模式样本矩阵 fclose(fid); N = size(PM,1); CC = zeros(k,dim); % 聚类中心矩阵,CC(i,:)初始值为i号样本向量 D = zeros(N,k); % D(i,j)是样本i和聚类中心j的距离 C = cell(1,k); %% 聚类矩阵,对应聚类包含的样本。初始状况下,聚类i(ik)的样本集合为[i],聚类k的样本集合为[k,k+1,...N] for i = 1:k-1 C{i} = [i]; end C{k} = k:N; B = 1:N; % 上次迭代中,样本属于哪一聚类,设初值为1 B(k:N) = k; for i = 1:k CC(i,:) = PM(i,:); end while 1 % 打印C,CC for i = 1:k disp(C{i}); end; disp(CC); change = 0; % 对每一个样本i,计算到k个聚类中心的距离 for i = 1:N for j = 1:k D(i,j) = eulerDis( PM(i,:), CC(j,:) ); end t = find( D(i,:) == min(D(i,:)) ); % i属于第t类 if B(i) ~= t % 上次迭代i不属于第t类 change = 1; % 将i从第B(i)类中去掉 t1 = C{B(i)}; t2 = find( t1==i ); t1(t2) = t1(1); t1 = t1(2:length(t1)); C{B(i)} = t1; C{t} = [C{t},i]; % 将i加入第t类 B(i) = t; end end if change == 0 break; end % 重新计算聚类中心矩阵CC for i = 1:k CC(i,:) = 0; iclu = C{i}; for j = 1:length(iclu) CC(i,:) = PM( iclu(j),: )+CC(i,:); end CC(i,:) = CC(i,:)/length(iclu); end end 2. 程序中test.txt为: 0 0 1 0 0 1 1 1 2 1 1 2 2 2 3 2 6 6 7 6 8 6 6 7 7 7 8 7 9 7 7 8 8 8 9 8 8 9 9 9 即各样本向量。 3. 运行程序输出为: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 0 1 0 1 3 2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0 0.5000 5.6667 5.3333 1 3 2 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1.2500 1.1250 7.6667 7.3333 整理数据为:
显示全部
相似文档