MATLAB实验五聚类方法与聚类有效性.doc
文本预览下载声明
广西财经学院学生实验报告
实验课程名称 统计软件及应用1022201630 实验课程类型 基础实验( )专业实验(√ )综合实训( ) 实验项目名称 实验5 聚类方法与聚类有效性 实验时间 实验地点 学生班级 指导老师 学生姓名 学号 学生成绩
(分数) 实验目的和要求:
熟练掌握应用MATLAB软件计算谱系聚类与K均值聚类的命令。
熟练掌握模糊C均值聚类与模糊减法聚类的MATLAB实现。
掌握最优聚类数的理论及其实现。 实验方法和步骤(包括实验所需设备及软件名称):
所需设备:笔记本电脑一台。操作系统:Windows8.1中文版 软件名称:MATLAB(R2016a)
1.计算各样品间的欧氏距离、马氏距离和加权平方距离
2.运用谱系聚类法进行聚类,包括确定最优聚类数,选择合适的类间距离,同时作出谱系图。
3.运用K均值聚类法进行聚类。
4.运用模糊C均值和模糊减法聚类进行聚类。
5.综合分析以上不同的聚类法所得的聚类结果,能得到什么样的结论。
实验内容和数据记录:
输入数据x=[18738.96 778.36 ... 1976.49]
运行如下的matlab程序
d1=pdist(x) %欧氏距离
d2=pdist(x,seuclidean); %加权平方距离
d3=pdist(x,mahalanobis); %马氏距离
z1=linkage(d1) %类间距离为最短距离
figure(1) %谱系聚类图
H=dendrogram(z1)
z2=linkage(d1,complete) %类间距离为最长距离
figure(2)
H2=dendrogram(z2)
z3=linkage(d1,average) %类间距离为类平均距离
figure(3)
H3=dendrogram(z3)
z4=linkage(x,centroid) %重心距离
figure(4)
H4=dendrogram(z4)
z5=linkage(x,ward) %离差平方和
figure(5)
H5=dendrogram(z5)
R=[cophenet(z1,d1),cophenet(z2,d1),cophenet(z3,d1),cophenet(z4,d1),cophenet(z5,d1)]
[n,p]=size(x);
n1=n-1;
format long
c=zeros(n1-1,1);
for j=2:n1
d1=pdist(x);
z2=linkage(d1,complete);
c=cluster(z2,j);
k=1;
if k=j
b=find(c==k);l=length(b)-1;
if b0
a=x(b,:);
c(j)=sum(l*var(a))+c(j);
end
end
end
R2=1-c/sum(n1*var(x));
optimaln=find(R2==max(R2))
[a b]=kmeans(x,12)
n1=length(find(a==1))
n2=length(find(a==2))
n3=length(find(a==3))
n4=length(find(a==4))
n5=length(find(a==5))
n6=length(find(a==6))
n7=length(find(a==8))
n9=length(find(a==9))
n10=length(find(a==10))
n11=length(find(a==11))
n12=length(find(a==12))
[center u]=fcm(x,3);
index1=find(u(1,:)==max(u))
index1=find(u(2,:)==max(u))
index1=find(u(3,:)==max(u))
C=subclust(x,0.6)
运行程序,可以得出结果如下
d1 =
1.0e+04 *
1 至 5 列
1.054814297353804 1.053605582776591 0.969390459556416 0.977711814836560 1.211184800199788
6 至 10 列
0.346155268886666 0.688324914514940 0.492546340824901 1.029284265464114 0.733033330036909
11 至
显示全部