模式识别与分类.ppt
模式识别与分类聚类分析实例6个血清样本的分级聚类4,6并4*4*,5并5*1*,3并3*第30页,共39页,星期六,2024年,5月模式识别与分类聚类分析实例6个血清样本的分级聚类1231234651*3*4*5*欧氏距离6个血清样本实际上可分为两类第31页,共39页,星期六,2024年,5月模式识别与分类聚类分析A、B聚后新距离的算法加权均连
weightedaveragelinkage单连法(最近距离)
singlelinkage全连法(最远距离)
completelinkage其他方法第32页,共39页,星期六,2024年,5月模式识别与分类线性学习机LLMK最近邻法KFASIMCA法有监督方法第33页,共39页,星期六,2024年,5月模式识别与分类LLM11111111122222222判别面以分2类(疾病判断)为例存在一判别面,用垂直的
法线(权)矢量w表示与类1中任一样本矢量的夹角
,与类2中线性判别函数s(标量),s0
,s0第34页,共39页,星期六,2024年,5月模式识别与分类LLM步骤已知样本作训练得
法线矢量w未知样本计算s
并预测分类初值w,可随机确定第1个已知样本计算s不符下一个样本计算s继续调整w第35页,共39页,星期六,2024年,5月模式识别与分类LLM实例数据初值第36页,共39页,星期六,2024年,5月模式识别与分类LLM实例修正w不修正须修正以后还需修正1次,最终判别第37页,共39页,星期六,2024年,5月模式识别与分类LLM实例程序clear;closeall;Y=load(E:\bk\jshx\jiazx.txt);Y(:,1)=[];[n,p]=size(Y);cluster=Y(:,p);cluster=cluster*(-2)+3*ones(n,1);%letsymboloffirstcluster=1andsecondcluster=-1Y(:,p)=[];Y_std=Y(1:16,:);clu_std=cluster(1:16,:);Y_unk=Y(17:20,:);clu_unk=cluster(17:20,:);[n_std,p]=size(Y_std);[n_unk,p]=size(Y_unk);PartI数据准备w=ones(1,p)*(-1);%给初值,w设为行矢量fori=1:n_stds=w*Y_std(i,:)‘;%s是标量ifs*clu_std(i,1)0c=(-2)*s/(Y_std(i,:)*Y_std(i,:));w=w+c*Y_std(i,:);endendPartII训练确定wfori=1:n_unks=w*Y_unk(i,:);fprintf(ForunknownsampleNo.:%3.0f\t,i);ifs*clu_unk(i,1)0fprintf(thejudgementisWRONG.\n);elsefprintf(thejudgementisRIGHT.\n);endendPartIII判断未知样本llm.m初值不同,w也不同第38页,共39页,星期六,2024年,5月作业1重现TTFA法对PAH的HPLC-DAD数据进行是否存在的判断。作业220个香烟理化指标的测定数据,前10个样本为双喜,后10个为中华。用PCA对样本分类,并评价各指标的重要性及相关性。用LLM方法计算法向量,并对部分样本进行预报。E:\bk\jshx\data\Yancao.xls第39页,共39页,星期六,2024年,5月模式识别与分类导言Clustering/Classification统称如下问题人眼识别物
中医看舌苔/脉搏
图谱辨别化合物低维与高维数据一次观