文档详情

数据挖掘课件分类方法.ppt

发布:2025-02-06约2.46万字共54页下载文档
文本预览下载声明

AQR算法有关定义AQR为每一个分类推导出一条规则,每一条规则形式如下:ifcoverthenpredictclass。在一个属性上的基本测试被称为一个Selector。下面是一些Selector的例子:Cloudy=yes或Temp60。AQR允许测试做{=,≤,≥,≠}。Selectors的合取被称为复合(Complex),Complexes之间的析取被称为覆盖(Cover)。如果一个表达式对某个样本为真,则我们称其为对这个样本的一个覆盖。这样,一个空Complex覆盖所有的样本,而一个空Cover不覆盖任何样本。在AQR中,一个新样本被区分是看其属于哪个推导出来的规则。如果该样本只满足一条规则,则这个样本就属于这条规则;如果该样本满足多条规则,则被这些规则所预测的最频繁的分类被赋予这条规则;如果该样本不属于任何规则,则其分类为样本集中最频繁的分类。第37页,共54页,星期六,2024年,5月AQR算法描述算法4-5AQR输入:正例样本POS;反例样本NEG。输出:覆盖COVER。(1)COVER=Φ;//初始化COVER为空集Φ(2)WHILECOVERdoesnotcoverallpositiveexamplesinPOSDOBEGIN(3)SelectaSEED;/选取一个种子SEED,例如没有被COVER覆盖的一个正样例(4)CallprocedureSTAR(SEED,NEG);//产生一个能覆盖种子而同时排除所有反例的星(5)SelectthebestComplexBESTfromtheSTARaccordingtouser-definedcriteria;/*从星中选取一个最好的复合*/(6)AddBESTasanextradisjucttoCOVER/*把最好的复合与COVER合取,形成新的COVER*/(7)END(8)RETURNCOVER.在算法AQR中调用了过程STAR,来排除所有的反例,产生覆盖种子的星。第38页,共54页,星期六,2024年,5月AQR算法描述(续)算法4-6STAR输入:种子SEED;反例NEG。输出:星STAR。(1)初始化STAR为空Complex(2)WHILEoneormoreComplexesinSTARcoverssomenegativeexamplesinNEGBEGIN/*如果STAR中的一个或多个Complex覆盖NEG中的负样例*/(3)SelectanegativeexampleEnegcoveredbyaComplexinSTAR;/*选取一个被STAR中的Complex覆盖的负样例*/(4)LetEXTENSIONbeallSelectorsthatcoverSEEDbutnotENEG;/*令EXTENSION为那些覆盖SEED但不覆盖ENEG的Selectors;*/(5)LetSTARbetheset{x∧y|x∈STAR,y∈EXTENSION};/*令STAR={x∧y|x∈STAR,y∈EXTENSION};*/(6)RemoveallComplexesinSTARsubsumedbyotherComplexesinSTAR;/*从STAR中除去被其他Complexes所包含的Complexes;*/(7)RemovetheworstComplexesfromSTARUNTILsizeofSTARislessthanorequaltouser-definedmaximum(maxstar)/*删除STAR中最坏的Complex直到STAR的大小等于或小于用户定义的最大数目maxstar*/(8)END(9)RETURNSTAR./*返回一系列覆盖SEED但不覆盖NEG的规则*/第39页,共54页,星期六,2024年,5月AQR算法举例假设现有一个训练集,其包含两种属性:size(属性值:micro,tiny,mid,big,huge,vast)type(属性值:bicycle,motorcycle,car,prop,jet,glider)现有正例、反例样本分别如表4-6,表4-7所示:下面给出用AQR算法对giant2-wheeler类的规则进行获取过程,具体步骤如下:(1)COVER={}。(2)空cover不覆盖任何样本,

显示全部
相似文档