文档详情

《数据仓库与数据挖掘》第8章.pptx

发布:2025-03-20约6.23万字共149页下载文档
文本预览下载声明

《数据仓库与数据挖掘》第8章

第6章:关联规则挖掘AssociationruleminingAlgorithmsforscalableminingof(single-dimensionalBoolean)associationrulesintransactionaldatabasesMiningvariouskindsofassociation/correlationrulesConstraint-basedassociationminingSequentialpatternminingApplications/extensionsoffrequentpatternminingSummary2025/3/232

WhatIsAssociationMining?Associationrulemining:Findingfrequentpatterns,associations,correlations,orcausalstructuresamongsetsofitemsorobjectsintransactiondatabases,relationaldatabases,andotherinformationrepositories.Frequentpattern:pattern(setofitems,sequence,etc.)thatoccursfrequentlyinadatabase[AIS93]Motivation:findingregularitiesindataWhatproductswereoftenpurchasedtogether?—Beeranddiapers?!WhatarethesubsequentpurchasesafterbuyingaPC?WhatkindsofDNAaresensitivetothisnewdrug?Canweautomaticallyclassifywebdocuments?2025/3/233

关联规则挖掘的基本概念购物篮分析-引发关联规则挖掘的例子问题:“什么商品组或集合顾客多半会在一次购物中同时购买?”购物篮分析:设全域为商店出售的商品的集合(即项目全集),一次购物购买(即事务)的商品为项目全集的子集,若每种商品用一个布尔变量表示该商品的有无,则每个购物篮可用一个布尔向量表示。通过对布尔向量的分析,得到反映商品频繁关联或同时购买的购买模式。这些模式可用关联规则描述。〖例〗购买计算机与购买财务管理软件的关联规则可表示为:computerfinancial_management_softwar [support=2%,confidence=60%]support为支持度,confidence为置信度。该规则表示:在所分析的全部事务中,有2%的事务同时购买计算机和财务管理软件;在购买计算机的顾客中60%也购买财务管理软件。2025/3/234

WhyIsFrequentPatternorAssoiciationMininganEssentialTaskinDataMining?FoundationformanyessentialdataminingtasksAssociation,correlation,causalitySequentialpatterns,temporalorcyclicassociation,partialperiodicity,spatialandmultimediaassociationAssociativeclassification,clusteranalysis,icebergcube,fascicles(semanticdatacompression)BroadapplicationsBasketdataanalysis,cross-marketing,catalogdesign,salecaignanalysisWeblog(clickstream)analysis,DNAsequenceanalysis,etc.2025/3/235

关联规则关联(Associations)分析的目的是为了挖掘隐藏在数据间的相互关系,即对于给定的一组项目和一个记录集,通过对记录集的分析,得出项目集中的项目之间的相关性。项目之间的相关性用关联规则来描述,关联规则反映了一组数据项之间的密切程度或关系。〖定义8-1〗令I={i1

显示全部
相似文档