文档详情

基于概念分解的多视图聚类方法研究.pdf

发布:2024-01-30约14.34万字共75页下载文档
文本预览下载声明

摘要

摘要

大数据时代,可获取数据的来源和手段越来越广,这来源不同却对同一

事物属性进行述的数据被称作多视图数据。如何对多视图数据进行有效聚

类成为了当前数据挖掘领域的一个重要研究方向。

非负矩阵分解凭借其将高维复杂数据映射到低维子空间的可操作性和可

解释性被广泛应用到多视图聚类中。然而,基于非负矩阵分解的多视图聚类

方法往往只在隐式空间中进行聚类,围绕着低维表示矩阵探索多视图数据的

一致性信息,忽视了各视图之间的互补性信息。概念分解是非负矩阵分解的

变形,解决了非负矩阵分解只能处理非负数据的局限性,增加了聚类算法的

适用范围。所以,本文以概念分解为主体,探究多视图数据的一致性信息和互

补性信息,利用多视图数据在不同视图、不同空间的多样性进行聚类。

主要研究内容总结如下:

1)融合HSIC独立性准则和概念分解的多视图聚类方法

针对当前基于非负矩阵分解的多视图聚类方法往往只专注于多视图数据

的一致性信息而忽视了不同视图之间的互补性信息的问题,本文出了一种

融合HSIC独立性准则和概念分解的多视图聚类方法。该方法利用希尔伯特-

施密特独立性准则(Hilbert-SchmidtIndependenceCriterion,HSIC)度量各个

视图之间的独立程度,增强了不同视图的多样性,保证了多视图数据的互补

性信息。此外,引入流形正则化约束保持多视图数据的局部几何结构近似不

变,增强了隐式空间的特征表示。最后,对比实验结果表明所出的方法可以

升聚类性能。

2)基于概念分解的显隐空间协同多视图聚类方法

针对当前多视图聚类方法将多视图数据在显式空间和隐式空间中的聚类

看作是两个相互独立过程的问题,本文出了一种基于概念分解的显隐空间

协同多视图聚类方法,充分考虑了多视图数据在隐式空间中的一致性信息与

1

基于概念分解的多视图聚类方法研究

显式空间中的判别性信息。在引入流形正则化的同时,将数据样本在显式空

间中的聚类和隐式空间中的聚类整合到一个共同的框架中进行协同学习和优

化,得到最终的聚类结果。此外,利用极大熵的思想让各视图的权重自适应调

整。最后,在对比实验中证明了该方法优于其他先进的基线模型。

关键词:多视图聚类;概念分解;希尔伯特-施密特独立性准则;流形正则化;

最大熵;

2

Abstract

Abstract

Intheageofbigdata,thereareasharpincreaseinthenumberofsourcesand

meanstocollectdata.Datacomesfromdifferentsourcesbutdescribestheproperties

ofthesamethingiscalledmulti-viewdata.Howtoeffectivelyimplementmulti-

viewdataclusteringhasbecomeanimportantresearchdirectioninthecurrentdata

miningfield.

Non-negativematrixfactorization(NMF)iswidelyusedinmulti-view

clusteringduetoitsoperabilityandinterpretabilityinmappinghigh-dimensional

complexdatatolow-dimensionalsubspace.However,multi-viewclusteringbased

onNM

显示全部
相似文档