基于图神经网络的多视图属性图聚类.pdf
中文摘要
图数据广泛存在于现实世界中,作为典型的非欧式数据,图数据具有排列不规
则的特性,具体表现为邻居节点难以定义,即每个节点的邻居节点数量不是固定的,
这种排列不规则的特性导致传统的多视图聚类算法难以直接应用于图数据。随着图
神经网络的发展,这一难题得以缓解,图神经网络凭借精心设计的网络结构和算法,
巧妙地将图数据的拓扑结构和属性特征相融合,展现出卓越的性能,也因此被广泛
应用于多视图属性图聚类任务中。但还面临着如何更细粒度地学习多视图之间的一
致性和互补性,以避免在融合过程中损失原始信息的问题。此外,加强视图嵌入表
示的跨视图一致性也是一个值得深入研究的难题。针对这些问题,本文主要做了以
下工作:
(1)提出了一种共享和特定表示的多视图属性图聚类算法。为了更细粒度地学
习多视图的一致信息和互补信息,该方法采用先学习再融合的方式,先分别学习每
个视图的共享表示与特定表示,再进行融合。具体来说,首先通过多视图图编码器
获得每个视图的初级表示,进而获得每个视图的共享信息和特定信息;然后对齐视
图共享信息来学习多视图的一致信息,联合视图特定信息来利用多视图的互补信息,
通过差异性约束来处理冗余信息;之后训练多视图解码器重构图的拓扑结构和属性
特征矩阵;最后,附加自监督聚类模块使得图表示的学习和聚类任务趋向一致。将
所提出的算法在三个广泛使用的数据集上进行了实验,验证了所提出方法的有效性。
(2)提出了一种跨视图一致性表示的多视图属性图聚类算法。对于视图嵌入表
示,通过约束视图间的节点相似度矩阵来加强特征级一致性;通过约束聚类级子空
间中的软标签矩阵来加强簇级一致性。具体来说,首先,通过多视图图编码器获得
多个视图的嵌入表示;接着,利用特征级一致性模块加强视图嵌入表示之间的特征
一致性;利用簇级一致性模块使视图嵌入表示的学习过程与聚类任务的联系更加紧
密;随后,通过注意力机制融合多个视图的嵌入表示,并利用融合表示重构图的拓
扑结构;最后,加入自监督聚类模块进一步指导整个模型的学习。将所提出的算法
在三个广泛使用的数据集上进行了实验,验证了所提出的算法能够提高聚类性能。
综上所述,本文对基于图神经网络的多视图属性图聚类的研究提出了两种新算
法,并分别在三个数据集上验证了算法的可行性和有效性。这不仅为进一步探究多
视图属性图聚类提供了崭新的研究思路,而且推动了图神经网络在多视图学习领域
I
的应用和发展,为深入研究多视图属性图聚类提供了稳固的理论基础和切实可行的
实践策略。
关键词:共享信息;特定信息;特征级一致性;簇级一致性;聚类
II
目录
中文摘要I
ABSTRACTIII
1绪论1
1.1研究背景及意义1
1.2国内外研究现状1
1.2.1基于启发式的多视图聚类2
1.2.2深度多视图聚类4
1.3本文主要研究内容5
1.4论文组织结构6
2相关知识9
2.1多视图属性图的定义9
2.2图神经网络9
2.3图表示学习11
2.4多视图表示学习方法12
2.5本章小结13
3共享和特定表示的多视图属性图聚类15
3.1引言15
3.2算法框架介绍16
3.2.1多视图图编码器17
3.2.2多视图共享信息提取17
3.2.3多视图特定信息提取18
3.2.4多视图解码器19
3.2.5自监督聚类20
3.2.6总目标函数21
3.3实验22
3.3.1数据集22
3.3.2基准算法