文档详情

基于自监督学习的属性图异常检测方法研究.pdf

发布:2025-04-03约9.22万字共56页下载文档
文本预览下载声明

基于自监督学习的属性图异常检测方法研究

研究生姓名:席鹏晖导师姓名:张师超

学科:软件工程研究方向:数据挖掘和深度学习年级:2021级

摘要

图结构数据是一种广泛使用的描述复杂系统的通用语言,可应用于社交网络、推

荐系统、生物信息学等领域。然而,在属性图异常检测中,检测异常数据是一个具有

挑战性的任务,因为通用的检测方法在处理非欧氏空间数据时效果有限,异常样本和

正常样本之间存在数量上的不平衡,且异常在图结构中违背了同质性假设。传统领域

的异常检测方法在处理上述问题时存在困难,并且在检测性能方面表现不佳。具体而

言,现有的异常检测方法主要集中在残差分析和社区发现等浅层技术上。然而,这些

浅层方法在训练过程中忽略了属性图复杂的结构信息,导致结果不理想且无法解释。

随着深度学习领域的发展,研究者们采用自编码器作为底层框架的深度学习方法。然

而,由于自编码器并非专门为异常检测任务设计,因此其检测性能仅能达到次优水平。

(1)为了识别更丰富的局部信息,在属性图异常检测领域,本文提出了一种新

型的局部信息识别方法。具体而言,为了利用上下文结构信息,首先通过从目标节点

生成不同的子图结构,构建对比学习表示法。同时,通过使用目标节点邻域信息的自

编码器来重建整个图,从而学习到更丰富的局部信息。此外,为了更好地理解复杂的

图结构,本研究采用异常分数估计来预测异常样本。通过邻域子结构和自编码器充分

学习邻域信息,提高了模型的异常检测性能。该研究在五个真实数据集上进行了广泛

的实验,结果展示了该模型在性能上的卓越表现。

(2)为了应对图数据错综复杂的拓扑结构、高维属性特征和类不平衡问题,本

文提出了一种用于属性图异常检测的双掩码自编码器模型。该模型旨在学习图网络更

好的潜在表示以进行异常检测任务。首先,通过随机掩码原始图数据的节点和连接,

生成一个新的掩码图结构。模型通过双自编码器学习图数据的潜在表示,其中一个自

编码器用于重建原始图数据,另一个用于重建掩码图数据,从而帮助识别属性图数据

中的异常节点。随后,为了从相关特征中捕获异常信息,模型采用随机再掩码策略,

利用掩码图中学习到的潜在表示。最后,利用从双自编码器学习到的潜在表示计算节

点的异常得分。与当前先进的五种方法相比,该模型能够提升属性图的异常检测性能。

关键词:图神经网络;图自监督学习;异常检测;对比学习;图自编码器

ResearchonAttributeGraphAnomalyDetectionMethodBased

onSelf-SupervisedLearning

Graduatestudent:PenghuiXi

Supervisor:ProfessorShichaoZhang

Major:SoftwareandEngineering

Researchdirection:DataminingDeepLearning

Grade:2021

Abstract

Graph-structureddataservesasauniversallanguagefordescribingcomplexsystems

andfindsapplicationsinvariousdomainssuchassocialnetworks,recommendationsystems,

andbioinformatics.However,detectinganomaliesinattributegraphsposesachallenging

task.General-purposedetectionmethodsexhibitlimitedeffectivenesswhendealingwith

non-Euclideanspatialdata,imbalancedratiosbetweennormalandanomaloussamples,and

violationsofhomogeneityassumptionsingrap

显示全部
相似文档