基于自监督图表示学习的属性网络异常检测.pdf
基于自监督图表示学习的属性网络异常检测
摘要
属性网络异常检测作为一个重要的研究问题,可分为两大类,新类检测和
节点异常检测。新类检测侧重于检测不存在于训练数据中的新类别,而节点异
常检测的目标是检测与大多数节点表现模式不同的节点。鉴于两种异常检测任
务的不同,本文分析属性网络的特性,分别针对新类检测和节点异常检测设计
了两种解决方法。
针对新类检测,不同于传统的基于One-Class的方法,本文发现在属性网络
中同类数据节点与其邻居节点信息在分布上更加接近,而新类别在分布上与已
知类别具有较大差异。因此,使用邻居信息的新类节点将被重构为已知类节点,
从而导致其与已知类相比具有更大的重构误差。基于此,本文提出了一种基于
邻居感知的新类异常检测方法(Neighbor-awareMaskedAttributedNetwork
AnomalyDetection,NMAD),该方法基于原始特征和以邻居信息掩码填充后的
重构特征之间的重构误差,采用生成式自监督表示学习的方法,通过随机掩码
属性网络中的节点,放入图卷积网络(GraphConvolutionalNetwork,GCN)中,
将节点映射到潜在空间。然后,用相邻节点嵌入填充掩码节点,并将未知类节
点平滑到已知类节点的分布中,放大已知类和新类别重构误差的差异性。
针对节点异常检测,本文发现删除异常节点与其相邻节点之间的边很可能
会导致这些相邻节点所传递信息的差异性增加。因此,本文提出了一种基于邻
居感知的异常节点检测方法(AnomalyCA),该方法采用生成式自监督表示学习
的方法,通过典型相关性分析测量每个节点与其邻居之间的上下文相关性差异
来检测异常。该方法采用权重共享图神经网络骨干来捕捉节点嵌入及其邻居节
点嵌入。通过邻居注意力模块为每个节点汇总节点邻居的特征,并使用相关性
分析方法最大化正常节点与其邻居节点之间的相关性。最后通过测量节点上下
文相关性差异来检测异常。
以上两种方法在针对新类检测和节点异常检测方面具有优越的性能,多个
数据集上的实验结果证明了本文所提出的方法对属性网络异常检测的有效性。
关键词异常检测;属性网络;图卷积网络;掩码填充;关联分析
-I-
AnomalyDetectioninAttributedNetworksBasedon
Self-supervisedGraphRepresentationLearning
Abstract
Attributednetworksisawidelyexistinggraphdatainreal-lifescenarios,suchas
socialnetworks,industrialinformationnetworks,andcomputernetworks.Itis
importanttoidentifyabnormaldatainattributednetworks.Attributednetworks
anomalydetectionisanimportantresearchproblemthatcanbedividedintotwo
categories:noveltydetectionandoutliernodedetection.Noveltydetectionfocuseson
detectingunknownclassesthatdonotexistinthetrainingdata,whileoutliernode
detectionaimstodetectnodeswhoseperformancepatternsdifferfromthemajorityof
nodes.Therefore,targetedanalysisisrequiredforbothnoveltydetectionandoutlier
nodedetection.Giventhedif