基于PageRank算法的社交网络节点重要性排序.doc
论文题目:基于PageRank的社交网络节点重要性排序
第
第PAGE2页共NUMPAGES30页
目录
TOC\o1-3\h\u16537目录 1
2695摘要 2
6409第一章绪论 4
226731.1引言 4
23011.2国内外研究现状 4
230661.3文章组织结构 4
29009第二章社交网络综述 5
140662.1复杂网络概述 5
8782.1.1复杂网络基本概念 5
185132.1.2小世界效应和无标度性 5
131412.2社会网络概述 6
233452.2.1社会网络基本理论 6
100012.2.2社会网络分析方法 6
160102.3微博概述 6
303422.3.1微博的发展 7
174832.3.2微博网络分析 7
26367第三章节点重要性排序 8
213213.1数据集获取 8
266033.2马尔科夫过程 8
229063.3PageRank算法 9
667第四章实验结果与分析 12
105514.1数据集分析 12
156374.2实验结果分析 12
24922第五章总结与展望 14
123245.1论文工作总结 14
162355.2未来的研究和工作 14
21332致谢 14
29770参考文献 16
第
第PAGE3页共NUMPAGES30页
基于PageRank的社交网络节点重要性排序
摘要
社交网络(Socialnetworkservice,SNS)是由许多节点构成的一种社会结构,节点通常是指个人或组织,社会网络中的连边代表节点间存在的社会关系所以它既有网络结构的属性也具有社会网络的特质。目前国内外知名的社交网络平台有Twitter、YouTube、Facebook、新浪微博等。其中新浪微博作为国内最著名的社交网络,截至2019年底,微博月活跃用户达5.16亿,每天有数量庞大的信息发布在该平台,微博在信息传播中发挥的重要作用,当下已经明显超越了传统媒体,所以新浪微博网络具有重要的研究价值。
本文的主要工作包括:首先阐述了复杂网络的小世界效应、无标度特性、“六度分割理论”与“150定律”,介绍了社会网络的分析方法;其次,本文采用网络爬虫方法,采集了微博用户信息,对数据集进行初步处理导并入数据库;然后,介绍了马尔科夫过程,阐述了PageRank算法的基本思想,并说明马尔科夫过程在计算PR值时的用途;最后,将PageRank算法应用到数据集中,得出用户的PR值,对用户重要性进行排序。
关键词:社交网络,新浪微博,用户重要性,PageRank算法
ImportancerankingofsocialnetworknodesbasedonPageRank
Abstract
Socialnetworkservice(SNS)isaninformationsharingplatformbasedonreal-lifefriendrelationship.WiththerapiddevelopmentofInternetindustry,andbenefitfromtheadvantagesofsocialnetworkinformationdissemination,moreandmorepeoplechoosetousesocialnetwork,makingitoneoftheimportantfieldsofInternetindustry.Astheestablishmentofsocialnetworkisbasedontherealfriendrelationship,ithasboththeattributesofnetworkstructureandthecharacteristicsofsocialnetwork.
Atpresent,famoussocialnetworkplatformsathomeandabroadincludetwitter,youtube,Facebook,SinaWeibo,etc.AsthemostfamoussocialnetworkinChina,SinaWeibohasamonthlyactiveuse