基于微博的人物关系强度预测模型研究及实现-计算机技术专业论文.docx
文本预览下载声明
学校代码 分 类 号
10701 TP39
学 号 1203121775
密 级 公开
TN82西安电子科技大学
TN82
硕士学位论文
基于微博的人物关系强度 预测模型研究及实现
作者姓名: 李丹
领 域: 计算机技术
学位类别: 工程硕士
学校导师姓名、职称: 李凤华教授
企业导师姓名、职称: 范科峰工程师
提交日期: 2014 年 12 月
The Study and Implementation of Tie Strength Prediction Module Based on Microblog
A thesis submitted to XIDIAN UNIVERSITY
in partial fulfillment of the requirements for the degree of Master of Engineering
By Li Dan
Supervisor: Li fenghua Fan kefeng December 2014
西安电子科技大学
学位论文独创性(或创新性)声明
秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在 导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标 注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰写过的研究成 果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的 材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说 明并表示了谢意。
学位论文若有不实之处,本人承担一切法律责任。
本人签名: 日 期:
西安电子科技大学
关于论文使用授权的说明
本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属于西安电子科技大学。学校有权 保留送交论文的复印件,允许查阅、借阅论文;学校可以公布论文的全部或部分 内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,获得学位 后结合学位论文研究成果撰写的文章,署名单位为西安电子科技大学。
保密的学位论文在 年解密后适用本授权书。
本人签名: 导师签名:
日 期: 日 期:
摘要
摘要
西安电
西安电子科技大学硕士学位论文
I
I
PAGE
PAGE VI
摘要
随着信息技术产业的快速发展,宽带网络和高速移动网络的速度大幅提升, 各种新型网络接入终端设备也变得越来越普及,极大地提高了人们通过网络进行 沟通交流的速度和频率。当下,微博已成为网络思想交流的重要平台、网络舆情 的高度聚集地,是人们交流思想、政府洞察民意的重要窗口。高用户活跃度和大 量博文背后隐藏着重大的数据价值,通过代理数据,准确理解微博用户的交互行 为、挖掘用户关系等数据中所蕴含的信息和影响具有重要的意义。本文基于微博 平台对其所包含的用户关系进行分析和研究,主要研究内容和研究成果如下:
1. 通过对目前微博用户关系研究现状进行整理和分析,选定人物关系强度作 为研究对象,从新浪微博的用户关注和互动关系出发,设计了人物关系强度预测 模型。虚拟社交网络是现实社会社交网络的映射,其人物间的关系强度也具有相 似的影响因素。因此,此模型通过对现实世界中人与人之间关系强度影响因素进 行全面考虑,并将其迁移应用至新浪微博平台,抽取微博信息中反映用户间关系 强度的可用信息,使用相似度、标准差等数学算法或概念将反映用户关系强度的 可用信息转变为具体的数值信息,最终通过线性模型将多个影响因素综合从而进 行定量化分析。
2. 实现了基于微博的人物关系强度预测系统。本系统中最重要的数据采集部 分使用基于模拟登录和基于新浪微博 API 两种方式采集数据,实现了微博用户关 系信息、用户个人资料信息和用户微博内容的自动提取。同时,综合使用上述两 种数据采集方法,不仅避免了直接使用 API 的数据获取限制和用户未登录所造成 的网页内容获取数据的不完整的问题,而且降低了大量数据分析和提取的工作量。
3. 人物关系强度预测系统根据设计的人物关系强度预测模型,对系统中数据 采集部分获取的数据进行整理、分析和计算,预测人物关系强度,同时通过图形 化界面展示人物关系强度。最后将某微博用户的预测模型结果与新浪微博人脉关 系示例进行比较,证明了所设计的人物关系强度模型的有效性。
本文所研究的人物关系强度能够对微博中的用户进行更准确的亲疏关系划分, 基于本文的研究能够支持进一步使用社团分区算法进行更高准确度的好友推荐; 支持舆情的精准发现,在舆情预警机制的使用中提高舆情预警的准确度;支持向 用户推荐不同好友的隐私保护策略,帮助识别用户好友,同时保护用户隐私。
关 键 词:新浪微博,用户关系,关系强度,预测模型,数据采集 论文类型:应
显示全部