大数据概念与应用.pdf
全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用
B
I
G
D
A
T
大数据A
刘鹏主编张燕张重生张志立副主编
刘鹏
教授,清华大学博士。现任南京大数据研究院院长、中国信息协会大数据分会副会长、
中国大数据技术与应用联盟副理事长。
主持完成科研项目25项,发表论文80余篇,出版专业书籍15本。获部级科技进步二等
奖4项、三等奖4项。主编的《云计算》被全国高校普遍采用,被引用量在国内计算机图书类
排名居前。创办了知名的中国云计算(chinacloud.cn)和中国大数据(thebigdata.cn)网
站。
曾率队夺得2002PennySort国际计算机排序比赛冠军,两次夺得全国高校科技比赛最
高奖,并三次夺得清华大学科技比赛最高奖。
荣获“全军十大学习成才标兵”(排名第一)、南京“十大杰出青年”、江苏省中青年
科学技术带头人、清华大学“学术新秀”等称号。
全国高校标准教材《云计算》姊妹篇,剖析大数据核心技术和实战应用
第一章大数据概念与应用
1.1大数据的概念与意义
1.2大数据的来源
1.3大数据应用场景
1.4大数据处理方法
习题
3of40
1.1大数据的概念与意义第一章大数据概念与应用
1.从“数据”到“大数据”
时至今日,“数据”变身“大数据”,“开启了一次重大的时代转型”。
“大数据”这一概念的形成,有三个标志性事件:
•2008年9月,美国《自然》(Nature)杂志专刊——Thenextgoogle,第一次正
1式提出“大数据”概念。
•2011年2月1日,《科学》(Science)杂志专刊——Dealingwithdata,通过社
会调查的方式,第一次综合分析了大数据对人们生活造成的影响,详细描述了人类
2面临的“数据困境”。
•2011年5月,麦肯锡研究院发布报告——BigdataThenextfrontierfor
innovation,competition,andproductivity,第一次给大数据做出相对清晰的定义: