周涛:电子商务大数据-for2013亿玛智慧峰会.pdf
文本预览下载声明
Personalize the
Internet
电子商务大数据
周涛
百分点科技
主要内容
• 大数据概念和战略
• 电子商务大数据理念
• 电子商务大数据基础
• 电子商务大数据场景
• 电子商务大数据应用
– 推荐引擎基础常识
– 场景引擎关键作用
– 规则挖掘机器学习
– 电子商务大数据外部应用
大数据概念和战略
数 数
据 据
总 形
量 态
变 变
化 化
数 数
据 据
关 服
联 务
变 变
化 化
大数据概念和战略
规模巨大(Volume ) 巨量:从TB级别,跃升到PB级别,甚至ZB级别。
高速产生(Velocity ) 动态:数据高速持续生成,要求处理能力高,具有
很强的实时性。
形式多样(Variety ) 多态:数据类型繁多,如文本、视频、音频、图片
等及其变化组合。
价值:数据中潜藏巨大价值,数据量越大,一般而
潜藏价值(Value ) 言数据的价值密度反而越低。
大数据是基于多源异构、跨域关联的海量数据分析所产生的决策
流程、商业模式、科学范式、生活方式和观念形态上的颠覆性变
化的总和。数据储备和数据分析能力将成为未来新型政府和新型
企业最重要的核心战略能力。
电子商务大数据理念
电子商务大数据基础:数据储备
覆盖几乎所有知名的网站和论坛,每天
1300G的纯本文更新;
1.7亿微博活跃用户全关系网络,1000万最有
影响力用户微博内容,微博全量数据每18天
更新一次;
2亿用户的LinkedIn ,人人网络等社交媒体
人口统计数据和关系数据;
550余家电商,350多家媒体,覆盖衣、食、
住、行、3C、美妆、孕、婴、童、阅读、健
康、运动、办公等领域,3亿独立用户,
1000万+标品SKU ,超过1亿非标SKU ,自建
4级商品类目体系,2万+行业词库和标签库;
1.5亿智能手机应用活跃及广告展示点击记录,
2000万智能手机用户的轨迹数据;
…
显示全部