但彬-hadoop平台的大数据整合.pdf
文本预览下载声明
Hadoop 平台的大数据整合
但 彬
Informatica 中国区
2
C时代
• 24小时在线(Connected 24 hours Era)
• 全方位网络覆盖
3
C时代带来数据的爆炸性增长
4
通俗的描述:Big Data
大数据(Big Data)是大交易数据,大交互数据和大数据处理的统称。
大交易数据 大交互数据
在线交易处理 在线分析处理 社交媒体数据 其他交互数据
(OLTP) (OLAP)
数据仓库设备
详细呼叫记录、图
像,点击流数据
科学、基因
大数据集成
机器/设备
大数据处理
5
我们需要合理疏导和利用大数据
6
各种各样的数据和标准
最广范围的大数据
平面文件和文档 XML 行业标准 交互数据
定位 社交
名称 = 值
^/限定\^
服务资料库
设备/传感器
S
S 科学
生产力 任何 DI/BI 体系结构
• 直观解析环境
• 预定义转换
PIG EDW
MDM
7
大数据的“提炼”
8
大数据处理
充分利用Hadoo
显示全部