文档详情

但彬-hadoop平台的大数据整合.pdf

发布:2016-01-29约2.5万字共34页下载文档
文本预览下载声明
Hadoop 平台的大数据整合 但 彬 Informatica 中国区 2 C时代 • 24小时在线(Connected 24 hours Era) • 全方位网络覆盖 3 C时代带来数据的爆炸性增长 4 通俗的描述:Big Data 大数据(Big Data)是大交易数据,大交互数据和大数据处理的统称。 大交易数据 大交互数据 在线交易处理 在线分析处理 社交媒体数据 其他交互数据 (OLTP) (OLAP) 数据仓库设备 详细呼叫记录、图 像,点击流数据 科学、基因 大数据集成 机器/设备 大数据处理 5 我们需要合理疏导和利用大数据 6 各种各样的数据和标准 最广范围的大数据 平面文件和文档 XML 行业标准 交互数据 定位 社交 名称 = 值 ^/限定\^ 服务资料库 设备/传感器 S S 科学 生产力 任何 DI/BI 体系结构 • 直观解析环境 • 预定义转换 PIG EDW MDM 7 大数据的“提炼” 8 大数据处理 充分利用Hadoo
显示全部
相似文档