微软azure云端大数据解决方案概览.pdf
文本预览下载声明
微软Azure云端
大数据解决方案概览
张强,首席技术顾问
微软(中国)有限公司
议题
大数据生态现状
微软云端大数据概览
成功案例
问答
什么是大数据?
社交数据(微博/微信) 大数据
音频/视频
Petabyte 维基/博客 传感器/RFID/设备 日志文件
点击流
空间GPS协调
移动 WEB2.0 协作
Terabyte 广告 电子商务 数据营销源
数字化营销
Gigabyte ERP/CRM 搜索营销 电子政务源
应付款 联系人
(企业内部数据)
Web日志 天气
薪酬 订单追踪
Megabyte
推荐 文字/图像
盘存 销售管道
数据复杂度:多样化与高速度
大数据建设特点
大数据对对数据质量的要求不像传
非结构化数据非结构化数据的超大规模和增长的超大规模和增长
总数据量的总数据量的80~90%80~90% 统要求那么高
体量Volume 比结构化数据增长快比结构化数据增长快1010倍到倍到5050倍倍 数据的要求是尽量要多样化,要海
是传统数据仓库的是传统数据仓库的1010倍到倍到5050倍倍
量,
大数据的异构和多样性大数据的异构和多样性 大数据建设是一个持续不断优化的
多样性 很多不同形式(文本、图像、视频、机很多不同形式(文本、图像、视频、机 过程,而不只是一个结果,通过不
器数据)器数据)
Variety 无模式或者模式不明显无模式或者模式不明显 断的大数据分析与验证,训练一个
不连贯的语法或句义不连贯的语法或句义 适合企业自身特点的业务模型
实时分析实时分析而非批量式分析而非批量式分析 大数据更多的是对未来的预测性分
速度Velocity 数据输入、处理与丢弃数据输入、处理与丢弃
立竿见影而非事后见效立竿见影而非事后见效 析,而非对过去数据的总结性分析
大数据战略价值
数据成为继物质、能源之后的第三大战略资源。大数据提供了认识复杂系统的新
思维、新手段
显示全部