百度人工智能报告.pptx
文本预览下载声明
百度人工智能
2017年9月
技术创新是推动人类历次产业变革的核心要素
第一次工业革命 – 机械化
第二次工业革命 – 电气化
第三次工业革命 – 信息化
第四次工业革命 – 智能化
AI 是新时代的电力
1956
1974
1980
1987
1993
2006
AI的诞生
1956达特矛斯 会议,“人工智 能”正式诞生
孕育期
电子计算机 机器翻译与NLP 图灵测试 计算机下棋 早期神经网络
搜索式推理
聊天机器人
乐观思潮
所有的AI程序 都只是“玩具”
运算能力
计算复杂性
常识与推理
专家系统
知识工程
五代机
神经网络重生
未达预期 削减投入
摩尔定律
统计机器学习
AI广泛应用
大数据
计算能力
应用增多
深度学习
人工智能发展历程
人工智能
2016
人工智能迎来新机遇的动因
GPU使训练深度神经网络的速度提升255倍
计算能力突破
数据井喷
全球数据中心数据量在未来几年年均增速40%
— Cisco Global Cloud Index
算法突破
算法突破推动AI技术成熟和实用化
传统神经网络
深度神经网络
12000GFLOPS
CPU:Core2 Extreme X6800
47GFLOPS
2006年
2017年
GPU:TITAN Xp
互联网+人工智能
需求
在线化
数据 在线化
活跃的生态
大数据
算法
大计算
互联网发展所带来的
人工智能复兴的必要条件
百度人工智能技术布局
语音 图像 视频 AR / VR
感知层
认知层
自然语言处理 知识图谱 用户画像
平台层
AI 开放平台()
应用层
大数据
算法
大计算
基础层
产品应用
AI技术生态
生态层
百度人工智能技术布局
应用层 产品应用
生态层 AI技术生态
平台层 AI 开放平台()
认知层 自然语言处理 知识图谱 用户画像
感知层 语音 图像 视频 AR / VR
大数据
算法
大计算
基础层
• 20+大型IDC,10+国家/地区
• 高性能网络带宽和吞吐能力
• 国内最大规模GPU/FPGA集群
大计算
蜂巢2.0预制模块
• 15种组件,工期节省50%+
• 无架空地板,交付效率提升20倍
M1集装箱数据中心
• 开创国内互联网公司应用先河
• 按需部署、即装即用
天蝎整机柜服务器规模部署
• 中国首个硬件开源项目
• 2个版本技术规范,6项行业标准
模块化数据中心
大数据
互联网数据
日志数据
垂类数据
大数据采集
大数据提炼
大数据应用
线上
线下
时间 人
场所
内容 服务
物
超大规模
实时计算能力
深度学习 与挖掘
智能预测 推荐算法
多端跨屏
用户精准识别
行业提升与变革
方法论积淀
创新探索
大数据技术
应用示例——保险:精细化定价能力,高效风控
提升保费收入
个性化受众营销
差异化,精细化产品定价
客户欺诈骗保预警
高效 风险管理
降低 赔付成本
挖掘高价值客户
例如 成功购买的客户
分析客群特征
用户画像
+
上网行为
全网扩充目标客群
+361%
广告点击率
精准营销广告投放
新华少儿险网上营销案例
百度人工智能技术布局
语音
图像
视频
AR / VR
感知层
应用层 产品应用
生态层 AI技术生态
平台层 AI 开放平台()
认知层 自然语言处理 知识图谱 用户画像
基础层 大数据 算法 大计算
AI
语音技术
多场景语音识别、合成和唤醒
语音识别
语音合成
语音唤醒
• 距离小于1米,中文字准率97%+
• 支持耳语、长语音、中英文混合
及方言
近场
• 近场数据适配
• 麦克风阵列适配
• 中国家庭适配
远场
语音识别
• 增强对话感、个性声音、生动对话
• 情绪相应、融入更多情感的对话体验
• 追求极致自然音色
• 个性化和明星音合成
语音合成
开心
平和
婉转
生气
沮丧
伤心
激动
• 海量唤醒词数据,用户可配置
• 误唤醒率低
语音唤醒
车载唤醒
家居唤醒
指令唤醒
AI
人脸技术
多场景静态、动图人脸识别
常规人脸识别
动态人脸识别
人脸检测
人脸比对
人脸查找
人脸识别
实时人脸检测 / 跟踪
算法自动抓取或生成高质量
人脸图片
千万级人脸库实时 1:N 高精度识别
动态人脸识别
AI
视觉技术
视觉技术解决方案,硬件开源, 软件开放
图像技术
视频技术
机器人视觉
图像技术--细粒度图像识别
图像主体检测
动物识别
植物识别
菜品识别
车辆识别
春雏菊
腌笃鲜
东风标致308
虎
泰姬陵
通用文字识别
网络图片文字识别
卡证识别
表格文字识别
通用票据识别
图像技术-- OCR
视频技术—视频分割
世界第一个室外语义分割 RGBD 视频数据集(中关村软件园 - 两千米),3000 帧,全标注
相机图
叠加图
深度图
类别图
扫描区域
视频技术—视频语义理解
SLAM
障碍物检测
地图重建
显示全部