QCon上海2016-深度学习框架的性能优化及其在医药行业的应用实践-朱智勇.pdf
文本预览下载声明
深度学习框架的性能优化
及其在医药行业的应用实践
朱 智 勇
英特尔亚太研发中心
深度学习框架及性能优化
深度学习在医药行业案例分析
深度学习介绍
o 机器学习的一种 o CNN/RNN/DBN等模型
o 神经网络 o 图形/图像/语音/文本等应用
o 深层线性和非线性
“dog”
Deeper Layers of the Network ?Higher Level Features
深度学习的性能优化
全面的软件优化
涵盖主要深度学习框架
浮点能力的优化
Cache和memory的优化
并行计算的支持
丰富的调优软件
/machine-learning/
单节点优化
Single node optimization Alexnet training on Xeon BDW
AVX 512 20
17.5
AVX
L1
5.5
L2
1
L3
Baseline MKL2016 MKLDNN2017 MKLDNN2017.0.1
Speedup
单节点性能不断飞跃
多节点支持
Training speedup on cluster
60
Hybrid 54
50
40
Activation 27.5
30
20
13.9
显示全部