深度学习入门指导 光环大数据深度学习培训.pdf
文本预览下载声明
光环大数据--大数据培训知名品牌
深度学习入门指导 光环大数据深度学习培训
近日,Rachel Thomas 在fast.ai 上发布了一篇博文《What you need to do
deep learning》,他希望通过这篇文章回答一些深度学习入门者经常会问到的问
题:什么样的电脑才能用来做深度学习?为什么 fast.ai 推荐使用英伟达的
GPU 呢?哪些深度学习库不适合初学者?你又是如何将深度学习应用到实际生
产中的?
Rachel Thomas 认为,所有的这些问题都可以归结到一个主题,那就是“究
竟需要准备好哪些东西(硬件、软件、知识背景以及数据等)才能开始深度学习?”。
所以本篇博客正是针对那些想入门深度学习以及对深度学习感兴趣的新人而写
的。
一、硬件基础
关于硬件基础,我们首先不得不感谢一下游戏工业的蓬勃发展。
视频游戏工业的体量(就盈利而言)远远超出了电影工业和音乐工业之和
(/RYyaZ9Y)。在过去的 20 年里,视频游戏工业极大地推进了 GPUs
(图像处理单元)的发展进步,这是由于GPU 可用于加速游戏图像渲染的矩阵
数学运算过程。并且非常幸运的是,深度学习运算中也涉及到大量的矩阵操作。
光环大数据
光环大数据--大数据培训知名品牌
而这些年在 GPU 上取得运算能力的进步也正是为什么神经网络算法在早期没有
发挥出效力,直到在近几年才展露头角的原因之一。因为在没有 GPU 的条件下,
要训练一个深度学习模型在大多数情况下都将是一个非常漫长而痛苦的过程。
图一 英伟达Tesla 系列显卡
注意 GPU 的选择
大多数的深度学习从业者并不需要直接通过编程来操控 GPUs,而是使用一
些诸如 PyTorch 或 TensorFlow 这样的软件包来实现的。但是为了能够高效地
使用这些软件包,我们必须购买正确的 GPU,而这几乎就等价于我们需要购买英
伟达出产的 GPU (/zjYolU1)。
CUDA (/zj4MD9I) 和 OpenCL (/RYya30e)是当
前用来实现 GPU 编程的主流方式。CUDA 是迄今为止发展最好的,拥有最广泛生
态系统的,也是最被深度学习框架支持的集成技术。由于 CUDA 是由英伟达创建
的集成技术,所以它无法被其它公司的 GPU 所使用。所以当 fast.ai 推荐使用
英伟达的 GPU 时,并不是因为我们对英伟达公司有好感或者说英伟达给了好处,
而仅仅是因为这是目前深度学习的最佳选择。
光环大数据
光环大数据--大数据培训知名品牌
英伟达在 GPUs 的市场中占据着绝对的统治地位,然后紧随其后的竞争者则
是 AMD。在这个夏天,AMD 发布了 ROCm (/RYySiUl)平台,用于对
深度学习提供更多的技术支持。当前 ROCm 平台对于主流的深度学习框架(诸如
PyTorch, TensorFlow 和 CNTK 等)的支持还处于开发阶段。因为 ROCm 平台进
行了开源,并且能够为深度学习的底层提供更多的选择,我是非常希望它能够取
得成功的,但还是不得不承认 ROCm 的文档比较晦涩难懂。以至于尽管我想要这
里介绍一下 ROCm 平台,但是在阅读了 ROCm 网站提供的 Overview、Getting
Started 和 Deep Learning 页面之后却依然无法通过自己的语言来描述和解释
ROCm。(我承认自己没有硬件知识背景,但是我认为像我这样的数据科学家应该
成为该项目的目标读者之一)
如果没有 GPU
如果你的电脑不具有 GPU 或者是没有英伟达产的 GPU,你还拥有以下几个
选择:
使用 Crestle,仅仅需要使用浏览器进行操作。Crestle 提供了一套已
经配置成熟的云服务方案(由 fast.ai 的学生 Anurag Goel 开发),云服务器
中已经预装了所有的主流科学计算与深度学习将使
显示全部