文档详情

gpgpu体系结构综述.docx

发布:2018-12-13约1.1万字共16页下载文档
文本预览下载声明
计算机 体系结构作业 作业题目: GPGPU综述 姓 名: 学 号: 班 级: 研 1628 2016 年 秋季 学期 目录 TOC \o 1-3 \h \z \u HYPERLINK \l _Toc467238428 1、引言 PAGEREF _Toc467238428 \h 2 HYPERLINK \l _Toc467238429 2、GPU的发展历史 PAGEREF _Toc467238429 \h 3 HYPERLINK \l _Toc467238430 3. 最新研究 PAGEREF _Toc467238430 \h 5 HYPERLINK \l _Toc467238431 3.1 Tesla P100 PAGEREF _Toc467238431 \h 5 HYPERLINK \l _Toc467238432 3.2 Radeon RX 480 PAGEREF _Toc467238432 \h 7 HYPERLINK \l _Toc467238433 4. GP-GPU的应用 PAGEREF _Toc467238433 \h 8 HYPERLINK \l _Toc467238434 5. GP-GPU语言 PAGEREF _Toc467238434 \h 9 HYPERLINK \l _Toc467238435 5.1 CUDA PAGEREF _Toc467238435 \h 10 HYPERLINK \l _Toc467238436 5.2 OpenCL PAGEREF _Toc467238436 \h 11 HYPERLINK \l _Toc467238437 6. 特点 PAGEREF _Toc467238437 \h 12 HYPERLINK \l _Toc467238438 7. 展望 PAGEREF _Toc467238438 \h 13 HYPERLINK \l _Toc467238439 参考文献 PAGEREF _Toc467238439 \h 14 1、引言 多核CPU和多核GPU已经出现并逐渐主导最先进的高性能计算。 虽然当代CPU和GPU是使用相同的半导体技术制造的,但是GPU的计算性能比CPU的计算性能更快地增加。 不同的设计选择驱动他们进入不同功能的设备,给定相同的晶体管数量的顺序。 CPU针对高性能,任务并行工作负载进行了优化,因为更多的晶体管专用于控制逻辑,例如每个处理元件中的分支预测和无序执行。 GPU针对高性能数据并行工作负载进行了优化,因为更多的晶体管专用于算术逻辑,例如浮点计算和每个处理元件中的超越函数。 GPU(Graphics Processing Unit)早期的主要任务是用来进行3D图形计算和处理。近年来,受游戏市场和视景仿真需求的牵引,并随着人们对计算性能要求的不断提高,GPU得到了飞速的发展,主流GPU 的单精度浮点处理能力和外部存储器带宽都远远超过同期的GPU,而且GPU已经从以往的固定流水线操作模式发展成可编程流水线模式;另一方面,受工艺、材料和功耗的物理限制, 相应的现代 GPU 也采用了多核的架构用来提高 GPU 的并行处理能力。 在2003~2004年左右, 图形学之外的领域专家开始注意到GPU与众不同的计算能力,开始尝试把GPU 用于通用计算(GPGPU)。 由此,开启了新的计算时代,即图形处理单元(GPGPU)上的通用计算。 GPGPU代表General Purpose Computing on Graphics Processing Unit,就是图形处理器通用计算技术。这种新兴的加速技术试图把个人计算机上的显卡当做CPU这样的通用处理器来用,使显卡的强劲动力不仅发挥在图形处理上。 2、GPU的发展历史 从 SIGGRAPH 2003大会首先提出GPU通用计算概念,到 NVIDIA公司2007年推出CUDA平台, GPU通用计算依靠其强大的计算能力和很高的存储带宽在很多领域取得了成功。越来越多的信号告诉我们,GPU通用计算是一片正在被打开的潜力巨大的市场。 从1991年到2001年,这期间,微软公司的Windows操作系统在全球流行,极大地刺激了图形硬件的发展。S3 Graphics公司推出了公认的全球第一款图形加速器,可以被认为是显卡设备的雏形。早期的GPU只能进行二维的位图(bitmap)操作,但在20世纪90年代末,已经出现了硬件加速的三维的坐标转换和光源计算(transformation and li
显示全部
相似文档