典型结构力学软件GPU加速性能测试与评价-上海超级计算中心.PDF
文本预览下载声明
本期专题:”蜂鸟”超级计算机介绍 19
典型结构力学软件GPU加速性能测试与评估
王惠 郭培卿 陈小龙
上海超级计算中心 上海201203 hwang@
摘要:
在高性能计算领域,CPU/GPU异构协同处理技术已经成为快速获得计算结果的有效手
段,典型结构力学计算软件ANSYS和Abaqus最新版本中加入了CPU/GPU协同处理技术进一步
提高问题的求解效率。本文利用NVIDIA公司Tesla系列M2090 GPU和上海超级计算中心 “蜂
鸟”超级计算平台,通过求解典型结构问题,对ANSYS和Abaqus软件在开启GPU加速功能前
后对求解效率的影响进行了对比和分析。结果表明:当并行规模低于16核时,GPU加速能够不
同程度的减少各类结构问题的求解时间,随着并行规模的增加,GPU加速性能呈下降趋势,多
GPU协同求解对加速性能的提高并不明显。在实际应用中,需要结合问题类型以及当前硬件架
构选择合适的并行方式和协同处理模式。
关键字:CPU/GPU,协同并行,加速性能,高性能计算
1. 引言 内的众多行业计算程序均已分布支持使用GPU加速
随着计算机应用的日趋复杂,处理问题的规模 的版本。本文围绕典型大规模结构力学计算软件
也越来越大,对计算处理能力的需求也不断上升, ANSYS和Abaqus在GPU加速方面的应用及其在CPU/
如何快速而有效地提高计算速度已经成为众多领域 GPU异构平台上的表现做出比较和测评,为进一步了
内迫切需要解决的问题。目前,大规模计算普遍采 解GPU加速能力以及GPU在这些软件中的应用提供指
用基于CPU服务器集群并行模式,CPU的低效率和高 导。
耗能为制约并行系统性能提升的主要障碍。随着计
算机硬件技术的飞速发展,图形处理单元GPU的计 2. 典型工程软件与GPU应用
算能力近年来呈几何级数增长,促使通用和工程计
2.1 ANSYS软件与GPU计算简介
算由CPU处理器向CPU/GPU协同处理的方向发展,如
今,GPU已不仅用于图形渲染,还凭借着其出色的浮 ANSYS软件是最常用的有限元求解软件之一,
点计算能力、低能耗高带宽、可靠的并行架构以及 以其求解模块齐全,多物理场实现耦合求解以及实
灵活的可编程性,被越来越多的人用于图形学以外 现协同仿真技术等特点而广受市场欢迎。其核心是
的其他领域上的通用计算。 一系列面向各个领域应用的高级求解器,可以用来
CPU/GPU异构协同处理技术已逐渐成为提升应求解结构、热、压电、声学、以及耦合场以及CFX的
用程序加速性能的有效途径,实际工作中,CPU负责 任意双向流固耦合等问题。ANSYS强大的并行计算
控制作业的启动和终止,GPU负责分担求解繁重的
计算任务并将结果返回给CPU,GPU的协同处理使得
内存并行计算,指单机多CPU的并行计算;DMP是
原有计算效率明显提高。目前NVIDIA,AMD/ATI,
分布内存并行计算,指多机多CPU的并行计算。
Intel等厂商为GPU的推广和应用提供了硬件资源和技
术支持,各大软件公司和研发机构纷纷加强GPU的 ANSYS从13.0版本开始支持GPU计算,14.0开始支持
研发和应用,在工程计算领域,包括CAE,CFD在 多GPU协同计算,并开始支持DMP并行方式,需要留
国家高技术研究发展计划(863计划)课题:2012AA01A308
20 《高性能计算发展与应用》 2012年第三期 总第四十期
意的是,ANSYS并行计算中,每个计算节点仅支持 算平台计算资源包括26台HS23刀片计算节点(Intel
单块GPU卡加速。
显示全部