第二章多机系统结构.ppt
文本预览下载声明
第二章 并行计算机模型 基本特性: 单处理机的能力和处理机阵列大小的乘积决定并行计算机系统的能力 互连网络决定解决问题的类型和系统的适应能力 控制方式分为集中式和分布式 按通信方式: 多处理机系统——通过共享存储器的共享变量相互通信(无协议) 多计算机系统——通过节点间消息传递实现通信(协议) 按耦合度: 紧耦合——物理位置紧密(共享存储、宽频带低延迟) 松耦合——物理位置分散(分布存储) 按控制方式: 主从式——一台处理机为主机,运行操作系统,其它为从机。从机通过中断和主机交换信息 均衡式——各处理机地位均等 一般多处理机多为紧耦合系统、主从结构、专用机 多计算机多为松耦合系统,均衡结构、通用机 但现在多计算机系统已经发展为紧耦合 也可以从四个方面讨论并行计算机模型 并行计算机结构模型 并行计算机访存模型 并行计算机性能模型 并行计算机Cache一致性 §2.2并行计算机结构模型 现代计算机结构分类: 并行向量处理机PVP 对称多处理机SMP 大规模并行处理机MPP 分布共享存储多处理机DSM 工作站集群COW 通用结构 并行向量处理机PVP Cray C-90 ,Cray T-90 , NEC SX-4 和我国的银河-?等都是PVP,这样的系统包含少量的高性能的向量处理器,每个至少具有1Gflops的处理能力,系统中使用了高带宽的交叉开关网络,存储器可达每秒兆字节的速度。这样的机器通常无cache,使用大量的向量寄存器及指令缓冲器。 对称多处理机SMP IBM R50 SGI Power Challenge DEC Alpha服务器8400和 曙光一号 使用商品化的微处理器(带有片上或片外的高速缓存),主要用于商务,如数据库、在线处理事务、数据仓库等 对称性:每个处理器可等同地访问SM、I/O及OS服务,有利于开发高并行度 共享存储:使系统中的PE不能太多,总线与交叉开关也难以扩展 大规模并行处理机MPP Intel Paragon, IBM SP2,Intel TFLOPS 曙光-1000超大型计算机系统 特性: a.处理节点采用商品微处理器 b.有物理上的分布式存储器 c.采用高通信带宽及低延迟的互连网络(专门定制) d.能扩放至成百上千个处理器 e.是一种异步的MIMD机器,程序有多个进程构成,每个都有其私有空间,由进程传递消息 主要应用:科学计算、工程模拟、信号处理等以计算为主的领域 分布共享存储多处理机DSM ? Stanford DASH, Cray T3D SGI/Cray , Origin 2000 高速缓存目录DIR用于支持分布高速缓存的一致性 与SMP的主要差异:DSM在物理上有分布在各节点的LM从而形成了一个共享的存储器,对用户而言,形成了一个单地址的编址空间 比MPP编程容易 工作站机群COW 如:Berkeley NOW, Alpha FARM, Digital Tracluster 等 LD——本地磁盘 MB——存储总线 IOB——I/O总线 工作站机群COW 机群性:是低成本的变形的MPP COW的重要界限及特征: a.每个节点都是完整的工作站(不包括监视器、键盘、鼠标等) 有时也称“无头工作站”,节点也可以是一台PC或SMP b.各节点通过一种低成本的商品网络(如以太网、FDDI和ATM 开关 等)互连 c.各节点内总是有本地磁盘,而MPP无 d.节点内的网络接口是松散耦合到I/O总线上的,而MPP的网 络接口是连到处理机接点的存储总线上的,可谓是紧耦合 式的 工作站机群COW e.一个完整的OS系统驻留在每个节点之中,而MPP中通常只 是一个微核,COW的OS是工作站的UNIX,加上一个附加的 软件层以支持单一系统映象、并行度、通信及负载平衡等 f.如今,MPP和COW之间的界线越来越模糊,如:IBM SP2虽 视为MPP,但它却有机群结构 g.机群有性能价格比的优势,在发展可扩放并行机方面呼声 很高 公用结构 SMP、MPP、DSM、COW等并行结构渐趋一致,DSM是SMP与MPP的自然结合,MPP与COW的界线逐渐不清,它们最终趋于一致,形成当代并行机的公用结构。其三种不同的共享结构如下图: shell结构 系统中大量的节点通过高速网络连接,节点通常遵循shell结构(Shell Architecture),其中一个专门设计定制的电路(叫做shell),将商品微处理器及其余的节点,包括板级cache、局存、NIC及磁盘连接起来。在一个节点内可有不止一个处理器。这种Shell结构的优点是当处理器芯片更新换代时,只要改变shell。 公用结构 公用
显示全部