SMP、NUMA、MPP体系结构介绍.docx
SMP、NUMA、MPP体系结构介绍
从系统架构来看,目前的商用效劳器大体可以分为三类,即对称多处理器结构(SMP:SymmetricMulti-Processor),非一致存储访问结构(NUMA:Non-UniformMemoryAccess),以及海量并行处理结构(MPP:MassiveParallelProcessing)。它们的特征分别描述如下:
1.SMP(SymmetricMulti-Processor)
SMP(SymmetricMultiProcessing),对称多处理系统内有许多紧耦合多处理器,在这样的系统中,所有的CPU共享全部资源,如总线,内存和I/O系统等,操作系统或管理数据库的复本只有一个,这种系统有一个最大的特点就是共享所有资源。多个CPU之间没有区别,平等地访问内存、外设、一个操作系统。操作系统管理着一个队列,每个处理器依次处理队列中的进程。如果两个处理器同时请求访问一个资源〔例如同一段内存地址〕,由硬件、软件的锁机制去解决资源争用问题。AccesstoRAMisserialized;thisand?cachecoherency?issuescausesperformancetolagslightlybehindthenumberofadditionalprocessorsinthesystem.
所谓对称多处理器结构,是指效劳器中多个CPU对称工作,无主次或附属关系。各CPU共享相同的物理内存,每个CPU访问内存中的任何地址所需时间是相同的,因此SMP也被称为一致存储器访问结构(UMA:UniformMemoryAccess)。对SMP效劳器进行扩展的方式包括增加内存、使用更快的CPU、增加CPU、扩充I/O(槽口数与总线数)以及添加更多的外部设备(通常是磁盘存储)。
SMP效劳器的主要特征是共享,系统中所有资源(CPU、内存、I/O等)都是共享的。也正是由于这种特征,导致了SMP效劳器的主要问题,那就是它的扩展能力非常有限。对于SMP效劳器而言,每一个共享的环节都可能造成SMP效劳器扩展时的瓶颈,而最受限制的那么是内存。由于每个CPU必须通过相同的内存总线访问相同的内存资源,因此随着CPU数量的增加,内存访问冲突将迅速增加,最终会造成CPU资源的浪费,使CPU性能的有效性大大降低。实验证明,SMP效劳器CPU利用率最好的情况是2至4个CPU。
图1.SMP效劳器CPU利用率状态
2.NUMA(Non-UniformMemoryAccess)
由于SMP在扩展能力上的限制,人们开始探究如何进行有效地扩展从而构建大型系统的技术,NUMA就是这种努力下的结果之一。利用NUMA技术,可以把几十个CPU(甚至上百个CPU)组合在一个效劳器内。其CPU模块结构如图2所示:
图2.NUMA效劳器CPU模块结构
NUMA效劳器的根本特征是具有多个CPU模块,每个CPU模块由多个CPU(如4个)组成,并且具有独立的本地内存、I/O槽口等。由于其节点之间可以通过互联模块(如称为CrossbarSwitch)进行连接和信息交互,因此每个CPU可以访问整个系统的内存(这是NUMA系统与MPP系统的重要差异)。显然,访问本地内存的速度将远远高于访问远地内存(系统内其它节点的内存)的速度,这也是非一致存储访问NUMA的由来。由于这个特点,为了更好地发挥系统性能,开发应用程序时需要尽量减少不同CPU模块之间的信息交互。
利用NUMA技术,可以较好地解决原来SMP系统的扩展问题,在一个物理效劳器内可以支持上百个CPU。比拟典型的NUMA效劳器的例子包括HP的Superdome、SUN15K、IBMp690等。
但NUMA技术同样有一定缺陷,由于访问远地内存的延时远远超过本地内存,因此当CPU数量增加时,系统性能无法线性增加。如HP公司发布Superdome效劳器时,曾公布了它与HP其它UNIX效劳器的相对性能值,结果发现,64路CPU的Superdome(NUMA结构)的相对性能值是20,而8路N4000(共享的SMP结构)的相对性能值是6.3。从这个结果可以看到,8倍数量的CPU换来的只是3倍性能的提升。
3.MPP(MassiveParallelProcessing)
和NU