分布式高速缓存主存体系结构.ppt
*三、斯坦福Dash多處理機這是在JohnHennessy領導下由Stanford大學研製的CC-NUMA多處理器系統。Dash—共用記憶體的目錄結構(directoryarchitecturersharedmemory)Dash的主要貢獻在於它使用分佈式一致性高速緩存和分佈式記憶體層次結構;建立L了具有單一地址空間的可擴展並行電腦成為可能。Dash在首先使用這種技術建立CC—NUMA結構的同時保持了消息傳遞多處理機所具有的可擴展性。**Dash原型機CPU:它在16個SGISMP結點,每個SGI結點上有4個MIPSR3000/R3010處理器。共有64個微處理器,這種結點結構對SiliconGraphics的4D/340Powerstation作了少量修改。在每個Powerstation結點上插入了兩塊特殊的子板,上面裝有網路介面電路和連接到同一監聽匯流排上,為4個處理器共用的高速緩存目錄*16個SGI結點中的互聯網路是一對採用蟲蝕路由方式的二維4x4網格型(Mesh)網路,由扁平線和蟲蝕路由器組成,網格的通道帶寬為16位,通過時間為50ns,而週期時間為35ns。請求網路用於向遠程記憶體發請求,而另一個則為應答網格。網格交點處的小方塊表示由CharlesSeitz主持的Caltech大學研究組研製的蟲蝕路由器。*特殊硬體Stanford大學的研究組對現有的系統板進行了微小的修改:設計了一對新板用於支持目錄記憶體和結點間消息傳遞。對現存CPU板的主要修改是增加了匯流排重試信號,用於某個請求需要獲得遠程結點服務。*中央匯流排仲裁器也被修改為接受來自目錄的遮罩碼,有效地為遠程服務請求創建了分離事務(split-transaction)的匯流排協議,新的目錄控制板包含了目錄記憶體,機群間一致性狀態控制和狀態緩存區,以及全局互聯網路的本地部分。用於機群間事務的輸出和輸入部份而分割為兩塊邏輯板。***分佈式高緩/主存體系結構一、幾種分佈式存儲結構1.前言物理上分佈的記憶體可被邏輯共用、不共用或部分共用共用記憶體體系結構(多處理器)同時支持共用記憶體和消息傳遞編程模型SMP具有共用記憶體體系結構,而傳統的MPP不是還有許多分佈式記憶體結構介於兩者之間*2.共用記憶體體系結構的定義某個系統稱為具有共用記憶體體系結構(多處理器),如果該系統內任何處理器上的進程都能直接訪問整個系統內的任何本地和遠程記憶體。非共用記憶體體系結構(多電腦)。**3.UMA,NUMA,NORMA,COMA,CC-NUMA,NCC—NUMANORMA:No-remotememoryaccess結構CC-NUMA:cache—coherentNUMANCC—NUMA:noncachecoherentNUMA*(1)數據訪問方式的不同設LM:本地記憶體,A和B:記憶體地址RC:遠程高速緩存E:寄存器R:通用寄存器**(2)NORMA機器:各結點的記憶體有不同的地址空間,結點不能直接訪問遠程存而必須通過消息傳遞方式。結點P需要結點Q上變數A中的數據這可在結點Q上的發送例程和結點P上對應的接收例程完成,最後,A的值被拷貝P到結點P本地記憶體中的變數B。
*其他3種體系結構都有特殊的硬體結構將所有的本地記憶體合併為單一的地址空間,使所有的處理器都能訪問任意的記憶體單元。它們都可以通過load指令獲得遠程數據A。但是,它們的獲取機制還是不同的。典型的NCC-NUMA機器是CrayT3E。T3E中的每個結點除了具有本地記憶體外,還有一組結點級的寄存器稱為E—寄存器(E-registers)*(3)CC-NUMA系統關於CC-NUMA機器的說明:CC-NUMA機器是SMP系統的擴展,它將幾個SMP結點連接起來構成一個更大的系統。緩解了傳統SMP系統規模不可擴展的問題。大多數商用的CC-NUMA多處理機系統採用了基於目錄的高速緩存一致性協議。CC-NUMA機器既保持了SMP結構的優點,緩解了爭用和帶寬問題。*CC—NUMA機器顯著優點:程式員不需要顯式指定數據結構應分配到哪一個結點上,系統的硬體和軟體會在開始時自動將數據分配到各個結點處。在應用程式運行期間,高速緩存一致性硬體會自動將數據移至需要使用該數據的結點上。這個優點實現起來並不總是有效的,*例如:CC—NUMA系統中遠程高速緩存(remotecaching)的問題假設程式有兩個進程P和Q執行以下代碼,這兩個進程都必須訪問數據數組A和BPQ階段1使用(A)