歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Unix知識 >> 關於Unix >> 談IBM UNIX服務器的技術優勢

談IBM UNIX服務器的技術優勢

日期:2017/2/28 11:28:34   编辑:關於Unix


1.什麼是MBB結構
MBB的全稱是Modular Building Block,每個BB(Building Block)可包含4路CPU,若干內存和I/O卡。在Sun服務器上稱BB為board;在HP服務器上稱BB為cell;在原先的Compaq服務器上稱BB為quad。不同BB內的CPU可以有不同的時鐘頻率。所有的BB通過一種稱為crossbar switch的交換機制連接在一起。crossbar switch可以提供BB之間的點對點的高速連接。
采用MBB技術可以比較容易的設計出擁有更多數量CPU的服務器。在這種服務器上既可以運行一個操作系統,也可以在一個或多個BB上運行多個操作系統。這就是所謂的服務器(基於物理分區)的邏輯分區。
MBB 技術從出現到現在已經超過十年了,最早是由Sequent (NumaQ)公司在八十年代末到九十年代初時發明並采用的。Cray公司在九十年代初時在它的Cray 6400上采用了MBB技術,該機型是Sun E10000的前身;Compaq公司在2000年一季度發布了它的基於MBB技術的機型Wildfire (GS320);HP公司發布了業界最後一款基於MBB技術的機型Superdome,那是在2000年三季度。Sun公司在2001年三季度發布的 Starfire (F15K)在體系結構上並無變化,只是將原來E10000上的CPU換成了SPARC3而已。
2.MBB結構的優點
基於MBB技術的服務器是由多個BB構成的,所以它天生具有物理分區(Physical Partition)的特性。前面提到在MBB服務器上存在一個連接BB的互連機制(crossbar switch),它工作在一個固定的時鐘頻率上。
例如,在Sunfire服務器上的Uniboard機制就是完成這種互連功能的。其總線時鐘是150MHz,不管CPU的主頻是多少(600,750, 900,1050MHz),它是固定不變的。所帶來的問題是數據/指令被傳送出去的等待時間過長。這是典型的高CPU時鐘頻率和低總線速度的矛盾。
所有的MBB結構的服務器都具有一個"顯著"的優勢:可以熱插拔CPU板和內存板。這是因為每一個BB是物理分開的,每個4路CPU板可以單獨從系統中隔離出來並將其下電。但有一點需要注意:在一個運行的系統中,從一個BB中拔出CPU、內存或I/O板是有限制的,這基於每個機型的設計不同而不同。例如,Sun 6800服務器就有一個警告標簽,其注明每個Uniboard槽在系統運行時空槽位的時間不能超過60秒(而且電源、溫度等環境因素必須控制在一定的范圍內)。由此推斷,F12K/F15K可能時間會更短。
3. MBB結構的缺陷
HP公司當初發布Superdome 服務器時,曾公布了它與HP其它UNIX服務器的相對性能值。64路CPU的Superdome(MBB結構)的相對性能值是20,8路N4000(共享結構)的相對性能值是6.3。我們可以看到,8倍數量的CPU換來的只是3倍性能的提升。
造成這種現象的根本原因就在MBB結構上。 Superdome上的每個cell(BB)裡的CPU、內存或I/O卡可能需要訪問其它cell裡的數據。crossbar switch在cell之間建立點對點的連接,但同時帶來延遲(latency)。即如果一個連接請求建立不成功時,則會再試一次直到建立連接成功,而此時其它的連接請求將會等待。在實際環境中,很多客戶通過建立物理分區(每個分區中最多12到16個CPU)的方法來盡量減少這種延遲的影響。這種做法將原來CPU個數較多的機器分成了若干個有較少CPU個數的機器,當然也就不是原來宣稱的服務器的擴展性了(例如具有64路CPU的服務器)。
Sun和Compaq公司的具有MBB結構的服務器裡都有類似的crossbar switch結構,當然都存在相同的數據訪問延遲的缺陷:點對點的連接必須建立,同時這種連接的建立是競爭的。
Sun 公司宣稱其服務器的擴展性是線性的,即服務器的性能隨著CPU個數的增加呈線性增長。它是用SPECintRate和SPECjbb2000這兩個基准測試值來證明的。我們需要指出的是:這兩種測試方法只是基於CPU本身,並沒有共享數據的訪問和網絡及硬盤I/O的發生。很顯然,這與實際情況是不相符的。
我們談服務器的性能是整體的去看。有很多可以整體評價服務器性能的基准測試,例如:TPC/C、Oracle ASB11i、Peoplesoft、SAP、Baan、JDEdwards等。這些測試方法都具有數據庫訪問、模擬客戶的實際應用和很大的I/O訪問量等特點。
4. 以POWER4為芯片的IBM UNIX服務器的設計
IBM UNIX(p系列)服務器的設計思想是共享式的,即所有CPU可以同等的看到所有的內存和I/O的連接方式:一種全新的為數據/指令流提供足夠的高速通路的體系結構。
p 系列服務器CPU數量的增加是一個成比例漸進的過程。目前p690上的最大CPU個數是32路。從p690"以少勝多"的實例來看,服務器CPU數量的多少並不真正代表其處理能力的高低。P690(32路CPU)勝過Superdome(64路CPU)就是一個有力的證明。
POWER4和以POWER4為芯片的服務器在設計上有兩個重要點:
· 消除對數據傳送的約束
· 數據傳送能力是隨著CPU性能的增長而增長
下面將比較詳細的做一介紹:
(1) 在POWER4芯片上設計了較大的緩沖區。一個POWER4芯片(chip)上有兩個核心處理器,每個核心處理器有一個L1緩沖器(32KB數據和 64KB指令),並且每個芯片上有一個共享的L2緩沖器(1.5MB)。這個L2緩沖器的時鐘頻率是核心處理器的一半。每個 L2緩沖器有三個32字節寬的總線與兩個核心處理器相連,用於向兩個核心處理器傳送指令和數據。另外還有三條8字節寬的總線用於從兩個核心處理器回傳數據給L2緩沖器。POWER4創造了第一個消除了控制信號和數據傳送沖突的CPU結構。
POWER4處理器有一個L3緩沖器控制器,它是與32MB大小的L3緩沖器的接口。在業界有一種說法:任何I/O都是不好的,即CPU運行時所需的數據不在內存裡,需要從外設中讀入。最理想的狀態是處理器運行時所需要的指令/數據全都滿足,其次是指令/數據在L1緩沖器中,再其次是在L2緩沖器中,再其次是在L3緩沖器中,最差的情況是在內存裡。p 系列服務器上的緩沖區總數量是Sun服務器的四倍,是HP服務器的十五倍。 (2) 在POWER4的設計中存在一個稱作分布式交換器(distributed switch)的連接機制。它提供在一個MCM(Multi-Chip Module)上的處理器之間的點對點的連接,也用於在不同的MCM上的處理器之間的點對點的連接。這個分布式交換器的時鐘頻率是CPU的時鐘頻率的一半。例如,如果是1.3GHz POWER4的處理器,則分布式交換器提供16字節寬、時鐘是650MHz的點對點總線連接。
IBM目前提供給UNIX市場的服務器,真正實現了CPU處理能力和服務器處理能力的線性增長。
5. 關於IBM UNIX服務器上的一些"限制"
IBM 在其UNIX服務器(p系列)的設計上沒有采用MBB的設計結構,所以在p系列機器上不支持物理分區。IBM沿用了大主機S390上的邏輯分區(LPAR)設計思想,即設計一個hypervisor(系統管理程序),它能看到所有的真實資源(CPU、內存和I/O卡),並且通過一個控制台(HMC)來管理邏輯分區。通過HMC將上述提到的資源定義到不同的邏輯分區中去,每個邏輯分區所需的最小資源是一個CPU、1GB內存和一個PCI插槽。
IBM沒用象其它廠商那樣采用crossbar switch技術做CPU之間的連接。在p系列服務器上所有的CPU能夠看到所有的內存和I/O資源,它不允許不同主頻的CPU共存在同一台機器內。而 MBB結構的服務器則允許這樣做,其代價就是crossbar switch工作在相同的帶寬上(MBB之間的連接帶寬恆定),所以高主頻CPU帶來的服務器整體性能提升是有限的。
在p系列服務器上,如果升級CPU則必須更換整個CPU板,其優點是CPU主頻和系統總線帶寬同時得到提升,保證更高主頻的CPU帶來更高的服務器性能。
由於沒有采用MBB的設計結構,所以在p系列服務器上不支持熱插拔CPU板和內存板。"熱插拔"這個設計思想的目的是為了方便系統維護,即更換服務器失效部件時不需停機,以減少計劃內停機時間、提高系統的可用性(availability)。
關於系統可用性方面,IBM的設計思想是:在關鍵性部件(如CPU,內存等)出現硬件故障時,系統能自動隔離失效部件並且繼續運行。主要包括如下三個方面的內容:
·選用高質量的材料,制造高質量的部件,提供更高的可靠性。
·IBM 發明的自診斷技術FFDC(First Failure Data Capture)能夠做到早發現故障(例如在p690上就設計有5600多個觀察點),並能自動隔離失效部件。目前在p系列服務器上能做到自動隔離失效的 CPU、L2/L3緩沖器、PCI總線、PCI卡和LPAR(邏輯分區)等,使系統能夠繼續運行。
·客戶在計劃內的停機維護時間裡,可以很快的修復失效部件。據研究表明計劃內的停機是有代價的(對客戶來講有些損失),但非計劃內停機所帶來的損失則是幾何級數量的。采用MBB結構服務器的廠商聲稱熱插拔CPU/內存的功能可減少計劃內的停機時間,但其服務器有限的自診斷和自隔離功能將增加非計劃內的停機時間。
6. 結束語
IBM是唯一一家在高端服務器行業有能力自己設計、研發和制造的廠家。IBM設計和制造CPU的成就是非凡的。從我們目前所熟知的銅芯片、絕緣硅技術,到後繼的low-K dielectric和silicon strainin等新技術已一一被發明出來。 IBM在服務器的設計、軟件的設計和存儲器方面的成就也是令人矚目的。從大型主機上繼承下來的豐富的多機系統設計、中央數據處理、高可靠(RAS)設計等經驗已經遷移到UNIX服務器的設計和實踐中。
IBM是UNIX世界的領航者。
Copyright © Linux教程網 All Rights Reserved