歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux綜合 >> Linux資訊 >> 更多Linux >> 安裝大型Linux 集群: 簡介和硬件配置

安裝大型Linux 集群: 簡介和硬件配置

日期:2017/2/27 9:45:25   编辑:更多Linux
用許多分離的硬件和軟件,包括 IBM® System x®(TM)和 IBM® TotalStorage® systems 創建工作的 Linux® 集群。 本文是共分多部分的系列教程的第一部分,介紹了硬件配置,包括理解架構、規劃邏輯網絡設計、設置終端服務器以及更新固件等內容。

大型 Linux 集群系列簡介

本文是介紹安裝和設置大型集群系列文章的第一篇。該系列文章的目的是把分散在公共領域不同地方的、用各種硬件和軟件創建工作的 Linux 集群的過程所需要的信息,集中在一個地方。但是,這些文章並不打算介紹關於設計一個完整的新的大型 Linux 集群所需的基礎知識。請參閱 參考資料 下的參考資料和紅皮書獲得一般性的架構指南。

本系列的前兩部分介紹集群的安裝,概述了使用 IBM 系統管理軟件 —— 集群系統管理(Cluster Systems Management,CSM)進行的硬件配置和安裝。第一篇文章直切主題,介紹了硬件配置過程。第二篇文章介紹管理服務器的配置和節點安裝。本系列後續文章將介紹集群的存儲後端,包括存儲硬件配置以及 IBM 共享文件系統 —— 通用並行文件系統(General Parallel File System,GPFS)的安裝和配置。

這個系列可供系統架構師和系統工程師在使用 IBM eServer 集群 1350 框架規劃和實現 Linux 集群時使用。(請參閱 參考資料)。出於培訓目的,正常集群操作中的一些內容可能還與集群管理員有關。

第 1 部分:集群的通用架構

在采取任何配置步驟之前,一個良好的設計至關重要。設計分為兩個部分:

物理設計 每種機架類型的機架布局(例如,管理機架和計算機架) 機房設計:在安裝和生產期間(如果兩者不同)應當如何布置機架 機架間的連接圖(用於網絡、電源、控制台訪問等等) 機架內的電纜連接(用於存儲、終端服務器等等) 邏輯設計 網絡設計包括:IP 地址范圍、子網配置、計算機命名規范等等 CSM 配置,包括:定制腳本位置、硬件設置、監視需求 操作系統需求、定制包列表、系統配置選項 存儲布局,包括文件系統布局、分區、復制等等

示例集群(請參閱圖 1)完全由基於 Intel® 或 AMD 的 IBM Systems 計算機以及附加的 TotalStorage 子系統構成(關於這些系統的更多信息,請參閱 參考資料。)為簡單起見,用千兆銅線以太網電纜提供集群的內部連接。電纜在多數情況下可以用 bonded/port-channeled/etherchannel 鏈接提高機架間的帶寬,從而提供良好的傳輸速率 在這裡插入自己喜歡的中繼項 。

網絡拓撲采用星形結構,所有機架向後連接到管理機架的主交換機。示例集群使用三個網絡:一個用於管理/數據(計算網絡),一個用於集群文件系統(存儲網絡),一個用於管理性設備的管理。前兩個網絡是普通的 IP 網絡。多數任務使用計算機網絡,包括進程間通信(例如 MPI)和集群管理。存儲網絡專門用於集群文件系統的通信和訪問。

圖 1. 集群架構圖

示例集群的一些額外設計和布局細節包括:

管理服務器—— 管理服務器的功能可以放在一台服務器或多台服務器上。在單台服務器環境中,管理服務器以獨立模式運行。也可以設置高可用性管理服務器。可以使用 CSM 高可用性(HA)軟件在兩台服務器之間進行 “心跳測試”,在發生故障情況時管理服務器之間的動態故障屏蔽。引入額外管理服務器的另一種可行方法是:當 HA 在環境中不重要的時候,使用復制設置。在這種情況下,可以把管理服務器的數據備份到其他活動系統,可以通過手動設置將備份系統聯機以便接管管理工作(如果有必要的話)。在 圖 1 中,管理網絡連接用紅色顯示。管理服務器是 CSM 服務器,它使用 CSM 功能專門控制集群:負責系統安裝、監視、維護和其他任務。在這個集群中,只有一台管理服務器。 存儲服務器和磁盤 —— 可以用多種機制把多台存儲服務器連接到基於磁盤的後端。可以用光纖、銅纜或結合使用二者,直接把存儲器連接到集群,或者通過存儲區域網絡(SAN)交換機連接(請參閱 圖 1)。這些服務器為集群中的其他服務器提供共享的存儲訪問。如果需要數據備份,請用額外的銅纜或光纖鏈路把備份設備連接到存儲服務器。對於示例集群,存儲的備份端是個單一實體,提供了跨集群的共享文件系統訪問。本系列的下一篇文章介紹存儲硬件和集群文件系統設置、配置和實現的細節。 用戶節點 —— 理想情況下,集群的計算機節點不應該接受外部連接,只應當由管理員通過管理服務器訪問。系統用戶可以登錄到用戶節點(或登錄節點),在集群上運行他們的工作。每個用戶節點都包含帶有完整編輯功能的鏡像、必要的開發工具、編譯器和開發支持集群的應用程序和檢索結果所必需的所有其他內容。 調度器節點 —— 為了在集群上運行工作負荷,用戶應當把自己的工作提交到調度器節點。在一個或多個調度器節點上運行的調度器守護程序使用預定的策略在集群上運行工作負荷。與計算機點一樣,調度器節點也不應當接受來自用戶的外部連接。系統管理員應當從管理服務器管理它們。 計算節點 —— 這些節點運行集群的工作負荷,接受來自調度器的作業。計算機節點是集群中最常使用的部分。系統管理員可以輕易地使用管理服務器重新安裝或配置它們。 外部連接 —— 示例外部連接在 圖 1 中用綠色顯示。這些連接被看作在集群之外,所以本文將不多做說明。

更多內容請看Linux安全應用寶典 Linux安裝 Linux安裝專題,或




Copyright © Linux教程網 All Rights Reserved