歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> 基於 Linux 集群環境上 GPFS 的問題診斷

基於 Linux 集群環境上 GPFS 的問題診斷

日期:2017/2/28 16:35:44   编辑:Linux教程

  GPFS 是 IBM 提供的一種共享文件系統。由於 GPFS 的復雜性,使得人們在使用時會遇到各種類型的問題。對於 GPFS 的使用者,掌握基本的診斷方法,不僅可以幫您快速解決一些並不嚴重的問題及時恢復 GPFS 正常運行起來,同時,對於 IBM 直接提供支持的用戶,本文介紹一些初步問題診斷方法可以幫助您快速提交問題報告給 IBM 服務團隊,從而加速解決問題的過程。本文基於作者對 GPFS 測試和使用的經驗,按照由易到難的診斷步驟和方法進行講解,總結了一些在診斷 GPFS 問題上的經驗和建議,同時結合一些實例按照文中介紹的診斷方法進行問題診斷,供讀者參考。

  GPFS 的概述

  GPFS 是 IBM 公司提供的一個共享文件系統,它允許所有的集群節點可以並行訪問整個文件系統。GPFS 允許客戶共享文件,這些文件分布在不同節點的不同硬盤上,GPFS 還提供了 UNIX 文件系統接口並且支持 UNIX 文件系統的工具,用戶可以在 Linux 集群中像使用普通文件系統一樣使用 GPFS 文件系統,能夠很好地應用在 Linux/UNIX 集群中。

  在 GPFS 的長期運行中可能會出現一些問題,本文主要針對在使用 GPFS 中常見問題的一些診斷方法進行探討。

  問題診斷步驟與方法

  初步檢查

  在裝有 GPFS 文件系統的環境中出現問題時,我們在求助 IBM Service 團隊前,可先自行進行些初步檢查。既可以快速修復一些簡單問題,也可向 Service 人員提供更詳盡的問題描述信息來協助他們加快解決問題。我們一般有下面的幾種常見檢查方法。

  1. 首先檢查該問題僅僅出現在一個節點還是多個節點上並明確問題節點 :

  通常判斷某節點是否有問題的方法如下:

  在 GPFS 集群中的某個可訪問節點上運行 mmgetstate – a,該命令可以顯示集群中所有節點的狀態,只要不是”active”狀態的節點,都不是健康的節點。如下例所示,可見節點 node2 和 node3 都出現了問題:

Copyright © Linux教程網 All Rights Reserved