歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> 檢測磁盤驅動的健康程度SMART

檢測磁盤驅動的健康程度SMART

日期:2017/2/28 14:29:41   编辑:Linux教程

在服務器中,所有組件中一般最容易壞掉的就是磁盤。所以一般采取RAID來保證系統的穩定性,通過冗余磁盤的方式防止磁盤故障。

現代硬件驅動器一般支持SMART(自我監測分析和報告技術),它能夠監視整個硬盤驅動器的健康狀況,並且當硬盤驅動器即將故障的時候會發出警告。

一般硬件廠商提供的磁盤工具,是在系統重啟後檢查磁盤驅動的健康狀況,而SMART可以不用重啟系統就可以檢查硬盤驅動器的健康程度。

在linux中,工具包的名字為smartmontools

在CentOS中可以使用 yum install smartmontools來安裝工具

首先通過smartctl -i /dev/sda 來檢查一下硬盤是否具有 SMART 特性

下面是smart工具的說明文檔,裡面有詳細的說明

http://smartmontools.sourceforge.net/smartmontools_scsi.html

這個是我在虛擬機中測試的不支持

這個是我在真服務器中測試的,支持

SMART support 是 Disabled 狀態的話,需要開啟 SMART 的支持:

smartctl -s on /dev/sda

然後使用smartctl -H /dev/sda來檢測磁盤的健康狀況

查看/dev/sda當前整體監控狀態。PASSED表示健康,否則意味著磁盤已經故障,或很快就會發生故障。


使用

smartctl -t short /dev/sda

做一個快速自檢


smartctl -l selftest /dev/sda

查看自檢的進度和結果


使用smartctl -t long /dev/sda 做長時間自檢,這個很耗時,一般放在凌晨

使用smartctl -l error /dev/sda查看出錯日志


在這裡,我的讀、寫都沒有發生錯誤,在Non-medium error count 中出現錯誤6。

我一直沒有搞懂(非媒介錯誤計數)這個是什麼意思,在官方文檔查了一下,出現如下:

non-medium error counter (only a single number displayed). This represents the number of recoverable events other than write, read or verify errors.

我大致理解了一下,是除了read,write,verify errors的錯誤,可恢復事件的數量

查看所有信息
打印/dev/sda所有的SMART信息。
smartctl -a /dev/sda
相當於依次執行:
smartctl –i /dev/sda
smartctl -c /dev/sda
smartctl -A /dev/sda
smartctl -l error /dev/sda
smartctl -l selftest /dev/sda
smartctl -l selective /dev/sda
開/關SMART功能
打開或關閉/dev/sda 的SMART功能。
smartctl -s on/off /dev/sda
查看當前SMART功能是否開啟,可以使用 –i 參數。
smartctl -i /dev/sda
離線測試
對/dev/sda進行離線測試,它的結果主要用來更新SMART 屬性。
smartctl -t offline /dev/sda
觀察測試進度
通過-c 參數,可以觀察到測試的進度:
smartctl -c /dev/sda

smartctl參數幫助

-h 幫助信息
-V 版本信息
-i 打印基本信息(磁盤設備號、序列號、固件版本…)
-a 打印磁盤所有的SMART信息
運行時行為 參數:
-q TYPE 指定輸出的安靜模式。
TYPE可以有3種選擇:
eorsonly 只打印錯誤日志。
slent 有任何打印。
nserial 不打印序列號
-d TYPE 指定磁盤的類型。如果沒有指定,smartctl會根據磁盤的名字來
猜測磁盤類型。
-T TYPE 指定當發生錯誤時,smartctl的容忍程度,是否繼續運行。
TYPE可以有4種選擇:
conservative 一有錯就會退出
normal 如果必須支持的SMART命令失敗,則退出
permissive 忽略一次必須支持的SMART命令失敗
verypermissive 忽略所有必須支持的SMART命令失敗
-b TYPE 指定當發生校驗錯誤時,smartctl的動作。
TYPE有3種選擇:
warn 發出警告,繼續執行
exit 退出smartctl
ignore 不發出告警,繼續執行
-r TYPE smartmontools開發人員相關。
-n POWERMODE 指定當磁盤處於節能模式時,smartctl是否繼續檢查,
默認是不檢查。
POWERMODE有4種選擇:
never 檢查
sleep 除了sleep模式,檢查。
standby 除了sleep或standby模式,檢查。
idle 除了sleep或standby或idle模式,見車。
SMART功能開關 參數:
-s on/off 打開或關閉磁盤的SMART功能
-o on/off 打開或關閉SMART自動離線檢測,該功能每4小時就會自動掃描磁盤是
否有缺陷。
-S on/off 打開或關閉“自動保存廠商指定屬性”功能。
SMART 讀和顯示數據 參數
-H 報告磁盤的是否健康。如果報告不健康,則說明磁盤已經損壞或會在24小時
內損壞。
-c 顯示磁盤支持的普通SMART功能,以及這些功能當前的狀態。
-A 顯示磁盤支持的廠商指定SMART特性。這些特性的編號從1-253,並且有指
定的名字。
-l TYPE 指定顯示的log類型。
TYPE有4種選擇:
error 只顯示error log。
selftest 只顯示selftest log
selective 只顯示selective self-test log
directory 只顯示Log Directory
-v N,OPTION 顯示廠商指定SMART特性N時,使用廠商相關的顯示方式。
-F TYPE 設置smartctl的行為,當出現一些已知但還沒有解決的硬件或軟件bug時,
smartctl應該怎麼做。
-P TYPE 設置smartctl是否對磁盤使用數據庫中已有的參數。
SMART 離線測試、自測試 參數
-t TEST 立刻執行測試,可以和-C參數一起使用。
TEST可以有以下幾個選擇:
offline 離線測試。可以在掛載文件系統的磁盤上使用
short 短時間測試。可以在掛載文件系統的磁盤上使用。
long 長時間測試。可以在掛載文件系統的磁盤上使用。
conveyance [ATA only]傳輸zi測試。可以在掛載文件系統的磁盤上使用。
select, N-M
select, N+SIZE [ATA only]有選擇性測試,測試磁盤的部分LBA。N表示
LBA編號,M表示結束LBA編號,SIZE表示測試的LBA
范圍。
-C 在captive模式下運行測試。
注意:(1)-C必須配合-t一起使用,但如果是-t offline,則-C不生效。
(2)-C會使得磁盤很忙,所以最好是在沒有掛載文件系統的磁盤上使用。
-X 中斷no-captive模式下運行的測試。

Copyright © Linux教程網 All Rights Reserved