您现在的位置： Linux教程網 >> UnixLinux > >> Unix知識 >> 關於Unix

unix文件系統被塞滿的清理策略

　　盡管現在的磁盤容量越來越大，但它終究有被塞滿的可能，如果遇上粗枝大葉的系統管理員，磁盤被塞滿的時間將變得更短。一個unix/linux運行環境，一旦遇到某個分區（也稱文件系統）被塞滿，後果也許會十分糟糕—我曾有過在凌晨2點起來干活的經歷—分區/tmp滿了，導致某個守護進程不能寫入磁盤而異常終止。想必其他人也有類似的情況，怎樣處理和避免這樣的麻煩呢？這裡有些意見供大家參考。

　　先談非技術方面的因素，簡單的講就是規章制度。Linux/unix大多是公共服務器，應該禁止上傳與工作無關的私人數據。某君買了一個NAS(網絡附屬存儲)設備，4個73G的硬盤，本來打算做web的後台數據存儲，但是，但是….後來據我所知，這個大容量磁盤不到2個月所剩空間不到20G,私下浏覽，嘿！大部分數據是他私人的，他本來就有收藏廢品的嗜好，難怪呢。因此在這個方面，制度應該嚴厲一些，避免同事放垃圾數據在公共空間。

　　磁盤上的數據可能隨時增長，任何人不可能24小時盯著它，因此實現自動化監控手段是十分必要的，對於更大規模的網絡環境，這也許是唯一的途徑。下面是一個用perl寫的監控磁盤容量的腳本（大宇對此有貢獻）：
#!/usr/bin/perl -w
# this program will check disk capacity $full and send the warning message
# to $email_address
# (set the threshold to 90 and check it in the daytime so no paging
# is needed)

my $hostname = `/sbin/ifconfig -a|grep inet|head -1|cut -f2 -d":"|cut -f1 -d" "`;
my $dmesg = `dmesg`;
chomp(my $now = `date +"%x %X"`);
my $full = 90; # the threshold to send the warning
my $warn = 95;
my $count = 0;
my ($dev,$total,$used);

my @df_messages = `df|grep -v proc`;
print @df_messages;

shift(@df_messages);

foreach $message (@df_messages) {
chomp($message);
($dev, $total, $used, $available, $capacity, $mount) = split(/\s+/, $message);
$capacity =~ s/(\d+)\%/$1/;
if ($capacity > $full) {
$available[$count] = $available;
$capacity[$count] = $capacity;
$mount[$count] = $mount;
++$count;
}
}
if ($count > 0) {
open(MAIL, "|/usr/sbin/sendmail -t");
print MAIL "To: $email_address \n";
print MAIL "Subject: Disk almost full on $hostname ($now)\n";
print MAIL "\n";
for ($i = 0; $i < $count; ++$i) {
print MAIL "There are only $available[$i] KB ($capacity[$i]\% full) left on $mount[$i] \n";
}
}
if ( $dmesg =~ m/ERROR/ )
{
open(EMAIL, "|/usr/sbin/sendmail -t") or die "Can't fork for sendmail: $!\n";
print EMAIL <<_EOF_ ;
To: $email_address
subject: HARDWARE error on $hostname!!!

$hostname needs to be checked right now!
.
_EOF_
close("EMAIL");
}
　　把這個腳本放在定時任務crontab裡即可實現自動監控，只要某個分區的容量達到腳本中閥值，系統就會發送報警郵件到管理員信箱，更進一步還可設定發送手機短信報警。
　　知道某個分區快要被塞滿的情況後，接下來的事情就是清理它了。登陸系統，然後使用命令df –h察看具體的磁盤使用情況（老一點版本的solaris不支持選項-h,請用-k這個選項），
　　磁盤的利用率是以百分比的方式顯示的，非常直觀。找到快要被塞滿的分區之後，應該先著手查找占用空間大的最大的文件，然後處理這個占用空間最大的文件。這裡我用一個實例（根分區/root）來演示這個過程。

　　1、進入目錄/root,執行命令 du –h | sort –n 就把當前目錄下目錄以及文件所占的大小按順序排列出來了，一屏顯示不完的話再用加一個管道 du –h | sort –n | more 就好了。
-bash-3.00# du -h | sort -n| more
1K ./.dt/appmanager
1K ./.dt/help
1K ./.dt/icons
1K ./.dt/tmp
……….(省略若干行)
914K ./mysql-5.0.37/zlib
933K ./mysql-5.0.37/ndb/src/kernel/blocks/dblqh
938K ./mysql-5.0.37/scripts
945M . //這個東西占太大的空間
957K ./mysql-5.0.37/extra/yassl/taocrypt
959K ./vsftpd-2.0.5
1002K ./mysql-5.0.37/ndb/src/common
-bash-3.00#
　　有上面的輸出，我們可以知道在當前目錄裡有大文件，但是看不出是哪個文件。
　　2、再執行命令 ls –al | grep ^- |more 就可以看見每個文件的大小。
-bash-3.00# ls -al | grep ^-|more
-rw------- 1 root root 810 Apr 29 09:59 .ICEauthority
-rw------- 1 root root 98 Apr 29 09:59 .Xauthority
-rw------- 1 root root 730 Apr 30 07:52 .bash_history
-rwxr-xr-x 1 root root 5111 Apr 29 08:30 .dtprofile
-rw-r--r-- 1 root root 81 Apr 29 08:30 .gtkrc-1.2-gnome2
-rw------- 1 root root 0 Apr 29 08:30 .recently-used
-rw-r--r-- 1 root root 681090961 Feb 28 12:29 10202_database_solx
86.zip
……….（省略若干）
-rw-r--r-- 1 root root 3069440 Apr 29 11:31 tar-1.16-sol10-x86-lo
cal
-rw-r--r-- 1 root root 10895360 Oct 22 2006 tar-1.16.tar
-rw-r--r-- 1 root root 155985 Jul 3 2006 vsftpd-2.0.5.tar.gz
-bash-3.00#
　　字體為紅色的哪行就是最大文件的信息，它的文件名是10202_database_solx86.zip，再用命令du –h 10202_database_solx86.zip可直接顯示它的大小為650M。
　　-bash-3.00# du -h 10202_database_solx86.zip
　　 650M 10202_database_solx86.zip
　　3、移走或刪除占用空間的大文件。

　　大家看一看，找大文件是不是很簡單？當然如果使用awk這樣的工具寫shell腳本更是方便的法門，還有一個方法是用find加選項 –size,請大家自己去試驗。

上一篇文章：在solaris 10中配置mysql服務器
下一篇文章：安裝Solaris 10必須在開始自己配置網絡嗎?

關於Unix