您现在的位置： Linux教程網 >> UnixLinux > >> Linux基礎 >> 關於Linux

寫出健壯的Bash腳本

寫出健壯的Bash腳本許多人用shell腳本完成一些簡單任務，而且變成了他們生命的一部分。不幸的是，shell腳本在運行異常時會受到非常大的影響。在寫腳本時將這類問題最小化是十分必要的。本文中我將介紹一些讓bash腳本變得健壯的技術。使用set -u www.2cto.com 你因為沒有對變量初始化而使腳本崩潰過多少次？對於我來說，很多次。 chroot=$1 ... rm -rf $chroot/usr/share/doc 如果上面的代碼你沒有給參數就運行，你不會僅僅刪除掉chroot中的文檔，而是將系統的所有文檔都刪除。那你應該做些什麼呢？好在bash提供了set -u，當你使用未初始化的變量時，讓bash自動退出。你也可以使用可讀性更強一點的set -o nounset。 david% bash /tmp/shrink-chroot.sh $chroot= david% bash -u /tmp/shrink-chroot.sh /tmp/shrink-chroot.sh: line 3: $1: unbound variable david% 使用set -e 你寫的每一個腳本的開始都應該包含set -e。這告訴bash一但有任何一個語句返回非真的值，則退出bash。使用-e的好處是避免錯誤滾雪球般的變成嚴重錯誤，能盡早的捕獲錯誤。更加可讀的版本：set -o errexit 使用-e把你從檢查錯誤中解放出來。如果你忘記了檢查，bash會替你做這件事。不過你也沒有辦法使用$?來獲取命令執行狀態了，因為bash無法獲得任何非0的返回值。你可以使用另一種結構： command if [ "$?"-ne 0]; then echo "command failed"; exit 1; fi 可以替換成： command || { echo "command failed"; exit 1; } 或者使用： if ! command; then echo "command failed"; exit 1; fi 如果你必須使用返回非0值的命令，或者你對返回值並不感興趣呢？你可以使用 command || true ，或者你有一段很長的代碼，你可以暫時關閉錯誤檢查功能，不過我建議你謹慎使用。 set +e command1 command2 set -e 相關文檔指出，bash默認返回管道中最後一個命令的值，也許是你不想要的那個。比如執行 false | true 將會被認為命令成功執行。如果你想讓這樣的命令被認為是執行失敗，可以使用 set -o pipefail 程序防御 - 考慮意料之外的事你的腳本也許會被放到“意外”的賬戶下運行，像缺少文件或者目錄沒有被創建等情況。你可以做一些預防這些錯誤事情。比如，當你創建一個目錄後，如果父目錄不存在，mkdir 命令會返回一個錯誤。如果你創建目錄時給mkdir命令加上-p選項，它會在創建需要的目錄前，把需要的父目錄創建出來。另一個例子是 rm 命令。如果你要刪除一個不存在的文件，它會“吐槽”並且你的腳本會停止工作。（因為你使用了-e選項，對吧？）你可以使用-f選項來解決這個問題，在文件不存在的時候讓腳本繼續工作。准備好處理文件名中的空格有些人從在文件名或者命令行參數中使用空格，你需要在編寫腳本時時刻記得這件事。你需要時刻記得用引號包圍變量。 if [ $filename = "foo" ]; 當$filename變量包含空格時就會掛掉。可以這樣解決： if [ "$filename" = "foo" ]; 使用$@變量時，你也需要使用引號，因為空格隔開的兩個參數會被解釋成兩個獨立的部分。 david% foo() { for i in $@; do echo $i; done }; foo bar "baz quux" bar baz quux david% foo() { for i in "$@"; do echo $i; done }; foo bar "baz quux" bar baz quux 我沒有想到任何不能使用"$@"的時候，所以當你有疑問的時候，使用引號就沒有錯誤。如果你同時使用find和xargs，你應該使用 -print0 來讓字符分割文件名，而不是換行符分割。 david% touch "foo bar" david% find | xargs ls ls: ./foo: No such file or directory ls: bar: No such file or directory david% find -print0 | xargs -0 ls ./foo bar 設置的陷阱當你編寫的腳本掛掉後，文件系統處於未知狀態。比如鎖文件狀態、臨時文件狀態或者更新了一個文件後在更新下一個文件前掛掉。如果你能解決這些問題，無論是刪除鎖文件，又或者在腳本遇到問題時回滾到已知狀態，你都是非常棒的。幸運的是，bash提供了一種方法，當bash接收到一個UNIX信號時，運行一個命令或者一個函數。可以使用trap命令。 trap command signal [signal ...] 你可以鏈接多個信號（列表可以使用kill -l獲得），但是為了清理殘局，我們只使用其中的三個：INT，TERM和EXIT。你可以使用-as來讓traps恢復到初始狀態。信號描述 INT Interrupt - 當有人使用Ctrl-C終止腳本時被觸發 TERM Terminate - 當有人使用kill殺死腳本進程時被觸發 EXIT Exit - 這是一個偽信號，當腳本正常退出或者set -e後因為出錯而退出時被觸發當你使用鎖文件時，可以這樣寫： if [ ! -e $lockfile ]; then touch $lockfile critical-section rm $lockfile else echo "critical-section is already running" fi 當最重要的部分(critical-section)正在運行時，如果殺死了腳本進程，會發生什麼呢？鎖文件會被扔在那，而且你的腳本在它被刪除以前再也不會運行了。解決方法： if [ ! -e $lockfile ]; then trap " rm -f $lockfile; exit" INT TERM EXIT touch $lockfile critical-section rm $lockfile trap - INT TERM EXIT else echo "critical-section is already running" fi 現在當你殺死進程時，鎖文件一同被刪除。注意在trap命令中明確地退出了腳本，否則腳本會繼續執行trap後面的命令。競態條件 (wikipedia) 在上面鎖文件的例子中，有一個競態條件是不得不指出的，它存在於判斷鎖文件和創建鎖文件之間。一個可行的解決方法是使用IO重定向和bash的noclobber(wikipedia)模式，重定向到不存在的文件。我們可以這麼做： if ( set -o noclobber; echo "$$" > "$lockfile") 2> /dev/null; then trap 'rm -f "$lockfile"; exit $?' INT TERM EXIT critical-section rm -f "$lockfile" trap - INT TERM EXIT else echo "Failed to acquire lockfile: $lockfile" echo "held by $(cat $lockfile)" fi 更復雜一點兒的問題是你要更新一大堆文件，當它們更新過程中出現問題時，你是否能讓腳本掛得更加優雅一些。你想確認那些正確更新了，哪些根本沒有變化。比如你需要一個添加用戶的腳本。 add_to_passwd $user cp -a /etc/skel /home/$user chown $user /home/$user -R 當磁盤空間不足或者進程中途被殺死，這個腳本就會出現問題。在這種情況下，你也許希望用戶賬戶不存在，而且他的文件也應該被刪除。 rollback() { del_from_passwd $user if [ -e /home/$user ]; then rm -rf /home/$user fi exit } trap rollback INT TERM EXIT add_to_passwd $user cp -a /etc/skel /home/$user chown $user /home/$user -R trap - INT TERM EXIT 在腳本最後需要使用trap關閉rollback調用，否則當腳本正常退出的時候rollback將會被調用，那麼腳本等於什麼都沒做。保持原子化又是你需要一次更新目錄中的一大堆文件，比如你需要將URL重寫到另一個網站的域名。你也許會寫： for file in $(find /var/www -type f -name "*.html"); do perl -pi -e 's/www.example.net/www.example.com/' $file done 如果修改到一半是腳本出現問題，一部分使用www.example.com，而另一部分使用www.example.net。你可以使用備份和trap解決，但在升級過程中你的網站URL是不一致的。解決方法是將這個改變做成一個原子操作。先對數據做一個副本，在副本中更新URL，再用副本替換掉現在工作的版本。你需要確認副本和工作版本目錄在同一個磁盤分區上，這樣你就可以利用Linux系統的優勢，它移動目錄僅僅是更新目錄指向的inode節點。 cp -a /var/www /var/www-tmp for file in $(find /var/www-tmp -type -f -name "*.html"); do perl -pi -e 's/www.example.net/www.example.com/' $file done mv /var/www /var/www-old mv /var/www-tmp /var/www 這意味著如果更新過程出問題，線上系統不會受影響。線上系統受影響的時間降低為兩次mv操作的時間，這個時間非常短，因為文件系統僅更新inode而不用真正的復制所有的數據。這種技術的缺點是你需要兩倍的磁盤空間，而且那些長時間打開文件的進程需要比較長的時間才能升級到新文件版本，建議更新完成後重新啟動這些進程。對於apache服務器來說這不是問題，因為它每次都重新打開文件。你可以使用lsof命令查看當前正打開的文件。優勢是你有了一個先前的備份，當你需要還原時，它就派上用場了。

上一篇文章：玩Linux五年積累的技巧(3) -- 系統（下）
下一篇文章： centos 6中文安裝顯示亂碼的解決方法

關於Linux