歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Unix知識 >> Unix資訊 >> Unix中選擇合適的字符串處理方式

Unix中選擇合適的字符串處理方式

日期:2017/3/6 11:43:11   编辑:Unix資訊

在Unix操作系統中,說實話其字符串的處理功能實在不強。如沒有現成的length(獲取字符串的長度)等函數。要實現對字符串的操作,往往需要采用expr命令結合相關的通配符來實現一些特定的功能。雖然在Unix操作系統中,對於字符串的操作比較麻煩。但是系統工程師只要知道各種處理方式特點與缺點,那麼對症下藥,仍然可以找到一些簡單的方式來處理系統中的字符串問題。

一、對用戶輸入的字符串長度進行驗證。

系統工程師有時候往往需要對用戶輸入的字符串長度進行驗證。如在設計一個登陸程序時,為了安全起見,可能需要限制用戶密碼輸入的最小位數,如必須是六位以上的密碼等等。此時,其實就是統計用戶輸入的字符串長度問題。如果用戶輸入的密碼長度不夠,就提醒用戶;如果夠的話,就直接保存用戶輸入的信息。所以,簡單的說這可以利用if語句或者while循環判斷語句來實現。而這個條件則可以利用expr關鍵字來實現。

如果用判斷用戶輸入的字符串長度,可以利用如下的格式來寫。Expr “$userpasswd” : ’.*’ 即可。在編寫這個命令時,需要注意一些基本的規則。如這個expr命令往往需要使用兩個表達式,而且中間需要使用英文狀態小的冒號進行分割。而且這個兩個表達式的順序也有嚴格的限制。冒號左邊是需要處理的字符串(需要統計長度的字符串或者變量),而冒號右邊則是普通的正則表達式。其次,需要處理的字符串需要使用雙引號括起來。這裡跟普通命令中字符串的處理方式有所不同。在普通的命令中,變量不需要使用雙引號因起來。如果引起起來的話,則系統反而會將其當作常量來處理。但是如果在if條件語句中將利用這個命令來統計字符串長度時,則需要將變量使用雙引號引起來。這個字符串處理上的差異需要注意,不少系統工程師在這裡吃過虧。第三,有時候正則表達式也需要利用單引號來引起來。如上面的’.*’則表示所有匹配的字符。如果不使用單引號的話,系統可能會提示語法錯誤。

二、截取字符串。

有時候系統管理員需要截取字符串的自串來完成特定的任務。如現在系統工程師需要對某個文件根據系統的時間來進行命名,其命名的規則為年份(最後兩位)加月份的形式,即0906表示這個文件是09年6月份創建的。因為每個月創建一個獨立的日志文件,為此按這個格式對其進行命名算是比較合理的。但是在系統中實現起來有一定的困難。然後通過date命令加上一些可選項參數可以截取日期的年份、月份等信息。可是利用date命令截取的年份是四位數字(如2009),而不是兩位數字。這跟系統工程師的需求還有一定的距離。那麼如果一定要采用年份的兩位數字來對文件或者文件夾進行命名,該如何處理呢?

此時就需要用到expr命令的另一個功能,即截取字符串的功能。一般來說,expr命令主要有三個功能,分別為求字符串的長度、截取字符子串、求一個字符在一個字符串中的位置。當然如果這些功能跟其他命令結合使用的話,可以實現一些比較復雜的需求。在Unix系統中,如果需要截取字符串的話,筆者首先建議的是采用一些自帶的命令。如date %w則表示顯示今天星期幾。雖然expr命令也可以實現類似的功能,但是初期起來比較麻煩。為此對於截取字符串筆者建議,能夠使用系統自帶功能來實現的,那麼就使用系統自帶的命令。如果沒有的話,那麼就只有用過expr命令來實現。也就是說,expr 是一個通用的命令,所有的字符串截取工作其都可以完成。只是代碼書寫起來沒有那些系統自帶命令那麼簡單。如果現在系統工程師需要截取年份的後兩位數字,此時該如何處理呢?在系統轉義字符的幫助下,可以完成這個功能。如下所示:

$expr “2009” : ‘..\(..\)’

在實現這個功能的時候,筆者使用了\這個轉義字符。這個正則表達式的含義就表示只考慮前面這個字符串的最後兩個字符,而忽略其他的字符。若需要利用上面這個規則來進行文件命令的話,只需要先利用這個命令截取年份的最後兩位,然後再把月份加上去即可。上面的字符串2009系統工程師也可以使用變量來代替。系統工程師需要注意的是這個正則表達式的書寫方法。在使用expr命令來對字符串進行處理,其難點就在於這個正則表達式的書寫。通常情況下,只要合理編寫這個正則表達式,則其字符串的處理功能,並不會比數據庫系統中字符串處理函數來的差,甚至有過之而不及。現在的主要問題是,由於經驗有限,系統工程師往往很難根據用戶需求來定義這個正則表達式。就連筆者有時候也會在這裡卡住。如果系統工程師想要提高自己正則表達式的書寫能力,那麼多看看其他系統工程師書寫的腳本,往往能夠在最短時間內提高自己正則表達式的書寫水平。

三、修改文件的擴展名。

如現在操作系統中某個目錄下面有很多的sh文件(Unix系統中的配置文件,其實跟txt相同)。現在系統工程師需要將這些sh文件的擴展名改掉,全部改為txt。雖然可以通過一個個的手工修改來實現,但是處理起來的難度比較大。

如果要實現批量更改文件擴展名的話,則可以借助for等循環語句來實現。不過循環語句內部的操作有兩種實現方式。一是采用expr命令。其實對文件名進行操作,說到底就是對字符串的操作。因為文件名字也是一種字符串。如系統工程師可以先利用expr命令截取字符串的功能,將擴展名前面的字符串截取出來,然後將其保存在一個變量中,如filenameshort。然後再利用系統的重命名或者移動文件的命令,對系統進行重命名,如$filenameshortdoc。這就可以實現更改擴展名的需求。不過筆者並不建議采用這個expr命令來完成這個需求。因為當文件名的長度不固定時,這個正則表達式比價難寫。要將文件名字符串截取出來(去掉擴展名的名字),有一定的難度。

在這裡,筆者介紹另外一個命令basename命令。其實這也是一個字符串相關的處理命令。其基本格式為basename text1 text2。他的基本功能就是從第一個字符串中去掉第二個字符串的內容。如執行命令basename setup.sh sh,則就表示將setup.sh這個字符串中的sh字符串去掉,變為setup.。那麼此就可以利用這個命令來進行成批修改擴展名。其具體的實現方式跟上面類似。只是在截取文件名字符串的時候,采用了basename命令,而不是expr命令。而basename命令本身就帶有截取字符串的功能,不需要采用正則表達式。所以實現起來相對簡單一點。

從這個案例中,筆者也想再次強調一下一個字符串處理的基本原則。即無論是截取字符串還是對字符串進行的其他操作,如果可以通過系統命令+可選項參數來實現的,就采用這種實現方式。如果沒有的話,需要考慮能否采用basename等不需要正則表達式的命令來實現。只有在以上兩種方式都不可行的情況下,才考慮使用exper命令來實現。這主要是因為正則表達式的設計實在比較麻煩,雖然其功能比較強大。利用exper來統計一下字符串的長度還好,但是如果要實現一些復雜功能,如截取字符串或者確定字符的位置,就需要系統工程師有比較深厚的功底了。

Copyright © Linux教程網 All Rights Reserved