歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux技術 >> Linux系統中tr命令刪除和替換文本字符的基本用法

Linux系統中tr命令刪除和替換文本字符的基本用法

日期:2017/3/1 17:33:35   编辑:Linux技術

通過使用 tr,您可以非常容易地實現 sed 的許多最基本功能。您可以將 tr 看作為 sed 的(極其)簡化的變體:它可以用一個字符來替換另一個字符,或者可以完全除去一些字符。您也可以用它來除去重復字符。這就是所有 tr 所能夠做的。
tr用來從標准輸入中通過替換或刪除操作進行字符轉換。tr主要用於刪除文件中控制字符或進行字符轉換。使用tr時要轉換兩個字符串:字符串1用於查詢,字符串2用於處理各種轉換。tr剛執行時,字符串1中的字符被映射到字符串2中的字符,然後轉換操作開始。
帶有最常用選項的tr命令格式為:

復制代碼代碼如下:
tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file

這裡:
-c 用字符串1中字符集的補集替換此字符集,要求字符集為ASCII。
-d 刪除字符串1中所有輸入字符。
-s 刪除所有重復出現字符序列,只保留第一個;即將重復出現字符串壓縮為一個字符串。
input-file是轉換文件名。雖然可以使用其他格式輸入,但這種格式最常用。


字符范圍
指定字符串1或字符串2的內容時,只能使用單字符或字符串范圍或列表。
[a-z] a-z內的字符組成的字符串。
[A-Z] A-Z內的字符組成的字符串。
[0-9] 數字串。
\octal 一個三位的八進制數,對應有效的ASCII字符。
[O*n] 表示字符O重復出現指定次數n。因此[O*2]匹配OO的字符串。
tr中特定控制字符的不同表達方式
速記符含義八進制方式
\a Ctrl-G 鈴聲\007
\b Ctrl-H 退格符\010
\f Ctrl-L 走行換頁\014
\n Ctrl-J 新行\012
\r Ctrl-M 回車\015
\t Ctrl-I tab鍵\011
\v Ctrl-X \030
表達字符串的特殊序列

String1 和 String2 變量中所包含的字符串可以使用以下的約定來表示:
20151127110839429.png (1158×739)

如果某個字符在 String1 中被指定過多次,則該字符就被轉換成 String2 中為與 String1 中最後出現的字符相對應的字符。
如果由 String1 和 String2 指定的字符串長度不相同,則 tr 命令就會忽略較長一個字符串中的多余字符。

標志
20151127110905187.png (1081×413)

退出狀態
該命令返回以下出口值:
20151127110922842.png (1092×72)

實例:
1、將文件file中出現的"abc"替換為"xyz"

復制代碼代碼如下:
# cat file | tr "abc" "xyz" > new_file

【注意】這裡,凡是在file中出現的"a"字母,都替換成"x"字母,"b"字母替換為"y"字母,"c"字母替換為"z"字母。而不是將字符串"abc"替換為字符串"xyz"。

2、使用tr命令“統一”字母大小寫
(小寫 --> 大寫)

復制代碼代碼如下:
# cat file | tr [a-z] [A-Z] > new_file

(大寫 --> 小寫)

復制代碼代碼如下:
# cat file | tr [A-Z] [a-z] > new_file

3、把文件中的數字0-9替換為a-j

復制代碼代碼如下:
# cat file | tr [0-9] [a-j] > new_file

4、刪除文件file中出現的"Snail"字符

復制代碼代碼如下:
# cat file | tr -d "Snail" > new_file

【注意】這裡,凡是在file文件中出現的'S','n','a','i','l'字符都會被刪除!而不是緊緊刪除出現的"Snail”字符串。

5、刪除文件file中出現的換行'\n'、制表'\t'字符

復制代碼代碼如下:
# cat file | tr -d "\n\t" > new_file

不可見字符都得用轉義字符來表示的,這個都是統一的。

6、刪除“連續著的”重復字母,只保留第一個

復制代碼代碼如下:
# cat file | tr -s [a-zA-Z] > new_file

7、刪除空行

復制代碼代碼如下:
# cat file | tr -s "\n" > new_file

8、刪除Windows文件“造成”的'^M'字符

復制代碼代碼如下:
# cat file | tr -d "\r" > new_file

或者

復制代碼代碼如下:
# cat file | tr -s "\r" "\n" > new_file

【注意】這裡-s後面是兩個參數"\r"和"\n",用後者替換前者

9、用空格符\040替換制表符\011

復制代碼代碼如下:
# cat file | tr -s "\011" "\040" > new_file

10、把路徑變量中的冒號":",替換成換行符"\n"

復制代碼代碼如下:
# echo $PATH | tr -s ":" "\n"

11、若要將大括號轉換為小括號,請輸入:

復制代碼代碼如下:
tr '{}' '()' < textfile > newfile

這便將每個 {(左大括號)轉換成 ((左小括號),並將每個 }(右大括號)轉換成 )(右小括號)。所有其它的字符都保持不變。

12、若要將大括號轉換成方括號,請輸入:

復制代碼代碼如下:
tr '{}' '\[]' < textfile > newfile

這便將每個 {(左大括號)轉換成 [(左方括號),並將每個 }(右大括號)轉換成 ](右方括號)。左方括號必須與一個 "\"(反斜扛)轉義字符一起輸入。

13、若要將小寫字符轉換成大寫,請輸入:

復制代碼代碼如下:
tr 'a-z' 'A-Z' < textfile > newfile

14、若要創建一個文件中的單詞列表,請輸入:

復制代碼代碼如下:
tr -cs '[:lower:][:upper:]' '[\n*]' < textfile > newfile

這便將每一序列的字符(除大、小寫字母外)都轉換成單個換行符。*(星號)可以使 tr 命令重復換行符足夠多次以使第二個字符串與第一個字符串一樣長。

15、若要從某個文件中刪除所有空字符,請輸入:

復制代碼代碼如下:
tr -d '\0' < textfile > newfile

16、若要用單獨的換行替換每一序列的一個或多個換行,請輸入:

復制代碼代碼如下:
tr -s '\n' < textfile > newfile



復制代碼代碼如下:
tr -s '\012' < textfile > newfile

17、若要以“?”(問號)替換每個非打印字符(有效控制字符除外),請輸入:

復制代碼代碼如下:
tr -c '[:print:][:cntrl:]' '[?*]' < textfile > newfile

這便對不同語言環境中創建的文件進行掃描,以查找當前語言環境下不能打印的字符。

18、要以單個“#”字符替換 <space> 字符類中的每個字符序列,請輸入:

復制代碼代碼如下:
tr -s '[:space:]' '[#*]'

Copyright © Linux教程網 All Rights Reserved