歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> Linux命令行的藝術

Linux命令行的藝術

日期:2017/2/28 13:56:39   编辑:Linux教程

熟練使用命令行是一種常常被忽視或被認為難以掌握的技能,但實際上,它可以提高你作為工程師的靈活性以及生產力。本文是一份我在 Linux 上工作時發現的一些關於命令行的使用的小技巧的摘要。有些小技巧是非常基礎的,而另外一些則是相當復雜的甚至晦澀難懂的。這篇文章並不長,但當你能夠熟練掌握這裡列出的所有技巧時,你就學會了很多關於命令行的東西了。

必讀

涵蓋范圍:

  • 這篇文章對剛接觸命令行的新手以及具有命令行使用經驗的人都有用處。本文致力於做到覆蓋面廣(盡量包括一切重要的內容),具體(給出最常見的具體的例子)以及簡潔(避免一些不必要的東西以及一些偏題的可以在其他地方翻閱到文獻的東西)。 每個小技巧在某個特定情境下都是基本的或能夠顯著地節約時間。
  • 本文為 Linux 所寫,除了僅限 MacOS X 系統節。其它節中的大部分內容都適用於其它 Unix 系統或 MacOS 系統,甚至 Cygwin。
  • 本文關注於交互式 Bash,盡管很多技巧也適用於其他 shell 或 Bash 腳本。
  • 本文包括了“標准的”Unix 命令和需要安裝特定包的命令,只要它們足夠重要。

注意事項:

  • 為了能在一頁內展示盡量多的東西,一些具體的信息會被間接的包含在引用頁裡。聰明機智的你如果掌握了使用 Google 搜索引擎的基本思路與命令,那麼你將可以查閱到更多的詳細信息。使用 apt-getyumdnfpacmanpipbrew(以及其它合適的包管理器)來安裝新程序。
  • 使用 Explainshell 去獲取相關命令、參數、管道等內容的解釋。

基礎

  • 學習 Bash 的基礎知識。具體來說,輸入 man bash 並至少全文浏覽一遍; 它很簡單並且不長。其他的 shell 可能很好用,但 Bash 功能強大且幾乎所有情況下都是可用的 ( 學習 zsh,fish 或其他的 shell 的話,在你自己的電腦上會顯得很方便,但在很多情況下會限制你,比如當你需要在服務器上工作時)。
  • 學習並掌握至少一個基於文本的編輯器。通常 Vim (vi) 會是你最好的選擇,因為在終端裡進行隨機編輯 Vim 真的毫無敵手,哪怕是 Emacs、某大型 IDE 甚至時下非常流行的編輯器。
  • 學會如何使用 man 命令去閱讀文檔。學會使用 apropos 去查找文檔。了解有些命令並不對應可執行文件,而是Bash內置的,可以使用 helphelp -d 命令獲取幫助信息。
  • 學會使用 >< 來重定向輸出和輸入,學會使用 | 來重定向管道。明白 > 會覆蓋了輸出文件而 >> 是在文件未添加。了解標准輸出 stdout 和標准錯誤 stderr。
  • 學會使用通配符 * (或許再算上 ?[]) 和引用以及引用中 '" 的區別。
  • 熟悉 Bash 任務管理工具:&ctrl-zctrl-cjobsfgbgkill 等。
  • 了解 ssh,以及學會通過使用 ssh-agentssh-add 等命令來實現基本的無密碼認證。
  • 學會基本的文件管理:lsls -l (了解 ls -l 中每一列代表的意義),lessheadtailtail -f (甚至 less +F),lnln -s (了解硬鏈接與軟鏈接的區別),chownchmoddu (硬盤使用情況概述:du -hk *)。 關於文件系統的管理,學習 dfmountfdiskmkfslsblk。知道 inode 是什麼(與 ls -idf -i等命令相關)。
  • 學習基本的網絡管理:ipifconfigdig
  • 熟悉正則表達式,以及 grepegrep 裡不同參數的作用,例如 -i-o-v-A-B-C,這些參數是值得學習並掌握的。
  • 學會使用 apt-getyumdnfpacman (取決於你使用的 Linux 發行版)來查找或安裝軟件包。並確保你的環境中有 pip 來安裝基於 Python 的命令行工具 (接下來提到的部分程序使用 pip 來安裝會很方便)。

日常使用

  • 在 Bash 中,可以使用 Tab 自動補全參數,使用 ctrl-r 搜索命令行歷史。
  • 在 Bash 中,可以使用 ctrl-w 刪除你鍵入的最後一個單詞,使用 ctrl-u 刪除整行,使用 alt-balt-f 以單詞為單位移動光標,使用 ctrl-a 將光標移至行首,使用 ctrl-e 將光標移至行尾,使用 ctrl-k 刪除光標至行尾的所有內容,使用ctrl-l 清屏。鍵入 man readline 查看 Bash 中的默認快捷鍵,內容很多。例如 alt-. 循環地移向前一個參數,以及 alt-* 展開通配符。
  • 你喜歡的話,可以鍵入 set -o vi 來使用 vi 風格的快捷鍵,而 set -o emacs 可以把它改回來。
  • 為了方便地鍵入長命令,在設置你的編輯器後(例如 export EDITOR=vim),鍵入 ctrl-x ctrl-e 會打開一個編輯器來編輯當前命令。在 vi 模式下則鍵入 escape-v 實現相同的功能。
  • 鍵入 history 查看命令行歷史記錄。其中有許多縮寫,例如 !$(最後鍵入的參數)和 !!(最後鍵入的命令),盡管通常被 ctrl-ralt-. 取代。
  • 回到上一個工作路徑:cd -
  • 如果你輸入命令的時候改變了主意,按下 alt-# 來在行首添加 #,或者依次按下 ctrl-a#enter。這樣做的話,之後你可以很方便的利用命令行歷史回到你剛才輸入到一半的命令。
  • 使用 xargs ( 或 parallel)。他們非常給力。注意到你可以控制每行參數個數(-L)和最大並行數(-P)。如果你不確定它們是否會按你想的那樣工作,先使用 xargs echo 查看一下。此外,使用 -I{} 會很方便。例如:
1 2 find.-name'*.py'|xargs grep some_function cat hosts|xargs-I{}sshroot@{}hostname
  • pstree -p 有助於展示進程樹。
  • 使用 pgreppkill 根據名字查找進程或發送信號(-f 參數通常有用)。
  • 了解你可以發往進程的信號的種類。比如,使用 kill -STOP [pid] 停止一個進程。使用 man 7 signal 查看詳細列表。
  • 使用 nohupdisown 使一個後台進程持續運行。
  • 使用 netstat -lntpss -plat 檢查哪些進程在監聽端口(默認是檢查 TCP 端口; 使用參數 -u 檢查 UDP 端口)。
  • 有關打開套接字和文件,請參閱 lsof
  • 使用 uptimew ���查看系統已經運行多長時間。
  • 使用alias來創建常用命令的快捷形式。例如:alias ll='ls -latr'使你可以方便地執行ls -latr命令。
  • 在 Bash 腳本中,使用 set -x 去調試輸出,盡可能的使用嚴格模式,使用 set -e 令腳本在發生錯誤時退出而不是繼續運行,使用 set -u 來檢查是否使用了未賦值的變量,使用 set -o pipefail 嚴謹地對待錯誤(盡管問題可能很微妙)。當牽扯到很多腳本時,使用 trap。一個好的習慣是在腳本文件開頭這樣寫,這會使它檢測一些錯誤,並在錯誤發生時中斷程序並輸出信息:
1 2 set-euo pipefail trap"echo 'error: Script failed: see failed command above'"ERR
  • 在 Bash 腳本中,子 shell(使用括號(...))是一種便捷的方式去組織參數。一個常見的例子是臨時地移動工作路徑,代碼如下:
1 2 3 # do something in current dir (cd/some/other/dir&&other-command) # continue in original dir
  • 在 Bash 中,注意到其中有許多形式的擴展。檢查變量是否存在:${name:?error message}。例如,當 Bash 腳本需要一個參數時,可以使用這樣的代碼 input_file=${1:?usage: $0 input_file}。數學表達式:i=$(( (i + 1) % 5 ))。序列:{1..10}。 截斷字符串:${var%suffix}${var#prefix}。例如,假設 var=foo.pdf,那麼 echo ${var%.pdf}.txt 將輸出 foo.txt
  • 使用括號擴展({})可以減少不必要的重復輸入相似文本以及文本組合。
  • 通過使用 <(some command) 可以將輸出視為文件。例如,對比本地文件 /etc/hosts 和一個遠程文件:
1 diff/etc/hosts<(ssh somehost cat/etc/hosts)
  • 了解 Bash 中的“here documents”,例如 cat <<EOF ...
  • 在 Bash 中,同時重定向標准輸出和標准錯誤,some-command >logfile 2>&1。通常,為了保證命令不會在標准輸入裡殘留一個打開了的文件句柄導致你當前所在的終端無法操作,添加 </dev/null 是一個好習慣。
  • 使用 man ascii 查看具有十六進制和十進制值的ASCII表。man unicodeman utf-8,以及 man latin1 有助於你去了解通用的編碼信息。
  • 使用 screentmux 來使用多個屏幕,當你在使用 ssh 時(保存 session 信息)將尤為有用。另一個輕量級的解決方案是 dtach
  • ssh 中,了解如何使用 -L-D(偶爾需要用 -R)去開啟隧道是非常有用的,例如當你需要從一台遠程服務器上訪問 web。
  • 對 ssh 設置做一些小優化可能是很有用的,例如這個 ~/.ssh/config 文件包含了防止特定環境下斷開連接、壓縮數據、多通道等選項:
1 2 3 4 5 6 7 TCPKeepAlive=yes ServerAliveInterval=15 ServerAliveCountMax=6 Compression=yes ControlMaster auto ControlPath/tmp/%r@%h:%p ControlPersist yes

  • 部分其他的關於 ssh 的選項是安全敏感且應當小心啟用的。例如在可信任的網絡中:StrictHostKeyChecking=noForwardAgent=yes
  • 考慮使用 mosh 作為 ssh 的替代品,它使用 UDP 協議。
  • 獲取文件的八進制格式權限,使用類似如下的代碼:
1 stat-c'%A %a %n'/etc/timezone
  • 使用 percol 或者 fzf 可以交互式地從另一個命令輸出中選取值。
  • 使用 fpp(PathPicker)可以與基於另一個命令(例如 git)輸出的文件交互。
  • 將 web 服務器上當前目錄下所有的文件(以及子目錄)暴露給你所處網絡的所有用戶,使用: python -m SimpleHTTPServer 7777 (使用端口 7777 和 Python 2)或python -m http.server 7777 (使用端口 7777 和 Python 3)。
  • 以某種權限執行命令,使用sudo(root 權限)或sudo -u(其他用戶)。使用su或者sudo bash來啟動一個以對應用戶權限運行的 shell。使用su -模擬其他用戶的登錄。

文件及數據處理

  • 在當前路徑下通過文件名定位一個文件,find . -iname '*something*'(或類似的)。在所有路徑下通過文件名查找文件,使用 locate something (但請記住 updatedb 可能沒有對最近新建的文件建立索引)。
  • 使用 ag 在源代碼或數據文件裡檢索(比 grep -r 更好)。
  • 將HTML轉為文本:lynx -dump -stdin
  • Markdown,HTML,以及所有文檔格式之間的轉換,試試 pandoc
  • 如果你不得不處理 XML,xmlstarlet 寶刀未老。
  • 使用 jq 處理 JSON。
  • Excel 或 CSV 文件的處理,csvkit 提供了 in2csvcsvcutcsvjoincsvgrep 等工具。
  • 關於 Amazon S3,s3cmd 很方便而 s4cmd 更快。Amazon 官方的 aws 以及 saws 是其他 AWS 相關工作的基礎。
  • 了解如何使用 sortuniq,包括 uniq 的 -u 參數和 -d 參數,詳見後文一行代碼節。另外可以了解一下 comm
  • 了解如何使用 cutpastejoin 來更改文件。很多人都會使用 cut,但幾乎都不會使用 join
  • 了解如何運用 wc 去計算新行數(-l),字符數(-m),單詞數(-w)以及字節數(-c)。
  • 了解如何使用 tee 將標准輸入復制到文件甚至標准輸出,例如 ls -al | tee file.txt
  • 了解語言環境對許多命令行工具的微妙影響,包括排序的順序和性能。大多數 Linux 的安裝過程會將 LANG 或其他有關的變量設置為符合本地的設置。意識到當你改變語言環境時,排序的結果可能會改變。明白國際化可能會時 sort 或其他命令運行效率下降許多倍。某些情況下(例如集合運算)你可以放心的使用 export LC_ALL=C 來忽略掉國際化並使用基於字節的順序。
  • 了解 awksed 關於數據的簡單處理的用法。例如,將文本文件中第三列的所有數字求和:awk '{ x += $3 } END { print x }'. 這可能比同等作用的 Python 代碼快三倍且代碼量少三倍。
  • 替換一個或多個文件中出現的字符串:
1 perl-pi.bak-e's/old-string/new-string/g'my-files-*.txt
  • 依據某種模式批量重命名多個文件,使用 rename。對於復雜的重命名規則,repren 或許有幫助。
1 2 3 4 # Recover backup files foo.bak -> foo: rename's/\.bak$//'*.bak # Full rename of filenames,directories,and contents foo -> bar: repren--full--preserve-case--from foo--tobar.
  • 使用 shuf 從一個文件中隨機選取多行。
  • 了解 sort 的參數。處理數字方面,使用 -n 或者 -h 來處理可讀性數字(例如 du -h 的輸出)。明白鍵的工作原理(-t-k)。例如,注意到你需要 -k1,1 來僅按第一個域來排序,而 -k1 意味著按整行排序。穩定排序(sort -s)在某些情況下很有用。例如,以第二個域為主關鍵字,第一個域為次關鍵字進行排序,你可以使用 sort -k1,1 | sort -s -k2,2
  • 如果你想在 Bash 命令行中寫 tab 制表符,按下 ctrl-v [Tab] 或鍵入 $'\t' (後者可能更好,因為你可以復制粘貼它)。
  • 標准的源代碼對比及合並工具是 diffpatch。使用 diffstat 查看變更總覽數據。注意到 diff -r 對整個文件夾有效。使用 diff -r tree1 tree2 | diffstat 查看變更總覽數據。
  • 對於二進制文件,使用 hd 使其以十六進制顯示以及使用 bvi 來編輯二進制。
  • 同樣對於二進制文件,使用 strings(包括 grep 等等)允許你查找一些文本。
  • 二進制文件對比(Delta 壓縮),使用 xdelta3
  • 使用 iconv 更改文本編碼。而更高級的用法,可以使用 uconv,它支持一些高級的 Unicode 功能。例如,這條命令將所有元音字母轉為小寫並移除了:
1 uconv-futf-8-tutf-8-x'::Any-Lower; ::Any-NFD; [:Nonspacing Mark:] >; ::Any-NFC; '<input.txt>output.txt
  • 拆分文件,查看 split(按大小拆分)和 csplit(按模式拆分)。
  • 使用 zlesszmorezcatzgrep對壓縮過的文件進行操作。

系統調試

  • curlcurl -I 可以便捷地被應用於 web 調試中,它們的好兄弟 wget 也可以,或者是更潮的 httpie
  • 使用 iostatnetstattophtop 更佳)和 dstat 去獲取硬盤、cpu 和網絡的狀態。熟練掌握這些工具可以使你快速的對系統的當前狀態有一個大概的認識。
  • 使用 netstatss 查看網絡連接的細節。
  • 若要對系統有一個深度的總體認識,使用 glances。它在一個終端窗口中向你提供一些系統級的數據。這對於快速的檢查各個子系統非常有幫助。
  • 若要了解內存狀態,運行並理解 freevmstat 的輸出。尤其注意“cached”的值,它指的是 Linux 內核用來作為文件緩存的內存大小,因此它與空閒內存無關。
  • Java 系統調試則是一件截然不同的事,一個可以用於 Oracle 的 JVM 或其他 JVM 上的調試的小技巧是你可以運行kill -3 <pid> 同時一個完整的棧軌跡和堆概述(包括 GC 的細節)會被保存到標准輸出/日志文件。JDK 中的jpsjstatjstackjmap 很有用。SJK tools 更高級.
  • 使用 mtr 去跟蹤路由,用於確定網絡問題。
  • ncdu 來查看磁盤使用情況,它比常用的命令,如 du -sh *,更節省時間。
  • 查找正在使用帶寬的套接字連接或進程,使用 iftopnethogs
  • ab 工具(捆綁於 Apache)可以簡單粗暴地檢查 web 服務器的性能。對於更復雜的負載測試,使用 siege
  • wiresharktsharkngrep 可用於復雜的網絡調試。
  • 了解 straceltrace。這倆工具在你的程序運行失敗、掛起甚至崩潰,而你卻不知道為什麼或你想對性能有個總體的認識的時候是非常有用的。注意 profile 參數(-c)和附加到一個運行的進程參數 (-p)。
  • 了解使用 ldd 來檢查共享庫。
  • 了解如何運用 gdb 連接到一個運行著的進程並獲取它的堆棧軌跡。
  • 學會使用 /proc。它在調試正在出現的問題的時候有時會效果驚人。比如:/proc/cpuinfo/proc/meminfo/proc/cmdline/proc/xxx/cwd/proc/xxx/exe/proc/xxx/fd//proc/xxx/smaps(這裡的 xxx 表示進程的 id 或 pid)。
  • 當調試一些之前出現的問題的時候,sar 非常有用。它展示了 cpu、內存以及網絡等的歷史數據。
  • 關於更深層次的系統分析以及性能分析,看看 stap(SystemTap),perf,以及sysdig
  • 查看你當前使用��系統,使用 unameuname -a (Unix/kernel 信息) 或者 lsb_release -a (Linux 發行版信息)。
  • 無論什麼東西工作得很歡樂時試試 dmesg(可能是硬件或驅動問題)。

一行代碼

一些命令組合的例子:

  • 當你需要對文本文件做集合交、並、差運算時,結合使用 sort/uniq 很有幫助。假設 ab 是兩內容不同的文件。這種方式效率很高,並且在小文件和上G的文件上都能運用 (sort 不被內存大小約束,盡管在 /tmp 在一個小的根分區上時你可能需要 -T 參數),參閱前文中關於 LC_ALLsort-u 參數的部分。
1 2 3 catab|sort|uniq>c # c is a union b catab|sort|uniq-d>c # c is a intersect b catabb|sort|uniq-u>c # c is set difference a - b
  • 使用 grep . * 來閱讀檢查目錄下所有文件的內容,例如檢查一個充滿配置文件的目錄比如 /sys/proc/etc
  • 計算文本文件第三列中所有數的和(可能比同等作用的 Python 代碼快三倍且代碼量少三倍):
1 awk'{ x += $3 } END { print x }'myfile
  • 如果你想在文件樹上查看大小\日期,這可能看起來像遞歸版的 ls -l 但比 ls -lR 更易於理解:
1 find.-typef-ls
  • 假設你有一個類似於 web 服務器日志文件的文本文件,並且一個確定的值只會出現在某些行上,假設一個 acct_id參數在URI中。如果你想計算出每個 acct_id 值有多少次請求,使用如下代碼:
1 cat access.log|egrep-o'acct_id=[0-9]+'|cut-d=-f2|sort|uniq-c|sort-rn
  • 運行這個函數從這篇文檔中隨機獲取一條小技巧(解析 Markdown 文件並抽取項目):
1 2 3 4 5 6 7 functiontaocl(){ curl-shttps://raw.githubusercontent.com/jlevy/the-art-of-command-line/master/README.md | pandoc-fmarkdown-thtml| xmlstarlet fo--html--dropdtd| xmlstarlet sel-t-v"(html/body/ul/li[count(p)>0])[$RANDOM mod last()+1]"| xmlstarlet unesc|fmt-80 }

冷門但有用

  • expr:計算表達式或正則匹配
  • m4:簡單地宏處理器
  • yes:多次打印字符串
  • cal:漂亮的日歷
  • env:執行一個命令(腳本文件中很有用)
  • printenv:打印環境變量(調試時或在使用腳本文件時很有用)
  • look:查找以特定字符串開頭的單詞
  • cutpastejoin:數據修改
  • fmt:格式化文本段落
  • pr:將文本格式化成頁/列形式
  • fold:包裹文本中的幾行
  • column:將文本格式化成多列或表格
  • expandunexpand:制表符與空格之間轉換
  • nl:添加行號
  • seq:打印數字
  • bc:計算器
  • factor:分解因數
  • gpg:加密並簽名文件
  • toe:terminfo entries 列表
  • nc:網絡調試及數據傳輸
  • socat:套接字代理,與 netcat 類似
  • slurm:網絡可視化
  • dd:文件或設備間傳輸數據
  • file:確定文件類型
  • tree:以樹的形式顯示路徑和文件,類似於遞歸的 ls
  • stat:文件信息
  • time:執行命令,並計算執行時間
  • lockfile:使文件只能通過 rm -f 移除
  • logrotate: 切換、壓縮以及發送日志文件
  • watch:重復運行同一個命令,展示結果並高亮有更改的部分
  • tac:反向輸出文件
  • shuf:文件中隨機選取幾行
  • comm:一行一行的比較排序過的文件
  • pv:監視通過管道的數據
  • hdhexdumpxxdbiewbvi:保存或編輯二進制文件
  • strings:從二進制文件中抽取文本
  • tr:轉換字母
  • iconvuconv:簡易的文件編碼
  • splitcsplit:分割文件
  • sponge:在寫入前讀取所有輸入,在讀取文件後再向同一文件寫入時比較有用,例如 grep -v something some-file | sponge some-file
  • units:將一種計量單位轉換為另一種等效的計量單位(參閱 /usr/share/units/definitions.units
  • apg:隨機生成密碼
  • 7z:高比例的文件壓縮
  • ldd:動態庫信息
  • nm:提取 obj 文件中的符號
  • ab:性能分析 web 服務器
  • strace:系統調用調試
  • mtr:更好的網絡調試跟蹤工具
  • cssh:可視化的並發 shell
  • rsync:通過 ssh 或本地文件系統同步文件和文件夾
  • wiresharktshark:抓包和網絡調試工具
  • ngrep:網絡層的 grep
  • hostdig:DNS 查找
  • lsof:列出當前系統打開文件的工具以及查看端口信息
  • dstat:系統狀態查看
  • glances:高層次的多子系統總覽
  • iostat:硬盤使用狀態
  • mpstat: CPU 使用狀態
  • vmstat: 內存使用狀態
  • htop:top 的加強版
  • last:登入記錄
  • w:查看處於登錄狀態的用戶
  • id:用戶/組 ID 信息
  • sar:系統歷史數據
  • iftopnethogs:套接字及進程的網絡利用
  • ss:套接字數據
  • dmesg:引導及系統錯誤信息
  • sysctl: 在內核運行時動態地查看和修改內核的運行參數
  • hdparm:SATA/ATA 磁盤更改及性能分析
  • lsb_release:Linux 發行版信息
  • lsblk:列出塊設備信息:以樹形展示你的磁盤以及磁盤分區信息
  • lshwlscpulspcilsusbdmidecode:查看硬件信息,包括 CPU、BIOS、RAID、顯卡、USB設備等
  • lsmodmodinfo:列出內核模塊,並顯示其細節
  • fortuneddatesl:額,這主要取決於你是否認為蒸汽火車和莫名其妙的名人名言是否“有用”

僅限 MacOS X 系統

以下是僅限於 MacOS 系統的技巧

  • brew (Homebrew)或者 port (MacPorts)進行包管理。這些可以用來在 Mac 系統上安裝以上的大多數命令。
  • pbcopy 復制任何命令的輸出到桌面應用,用 pbpaste 粘貼輸入。
  • 在終端中將 Option 鍵視為 alt 鍵,Preferences -> Profiles -> Keyboard 勾選上 “Use Option as Meta key”。
  • open 或者 open -a /Applications/Whatever.app 使用桌面應用打開文件。
  • Spotlight: 用 mdfind 搜索文件,用 mdls 列出元數據(例如照片的 EXIF 信息)。
  • 注意 MacOS 系統是基於 BSD UNIX 的,許多命令(例如 pslstailawksed)都和 Linux 中有些微的不同,這些極大的被 System V-style Unix 和 GNU 工具影響。你可以通過標題為 “BSD General Commands Manual” 的 man 頁面發現這些不同。在有些情況下 GNU 版本的命令也可能被安裝(例如 gawkgsed 對應 GNU 中的 awk 和 sed )。如果要寫跨平台的 Bash 腳本,避免使用這些命令(例如,考慮 Python 或者 perl )或者經過仔細的測試。
Copyright © Linux教程網 All Rights Reserved