歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux技術 >> Linux下用於對比文件的diff命令使用教程

Linux下用於對比文件的diff命令使用教程

日期:2017/3/1 17:33:34   编辑:Linux技術

總覽
diff [選項] 源文件 目標文件


描述
在最簡單的情況是, diff 比較兩個文件的內容 (源文件 和 目標文件). 文件名可以是 - 由標准輸入設備讀入的文本. 作為特別的情況是, diff - - 比較一份標准輸入的它自己的拷貝如果 源文件 是一個目錄和 目標文件 不是(目錄), diff 會比較在 源文件(目錄) 裡的文件的中和 目標文件同名的(文件), 反過來也一樣. 非目錄文件不能是 -. 如果 源文件 和 目標文件 都是目錄, diff 比較兩個目錄中相應的文件,依照字母次序排序;這個比較是不會遞歸的,除非給出 -r 或者 --recursive. diff 不把一個目錄的內容看為它是一個文件來比較。被指定的文件不能是標准的輸入, 因為標准的輸入是無名的並且"有一樣的名字的文件"的觀點不適用。 diff 的選項由 -, 開始所以正常地 源文件(名) 和 目標文件(名) 不可以用 - 開頭. 然而, -- 可以被它視為保留的即使作為文件名的開頭( they begin with -.)


選項
下面是 GNU所接受的 diff 的所有選項的概要. 大多數的選項有兩個相同的名字,一個是單個的跟在 - 後面字母, 另一個是由 -- 引出的長名字. 多個單字母選項(除非它們產生歧義)能夠組合為單行的命令行語法 -ac 是等同於 -a -c. 長命名的選項能被縮短到他們的名字的任何唯一的前綴. 用 ([ 和 ]) 括起來顯示選項產生歧義的選項
-行數(一個整數)
顯示上下文 行數 (一個整數). 這個選項自身沒有指定輸出格式,這是沒有效果的,除非和 -c 或者 -u 組合使用. 這是已廢置的選項,對於正確的操作, 上下文至少要有兩行。
-a
所有的文件都視為文本文件來逐行比較,甚至他們似乎不是文本文件.
-b
忽略空格引起的變化.
-B
忽略插入刪除空行引起的變化.
--brief
僅報告文件是否相異,在乎差別的細節.
-c
使用上下文輸出格式.
-C 行數(一個整數)

--context[=lines]
使用上下文輸出格式,顯示以指定 行數 (一個整數), 或者是三行(當 行數 沒有給出時. 對於正確的操作, 上下文至少要有兩行.
--changed-group-format=format
使用 format 輸出一組包含兩個文件的不同處的行,其格式是 if-then-else .
-d
改變算法也許發現變化的一個更小的集合.這會使 diff 變慢 (有時更慢).
-D name
合並 if-then-else 格式輸出, 預處理宏(由name參數提供)條件.
-e

--ed
輸出為一個有效的 ed 腳本.
--exclude=pattern
比較目錄的時候,忽略和目錄中與 pattern(樣式) 相配的.
--exclude-from=file
比較目錄的時候,忽略和目錄中與任何包含在 file(文件) 的樣式相配的文件和目錄.
--expand-tabs
在輸出時擴展tab為空格,保護輸入文件的tab對齊方式
-f
產生一個很象 ed 腳本的輸出,但是但是在他們在文件出現的順序有改變
-F regexp
在上下文和統一格式中,對於每一大塊的不同,顯示出匹配 regexp. 的一些前面的行.
--forward-ed
產生象 ed 腳本的輸出,但是它們在文件出現的順序有改變。
-h
這選項現在已沒作用,它呈現Unix的兼容性.
-H
使用啟發規則加速操作那些有許多離散的小差異的大文件.
--horizon-lines=lines
比較給定行數的有共同前綴的最後行,和有共同或綴的最前行.
-i
忽略大小寫.
-I regexp
忽略由插入,刪除行(由regexp 參數提供參考)帶來的改變.
--ifdef=name
合並 if-then-else 格式輸出, 預處理宏(由name參數提供)條件.
--ignore-all-space
在比較行的時候忽略空白.
--ignore-blank-lines
忽略插入和刪除空行
--ignore-case
忽略大小寫.
--ignore-matching-lines=regexp
忽略插入刪除行(由regexp 參數提供參考).
--ignore-space-change
忽略空白的數量.
--initial-tab
在文本行(無論是常規的或者格式化的前後文關系)前輸出tab代替空格. 引起的原因是tab對齊方式看上去象是常規的一樣.
-l
產生通過 pr 編碼的輸出.
-L label

--label=label
使用 label 給出的字符在文件頭代替文件名輸出.
--left-column
以並列方式印出兩公共行的左邊
--line-format=format
使用 format 輸出所有的行,在 if-then-else 格式中.
--minimal
改變算法也許發現變化的一個更小的集合.這會使 diff 變慢 (有時更慢).
-n
輸出 RC-格式 diffs; 除了每條指令指定的行數受影響外 象 -f 一樣。
-N

--new-file
在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.
--new-group-format=format
使用 format 以if-then-else 格式輸出只在第二個文件中取出的一個行組
--new-line-format=format
使用 format 以if-then-else 格式輸出只在第二個文件中取出的一行
--old-group-format=format
使用 format 以if-then-else 格式輸出只在第一個文件中取出的一個行組
--old-line-format=format
使用 format 使用 format 以if-then-else 格式輸出只在第一個文件中取出的一行
-p
顯示帶有c函數的改變.
-P
在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.
--paginate
產生通過 pr 編碼的輸出.
-q
僅報告文件是否相異,不報告詳細的差異.
-r
當比較目錄時,遞歸比較任何找到的子目錄.
--rcs
輸出 RC-格式 diffs; 除了每條指令指定的行數受影響外 象 -f 一樣。
--recursive
當比較目錄時,遞歸比較任何找到的子目錄.
--report-identical-files

-s
報告兩個文件相同.
-S file
當比較目錄時,由 file 開始. 這用於繼續中斷了的比較.
--sdiff-merge-assist
打印附加的信息去幫助 sdiff. sdiff 在運行 diff 時使用這些選項. 這些選項不是特意為使用者直接使用而准備的。
--show-c-function
顯示帶有c函數的改變.
--show-function-line=regexp
在上下文和統一的格式,對於每一大塊的差別,顯示出匹配 regexp. 的一些前面的行
--side-by-side
使用並列的輸出格式.
--speed-large-files
使用啟發規則加速操作那些有許多離散的小差異的大文件.
--starting-file=file
當比較目錄時,由 file 開始. 這用於繼續中斷了的比較.
--suppress-common-lines
在並列格式中不印出公共行。
-t
在輸出時擴展tab為空格,保護輸入文件的tab對齊方式
-T
在文本行(無論是常規的或者格式化的前後文關系)前輸出tab代替空格.引起的原因是tab對齊方式看上去象是常規的一樣.
--text
所有的文件都視為文本文件來逐行比較,甚至他們似乎不是文本文件.
-u
使用統一的輸出格式.
--unchanged-group-format=format
使用 format 輸出兩個文件的公共行組,其格式是if-then-else.
--unchanged-line-format=format
使用 format 輸出兩個文件的公共行,其格式是if-then-else.
--unidirectional-new-file
在目錄比較中,如果那個文件只在其中的一個目錄中找到,那麼它被視為在另一個目錄中是一個空文件.
-U lines

--unified[=lines]
使用前後關系格式輸出,顯示以指定 行數 (一個整數), 或者是三行(當 行數 沒有給出時. 對於正確的操作, 上下文至少要有兩行.
-v

--version
輸出 diff 版本號.
-w
在比較行時忽略空格
-W columns

--width=columns
在並列格式輸出時,使用指定的列寬.
-x pattern
比較目錄的時候,忽略和目錄中與 pattern(樣式) 相配的.
-X file
比較目錄的時候,忽略和目錄中與任何包含在 file(文件) 的樣式相配的文件和目錄.
-y
使用並列格式輸出


實例:
假設我們有兩個文件(file1 和 file2):

復制代碼代碼如下:
$ cat file1
Hi,
Hello,
How are you?
I am fine,
Thank you.


復制代碼代碼如下:
$ cat file2
Hello,
Hi,
How are you?
I am fine.

你可以看見兩個文件有些小的不同。現在,讓我們看看diff命令如何找出兩者的不同的。

像這樣運行diff命令:

復制代碼代碼如下:
$ diff file1 file2
1d0
< Hi,
2a2
> Hi,
4,5c4
< I am fine,
< Thank you.
---
> I am fine.

你可以看見diff後面跟了兩個文件的名字作為命令行的參數,並且它在輸出中生成了差異比較。輸出並不容易理解。理由是,這是被計算機使用的而不是為了人類。盡管如此,讓我們一步步解碼輸出:

注意 – 在下面的文本中,file1和file2將被當作舊文件和新文件。

復制代碼代碼如下:
1d0
< Hi,

這裡,1d0這一行意味著舊文件的第一行應該被刪除(d)以使兩個文件的第一行同步。舊文件中需要被刪除的行以'<'標記。

復制代碼代碼如下:
2a2
> Hi,

這裡,2a2行意味著新文件中的第二行應該加到舊文件的第二行後。要添加的行顯示在輸出的下一行用'>'標記。

復制代碼代碼如下:
4,5c4
< I am fine,
< Thank you.
---
> I am fine.

這裡,4,5c4這一行意味著在舊文件中的4到5行現在已被改變並且需要用新文件中的第4行代替。添加和刪除的行分別用'>'和'<'表示。

那麼,來總結一下,

首先diff命令的第一個參數被視為舊文件而第二個參數被視為新文件。
像1d0、2a2、4,5c4這種表達式可以用語法解碼為 [舊文件的行號或者行的范圍][行為][新文件的行號或者行的范圍]。這裡的'行為'可以是追加,刪除或者改變替換。
'<'代表刪除的行,而'>'代表添加的行。
除了文件外,diff命令還可以比較兩個目錄。讓我們通過一個例子學習。

這裡是'new_dir'目錄包含的內容:

復制代碼代碼如下:
$ ls new_dir/
file file2 frnd frnd1.cpp log1.txt log3.txt log5.txt
file1 file name with spaces frnd1 frnd.cpp log2.txt log4.txt

這是'orig_dir'目錄含有的內容:(譯注:原文為and here are the contents of a directory named ‘olddir’ ,其中'olddir'應為筆誤。)

復制代碼代碼如下:
$ ls orig_dir/
file1 file name with spaces frnd1 frnd.cpp log2.txt log4.txt test
file2 frnd frnd1.cpp log1.txt log3.txt log5.txt

下面是diff命令執行後的輸出:

復制代碼代碼如下:
$ diff new_dir/ orig_dir/
Only in new_dir/: file
Only in orig_dir/: test

你可以看到當diff命令被用來比較這兩個目錄時,很容易就會顯示兩個文件中缺失的文件。

下面是一些在命令行下常用的選項:

1. 用 -i 忽略大小寫

如果兩個文件含有相同的文本但是大小寫不同,diff命令仍會默認報告它不同。

比如:

復制代碼代碼如下:
$ cat file1
HI

$ cat file2
hi

$ diff file1 file2
1c1
< HI
---
> hi

你可以看見diff命令在輸出中報告了大小寫不同。

要去除這個默認行為,使用-i選項。

以下是個例子:

復制代碼代碼如下:
$ diff -i file1 file2

這樣你可以看到沒有生成輸出,這是當兩個文件相同時的默認行為。

2. 用 -s 選項報告兩個文件相同

在例子1的後面,我們看到如果文件相同diff不會生成報告。雖然這個默認行為不錯但是它仍可能會造成很大疑惑,特別對於新手而言。因此,如果你像樣diff命令明確地報告兩個文件不同,那麼就使用-s命令選項。

來舉個例子:

復制代碼代碼如下:
$ diff -is file1 file2
Files file1 and file2 are identical

你可以看到我加了-s選項在後面的例子中,這次diff命令會明確地報告兩個文件是相同的。

3. 使用 -b 忽略空格

另外一個常用的是diff報告文件存在不同數量的空格。

舉例說明:

復制代碼代碼如下:
$ cat file1
Hi, how are you?

$ cat file2
Hi, how are you?

觀察這兩個文件唯一的不同是file2中'are'和'you'之間額外的空格。現在,當使用diff命令比較兩個文件時,輸出如下:

復制代碼代碼如下:
$ diff file1 file2
1c1
< Hi, how are you?
---
> Hi, how are you?

因此你可以看到diff命令報告了不同。但是如果你想要忽略這些空格,使用 -b 選項。

復制代碼代碼如下:
$ diff -b file1 file2

這樣你可以看到由於-b選項,diff命令報告這兩個文件是相同的。

Copyright © Linux教程網 All Rights Reserved