您现在的位置： Linux教程網 >> UnixLinux > >> Unix知識 >> 關於Unix

Linux下的管道編程技術

管道技術是Linux的一種基本的進程間通信技術。在本文中，我們將為讀者介紹管道技術的模型，匿名管道和命名管道技術的定義和區別，以及這兩種管道的創建方法。同時，闡述如何在應用程序和命令行中通過管道進行通信的詳細方法。

　　一、管道技術模型

　　管道技術是Linux操作系統中歷來已久的一種進程間通信機制。所有的管道技術，無論是半雙工的匿名管道，還是命名管道，它們都是利用FIFO排隊模型來指揮進程間的通信。對於管道，我們可以形象地把它們當作是連接兩個實體的一個單向連接器。例如，請看下面的命令：

ls -1 | wc -l

　　該命令首先創建兩個進程，一個對應於ls –1，另一個對應於wc –l。然後，把第一個進程的標准輸出設為第二個進程的標准輸入(如圖1所示)。它的作用是計算當前目錄下的文件數量。

　　圖1：管道示意圖

　　如上圖所示，前面的例子實際上就是在兩個命令之間建立了一根管道(有時我們也將之稱為命令的流水線操作)。第一個命令ls執行後產生的輸出作為了第二個命令wc的輸入。這是一個半雙工通信，因為通信是單向的。兩個命令之間的連接的具體工作，是由內核來完成的。下面我們將會看到，除了命令之外，應用程序也可以使用管道進行連接。

　　二、信號和消息的區別

　　我們知道，進程間的信號通信機制在傳遞信息時是以信號為載體的，但管道通信機制的信息載體是消息。那麼信號和消息之間的區別在哪裡呢?

　　首先，在數據內容方面，信號只是一些預定義的代碼，用於表示系統發生的某一狀況;消息則為一組連續語句或符號，不過量也不會太大。在作用方面，信號擔任進程間少量信息的傳送，一般為內核程序用來通知用戶進程一些異常情況的發生;消息則用於進程間交換彼此的數據。

　　在發送時機方面，信號可以在任何時候發送;信息則不可以在任何時刻發送。在發送者方面，信號不能確定發送者是誰;信息則知道發送者是誰。在發送對象方面，信號是發給某個進程;消息則是發給消息隊列。在處理方式上，信號可以不予理會;消息則是必須處理的。在數據傳輸效率方面，信號不適合進大量的信息傳輸，因為它的效率不高;消息雖然不適合大量的數據傳送，但它的效率比信號強，因此適於中等數量的數據傳送。

　　三、管道和命名管道的區別

　　我們知道，命名管道和管道都可以在進程間傳送消息，但它們也是有區別的。

　　管道技術只能用於連接具有共同祖先的進程，例如父子進程間的通信，它無法實現不同用戶的進程間的信息共享。再者，管道不能常設，當訪問管道的進程終止時，管道也就撤銷。這些限制給它的使用帶來不少限制，但是命名管道卻克服了這些限制。

　　命名管道也稱為FIFO，是一種永久性的機構。FIFO文件也具有文件名、文件長度、訪問許可權等屬性，它也能像其它Linux文件那樣被打開、關閉和刪除，所以任何進程都能找到它。換句話說，即使是不同祖先的進程，也可以利用命名管道進行通信。

　　如果想要全雙工通信，那最好使用Sockets API。下面我們分別介紹這兩種管道，然後詳細說明用來進行管道編程的編程接口和系統級命令。

　　四、管道編程技術

　　在程序中利用管道進行通信時，根據通信主體大體可以分為兩種情況：一種是具有共同祖先的進程間的通信，比較簡單;另一種是任意進程間通信，相對較為復雜。下面我們先從較為簡單的進程內通信開始介紹。

　　1. 具有共同祖先的進程間通信管道編程

　　為了了解管道編程技術，我們先舉一個例子。在這個例中，我們將在進程中新建一個管道，然後向它寫入一個消息，管道讀取消息後將其發出。代碼如下所示：

　　示例代碼1：管道程序示例

1: #include

2: #include

3: #include

5: #define MAX_LINE 80

6: #define PIPE_STDIN 0

7: #define PIPE_STDOUT 1

9: int main()

10: ...{

11: const char *string=...{A sample message.}; 12: int ret, myPipe[2]; 13: char buffer[MAX_LINE+1]; 14: 15: /**//* 建立管道 */ 16: ret = pipe( myPipe ); 17: 18: if (ret == 0) ...{ 19: 20: /**//* 將 11: const char *string=...{"A sample message."};

12: int ret, myPipe[2];

13: char buffer[MAX_LINE+1];

14:

15: /**//* 建立管道 */

16: ret = pipe( myPipe );

17:

18: if (ret == 0) ...{

19:

20: /**//* 將消息寫入管道 */

21: write( myPipe[PIPE_STDOUT], string, strlen(string) );

22:

23: /**//* 從管道讀取消息 */

24: ret = read( myPipe[PIPE_STDIN], buffer, MAX_LINE );

25:

26: /**//* 利用Null結束字符串 */

27: buffer[ ret ] = 0;

28:

29: printf("%s\n", buffer);

30:

31: }

32:

33: return 0;

34: }

　　上面的示例代碼中，我們利用pipe調用新建了一個管道，參見第16行代碼。我們還建立了一個由兩個元素組成的數組，用來描述我們的管道。我們的管道被定義為兩個單獨的文件描述符，一個用來輸入，一個用來輸出。我們能從管道的一端輸入，然後從另一端讀出。如果調用成功，pipe函數返回值為0。返回後，數組myPipe中存放的是兩個新的文件描述符，其中元素myPipe[1]包含的文件描述符用於管道的輸入，元素myPipe[0] 包含的文件描述符用於管道的輸出。

　　在第21行代碼，我們利用write函數把消息寫入管道。站在應用程序的角度，它是在向stdout輸出。現在，該管道存有我們的消息，我們可以利用第 24行的read函數來讀它。對於應用程序來說，我們是利用stdin描述符從管道讀取消息的。read函數把從管道讀取的數據存放到buffer變量中。然後在buffer變量的末尾添加一個NULL，這樣就能利用printf函數正確的輸出它了。在本例中的管道可以利用下圖解釋：

圖2：示例代碼1中半雙工管道的示意圖這個例子中，通信是在具有共同祖先的進程間發生的，即父進程和子進程通信。這樣做局限性太大，但我們只是用它

　　圖2：示例代碼1中半雙工管道的示意圖

　　這個例子中，通信是在具有共同祖先的進程間發生的，即父進程和子進程通信。這樣做局限性太大，但我們只是用它來給讀者一個感性的認識。接下來，我們將介紹更為高級的進程間的管道通信。

　　2.進程間通信管道編程

　　在利用管道技術進行編程時，處理要用到上面介紹的pipe函數外，還用到另外三個函數，如下所示。

　　 pipe函數：該函數用於創建一個新的匿名管道。

　　 dup函數：該函數用於拷貝文件描述符。

　　 mkfifo函數：該函數用於創建一個命名管道(fifo)。

　　當然，在管道通信過程中還用到其它函數，到時我們會加以介紹。需要注意的是，說到底，管道無非就是一對文件描述符，因此任何能夠操作文件操作符的函數都可以使用管道。這包括但不限於這些函數：select、read、write、 fcntl、freopen，等等。

　　2.1函數pipe

　　函數pipe用來建立一個新的管道，該管道用兩個文件描述符進行描述。函數pipe的原型如下所示：

#include

int pipe( int fds[2] );

　　當調用成功時，函數pipe返回值為0，否則返回值為-1。成功返回時，數組fds被填入兩個有效的文件描述符。數組的第一個元素中的文件描述符供應用程序讀取之用，數組的第二個元素中的文件描述符可以用來供應用程序寫入。

　　下面我們考察在一個包含多個進程的應用程序中的管道示例。在該程序中(見示例代碼2)，第14行用於創建一個管道，然後進程在第16行分叉，變成一個父進程和一個子進程。在子進程中，我們嘗試從(在第18行建立的)管道的輸入描述符讀取，這時該進程將被掛起，直到管道中有可以讀取的內容為止。

　　讀完後，我們用NULL作為讀取的內容的結束符，這樣的話，讀的這些內容就能使用printf函數正確打印輸出了。父進程先是利用存放在thePipe[1]中的“寫文件標識符”向管道寫入測試字符串，然後就使用wait函數來等待子進程退出。

　　在我們的這個程序中需要加以注意的是，我們的子進程是如何繼承父進程利用pipe函數建立的文件描述符的，以及如何利用該文件描述符進行通信的。函數 fork一旦執行，子進程會繼承父進程的功能和管道的文件描述符，但對於內核來說，父進程和子進程是平等的，它們是獨立運行的。也就是說，兩個進程分別具有單獨的內存空間，它們正是通過pipe函數來互通有無的。

示例代碼2：演示兩個進程間的管道模型的代碼

1: #include

2: #include

3: #include

4: #include

6: #define MAX_LINE 80

8: int main()

9: ...{

10: int thePipe[2], ret;

11: char buf[MAX_LINE+1];

12: const char *testbuf=...{"a test string."};

13:

14: if ( pipe( thePipe ) == 0 ) ...{ 15: 16: if (fork() == 0) ...{ 17: 18: ret = read( thePipe[0], buf, MAX_LINE ); 19: buf[ret] = 0; 20: printf( Child read %s\n, buf ); 21: 22: } else ...{ 23: 24: re

14: if ( pipe( thePipe ) == 0 ) ...{

15:

16: if (fork() == 0) ...{

17:

18: ret = read( thePipe[0], buf, MAX_LINE );

19: buf[ret] = 0;

20: printf( "Child read %s\n", buf );

21:

22: } else ...{

23:

24: ret = write( thePipe[1], testbuf, strlen(testbuf) );

25: ret = wait( NULL );

26:

27: }

28:

29: }

30:

31: return 0;

32: }

　　需要注意的是，在這個示例程序中我們沒有說明如何關閉管道，因為一旦進程結束，與管道有關的資源將被自動釋放。盡管如此，為了養成一種良好的編程習慣，最好利用close調用來關閉管道的描述符，如下所示：

ret = pipe( myPipe );

...

close( myPipe[0] );

close( myPipe[1] );

　　如果管道的寫入端關閉，但是還有進程嘗試從管道讀取的話，將被返回0，用來指出管道已不可用，並且應當關閉它。如果管道的讀出端關閉，但是還有進程嘗試向管道寫入的話，試圖寫入的進程將收到一個SIGPIPE信號，至於信號的具體處理則要視其信號處理程序而定了。

　　2.2 dup函數和dup2函數

　　dup和dup2也是兩個非常有用的調用，它們的作用都是用來復制一個文件的描述符。它們經常用來重定向進程的stdin、stdout和stderr。這兩個函數的原型如下所示：

#include

int dup( int oldfd );

int dup2( int oldfd, int targetfd ) 利用函數dup，我們可以復制一個描述符。傳給該函數一個既有的描述符，它就會返回一個新的描述符，這個新的描述符是傳給它

int dup2( int oldfd, int targetfd )

　　利用函數dup，我們可以復制一個描述符。傳給該函數一個既有的描述符，它就會返回一個新的描述符，這個新的描述符是傳給它的描述符的拷貝。這意味著，這兩個描述符共享同一個數據結構。例如，如果我們對一個文件描述符執行lseek操作，得到的第一個文件的位置和第二個是一樣的。下面是用來說明dup函數使用方法的代碼片段：

int fd1, fd2;

...

fd2 = dup( fd1 );

　　需要注意的是，我們可以在調用fork之前建立一個描述符，這與調用dup建立描述符的效果是一樣的，子進程也同樣會收到一個復制出來的描述符。

　　dup2函數跟dup函數相似，但dup2函數允許調用者規定一個有效描述符和目標描述符的id。dup2函數成功返回時，目標描述符(dup2函數的第二個參數)將變成源描述符(dup2函數的第一個參數)的復制品，換句話說，兩個文件描述符現在都指向同一個文件，並且是函數第一個參數指向的文件。下面我們用一段代碼加以說明：

int oldfd;

oldfd = open("app_log", (O_RDWR | O_CREATE), 0644 );

dup2( oldfd, 1 );

close( oldfd );

　　本例中，我們打開了一個新文件，稱為“app_log”，並收到一個文件描述符，該描述符叫做fd1。我們調用dup2函數，參數為oldfd和1，這會導致用我們新打開的文件描述符替換掉由1代表的文件描述符(即stdout，因為標准輸出文件的id為1)。任何寫到stdout的東西，現在都將改為寫入名為“app_log”的文件中。需要注意的是，dup2函數在復制了oldfd之後，會立即將其關閉，但不會關掉新近打開的文件描述符，因為文件描述符1現在也指向它。

　　下面我們介紹一個更加深入的示例代碼。回憶一下本文前面講的命令行管道，在那裡，我們將ls –1命令的標准輸出作為標准輸入連接到wc –l命令。接下來，我們就用一個C程序來加以說明這個過程的實現。代碼如下面的示例代碼3所示。

　　在示例代碼3中，首先在第9行代碼中建立一個管道，然後將應用程序分成兩個進程：一個子進程(第13–16行)和一個父進程(第20–23行)。接下來，在子進程中首先關閉stdout描述符(第13行)，然後提供了ls –1命令功能，不過它不是寫到stdout(第13行)，而是寫到我們建立的管道的輸入端，這是通過dup函數來完成重定向的。在第14行，使用dup2 函數把stdout重定向到管道(pfds[1])。之後，馬上關掉管道的輸入端。然後，使用execlp函數把子進程的映像替換為命令ls –1的進程映像，一旦該命令執行，它的任何輸出都將發給管道的輸入端。

　　現在來研究一下管道的接收端。從代碼中可以看出，管道的接收端是由父進程來擔當的。首先關閉stdin描述符(第20行)，因為我們不會從機器的鍵盤等標准設備文件來接收數據的輸入，而是從其它程序的輸出中接收數據。然後，再一次用到dup2函數(第21行)，讓stdin變成管道的輸出端，這是通過讓文件描述符0(即常規的stdin)等於pfds[0]來實現的。關閉管道的stdout端(pfds[1])，因為在這裡用不到它。最後，使用 execlp函數把父進程的映像替換為命令wc -1的進程映像，命令wc -1把管道的內容作為它的輸入(第23行)。

示例代碼3：利用C實現命令的流水線操作的代碼

1: #include

2: #include

3: #include

5: int main()

6: ...{ 7: int pfds[2]; 8: 9: if ( pipe(pfds) == 0 ) ...{ 10: 11: if ( fork() == 0 ) ...{ 12: 13: close(1); 14: dup2( pfds[1], 1 ); 15: close( pfds[0] ); 16: execlp( ls, ls, -1, NULL ); 17: 18: } else

6: ...{

7: int pfds[2];

9: if ( pipe(pfds) == 0 ) ...{

10:

11: if ( fork() == 0 ) ...{

12:

13: close(1);

14: dup2( pfds[1], 1 );

15: close( pfds[0] );

16: execlp( "ls", "ls", "-1", NULL );

17:

18: } else ...{

19:

20: close(0);

21: dup2( pfds[0], 0 );

22: close( pfds[1] );

23: execlp( "wc", "wc", "-l", NULL );

24:

25: }

26:

27: }

28:

29: return 0;

30: }

　　在該程序中，需要格外關注的是，我們的子進程把它的輸出重定向的管道的輸入，然後，父進程將它的輸入重定向到管道的輸出。這在實際的應用程序開發中是非常有用的一種技術。

　　2.3 mkfifo函數

　　mkfifo函數的作用是在文件系統中創建一個文件，該文件用於提供FIFO功能，即命名管道。前邊講的那些管道都沒有名字，因此它們被稱為匿名管道，或簡稱管道。對文件系統來說，匿名管道是不可見的，它的作用僅限於在父進程和子進程兩個進程間進行通信。而命名管道是一個可見的文件，因此，它可以用於任何兩個進程之間的通信，不管這兩個進程是不是父子進程，也不管這兩個進程之間有沒有關系。Mkfifo函數的原型如下所示：

#include #include int mkfifo( const char *pathname, mode_t mode ); mkfifo函數需要兩個參數，第一個參數(pathname)是將要在文件系統中創建的一個專用文件。第二個參數(mo

#include

int mkfifo( const char *pathname, mode_t mode );

　　mkfifo函數需要兩個參數，第一個參數(pathname)是將要在文件系統中創建的一個專用文件。第二個參數(mode)用來規定FIFO的讀寫權限。Mkfifo函數如果調用成功的話，返回值為0;如果調用失敗返回值為-1。下面我們以一個實例來說明如何使用mkfifo函數建一個fifo，具體代碼如下所示：

int ret;

...

ret = mkfifo( "/tmp/cmd_pipe", S_IFIFO | 0666 );

if (ret == 0) ...{

// 成功建立命名管道

} else ...{

// 創建命名管道失敗

}

　　在這個例子中，利用/tmp目錄中的cmd_pipe文件建立了一個命名管道(即fifo)。之後，就可以打開這個文件進行讀寫操作，並以此進行通信了。命名管道一旦打開，就可以利用典型的輸入輸出函數從中讀取內容。舉例來說，下面的代碼段向我們展示了如何通過fgets函數來從管道中讀取內容：

pfp = fopen( "/tmp/cmd_pipe", "r" );

...

ret = fgets( buffer, MAX_LINE, pfp );