歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> Linux下源碼編譯安裝詳解

Linux下源碼編譯安裝詳解

日期:2017/2/28 13:43:48   编辑:Linux教程

前言

源碼要運行,必須先轉成二進制的機器碼。這是編譯器的任務。

比如,下面這段源碼(假定文件名叫做test.c)。

#include <stdio.h>

int main(void)
{
  fputs("Hello, world!\n", stdout);
  return 0;
}

要先用編譯器處理一下,才能運行。

$ gcc test.c
$ ./a.out
Hello, world!

對於復雜的項目,編譯過程還必須分成三步。

$ ./configure
$ make  
$ make install

編譯過程流程圖:

一.編譯的具體過程

1. 配置(configure)

編譯器在開始工作之前,需要知道當前的系統環境,比如標准庫在哪裡、軟件的安裝位置在哪裡、需要安裝哪些組件等等。這是因為不同計算機的系統環境不一樣,通過指定編譯參數,編譯器就可以靈活適應環境,編譯出各種環境都能運行的機器碼。這個確定編譯參數的步驟,就叫做"配置"(configure)。

這些配置信息保存在一個配置文件之中,約定俗成是一個叫做configure的腳本文件。通常它是由autoconf工具生成的。編譯器通過運行這個腳本,獲知編譯參數。

configure腳本已經盡量考慮到不同系統的差異,並且對各種編譯參數給出了默認值。如果用戶的系統環境比較特別,或者有一些特定的需求,就需要手動向configure腳本提供編譯參數。

$ ./configure --prefix=/www --with-mysql

上面代碼是php源碼的一種編譯配置,用戶指定安裝後的文件保存在www目錄,並且編譯時加入mysql模塊的支持。

2. 確定標准庫和頭文件的位置

源碼肯定會用到標准庫函數(standard library)和頭文件(header)。它們可以存放在系統的任意目錄中,編譯器實際上沒辦法自動檢測它們的位置,只有通過配置文件才能知道。

編譯的第二步,就是從配置文件中知道標准庫和頭文件的位置。一般來說,配置文件會給出一個清單,列出幾個具體的目錄。等到編譯時,編譯器就按順序到這幾個目錄中,尋找目標。

3. 確定依賴關系

對於大型項目來說,源碼文件之間往往存在依賴關系,編譯器需要確定編譯的先後順序。假定A文件依賴於B文件,編譯器應該保證做到下面兩點。

(1)只有在B文件編譯完成後,才開始編譯A文件。

(2)當B文件發生變化時,A文件會被重新編譯。

編譯順序保存在一個叫做makefile的文件中,裡面列出哪個文件先編譯,哪個文件後編譯。而makefile文件由configure腳本運行生成,這就是為什麼編譯時configure必須首先運行的原因。

在確定依賴關系的同時,編譯器也確定了,編譯時會用到哪些頭文件。

4. 頭文件的預編譯(precompilation)

不同的源碼文件,可能引用同一個頭文件(比如stdio.h)。編譯的時候,頭文件也必須一起編譯。為了節省時間,編譯器會在編譯源碼之前,先編譯頭文件。這保證了頭文件只需編譯一次,不必每次用到的時候,都重新編譯了。

不過,並不是頭文件的所有內容,都會被預編譯。用來聲明宏的#define命令,就不會被預編譯。

5. 預處理(Preprocessing)

預編譯完成後,編譯器就開始替換掉源碼中bash的頭文件和宏。以本文開頭的那段源碼為例,它包含頭文件stdio.h,替換後的樣子如下。

extern int fputs(const char *, FILE *);
extern FILE *stdout;

int main(void)
{
    fputs("Hello, world!\n", stdout);
    return 0;
}

為了便於閱讀,上面代碼只截取了頭文件中與源碼相關的那部分,即fputs和FILE的聲明,省略了stdio.h的其他部分(因為它們非常長)。另外,上面代碼的頭文件沒有經過預編譯,而實際上,插入源碼的是預編譯後的結果。編譯器在這一步還會移除注釋。

這一步稱為"預處理"(Preprocessing),因為完成之後,就要開始真正的處理了。

6. 編譯(Compilation)

預處理之後,編譯器就開始生成機器碼。對於某些編譯器來說,還存在一個中間步驟,會先把源碼轉為匯編碼(assembly),然後再把匯編碼轉為機器碼。

下面是本文開頭的那段源碼轉成的匯編碼。

    .file   "test.c"
    .section    .rodata
.LC0:
    .string "Hello, world!\n"
    .text
    .globl  main
    .type   main, @function
main:
.LFB0:
    .cfi_startproc
    pushq   %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    movq    stdout(%rip), %rax
    movq    %rax, %rcx
    movl    $14, %edx
    movl    $1, %esi
    movl    $.LC0, %edi
    call    fwrite
    movl    $0, %eax
    popq    %rbp
    .cfi_def_cfa 7, 8
    ret
    .cfi_endproc
.LFE0:
    .size   main, .-main
    .ident  "GCC: (Debian 4.9.1-19) 4.9.1"
    .section    .note.GNU-stack,"",@progbits

這種轉碼後的文件稱為對象文件(object file)。

注:make (gcc), 其調用 gcc 執行編譯的過程依賴於配置文件makefile

7. 連接(Linking)

對象文件還不能運行,必須進一步轉成��執行文件。如果你仔細看上一步的轉碼結果,會發現其中引用了stdout函數和fwrite函數。也就是說,程序要正常運行,除了上面的代碼以外,還必須有stdout和fwrite這兩個函數的代碼,它們是由C語言的標准庫提供的。

編譯器的下一步工作,就是把外部函數的代碼(通常是後綴名為.lib和.a的文件),添加到可執行文件中。這就叫做連接(linking)。這種通過拷貝,將外部函數庫添加到可執行文件的方式,叫做靜態連接(static linking),後文會提到還有動態連接(dynamic linking)。

make命令的作用,就是從第四步頭文件預編譯開始,一直到做完這一步。

8. 安裝(Installation)

上一步的連接是在內存中進行的,即編譯器在內存中生成了可執行文件。下一步,必須將可執行文件保存到用戶事先指定的安裝目錄。

表面上,這一步很簡單,就是將可執行文件(連帶相關的數據文件)拷貝過去就行了。但是實際上,這一步還必須完成創建目錄、保存文件、設置權限等步驟。這整個的保存過程就稱為"安裝"(Installation)。

9. 操作系統連接

可執行文件安裝後,必須以某種方式通知操作系統,讓其知道可以使用這個程序了。比如,我們安裝了一個文本閱讀程序,往往希望雙擊txt文件,該程序就會自動運行。

這就要求在操作系統中,登記這個程序的元數據:文件名、文件描述、關聯後綴名等等。Linux系統中,這些信息通常保存在/usr/share/applications目錄下的.desktop文件中。另外,在Windows操作系統中,還需要在Start啟動菜單中,建立一個快捷方式。

這些事情就叫做"操作系統連接"。make install命令,就用來完成"安裝"和"操作系統連接"這兩步。

10. 生成安裝包

寫到這裡,源碼編譯的整個過程就基本完成了。但是只有很少一部分用戶,願意耐著性子,從頭到尾做一遍這個過程。事實上,如果你只有源碼可以交給用戶,他們會認定你是一個不友好的家伙。大部分用戶要的是一個二進制的可執行程序,立刻就能運行。這就要求開發者,將上一步生成的可執行文件,做成可以分發的安裝包。

所以,編譯器還必須有生成安裝包的功能。通常是將可執行文件(連帶相關的數據文件),以某種目錄結構,保存成壓縮文件包,交給用戶。

11. 動態連接(Dynamic linking)

正常情況下,到這一步,程序已經可以運行了。至於運行期間(runtime)發生的事情,與編譯器一概無關。但是,開發者可以在編譯階段選擇可執行文件連接外部函數庫的方式,到底是靜態連接(編譯時連接),還是動態連接(運行時連接)。所以,最後還要提一下,什麼叫做動態連接。

前面已經說過,靜態連接就是把外部函數庫,拷貝到可執行文件中。這樣做的好處是,適用范圍比較廣,不用擔心用戶機器缺少某個庫文件;缺點是安裝包會比較大,而且多個應用程序之間,無法共享庫文件。動態連接的做法正好相反,外部函數庫不進入安裝包,只在運行時動態引用。好處是安裝包會比較小,多個應用程序可以共享庫文件;缺點是用戶必須事先安裝好庫文件,而且版本和安裝位置都必須符合要求,否則就不能正常運行。

現實中,大部分軟件采用動態連接,共享庫文件。這種動態共享的庫文件,Linux平台是後綴名為.so的文件,Windows平台是.dll文件,Mac平台是.dylib文件。

二、Linux編譯安裝的具體實現

1.編譯安裝源程序的前提:

1).提供開發環境:開發工具和開發庫

2).編譯安裝需要的包組:

Development Tools、Server Platform Development、Desktop Platform Development、Debug Tools

2.configure腳本常用的選項:

--help獲取./configure腳本幫助
--prefix=: 指定安裝路徑;多數程序都有默認安裝路徑;
--sysconfidr=: 指定配置文件安裝路徑;
--with-PACKAGE[=ARG]:在自由軟件社區裡,有使用已有軟件包和庫的優秀傳統.當用'configure'來配置一個源碼樹時,
可以提供其他已經安裝的軟件包的信息
--without-PACKAGE:有時候你可能不想讓你的軟件包與系統已有的軟件包交互。例如,你可能不想讓你的新編譯器使用
GNU ld
--enable-FEATURE:一些軟件包可能提供了一些默認被禁止的特性,可以使用'--enable-FEATURE'來起用它
--disable-EEATURE:關閉指定的默認特性

3.編譯安裝源程序方法:

1)、展開源代碼,找INSTALL、README;不存在此類文件時,找項目官方文檔;

2)、根據安裝說明執行安裝操作;

3.程序安裝於專用目錄時,安裝後的配置:

1)、導出二進制程序所在路徑至PATH環境中

# export PATH=/usr/local/nginx/sbin:$PATH

實現永久有效的辦法:
                /etc/profile.d/*.sh

2)、導出庫文件給OS

OS查找庫文件方法:根據/etc/ld.so.conf配置文件指定的路徑搜索,或搜索/lib, /lib64, /usr/lib, /usr/lib64,把查找到的所有的庫文件路徑和其名稱映射關系保存為一個緩存文件/etc/ld.so.cache

/etc/ld.so.conf配置文件有其它組成部分:/etc/ld.so.conf.d/*.conf

假設nginx安裝於/usr/local/nginx,此目錄中有其庫文件子目錄lib,導出此目錄中庫文件:

(1)新建文件/etc/ld.so.conf.d/nginx.conf,在文件添加如下行:

/usr/local/nginx/lib

(2) 運行命令:ldconfig

ldconfig的主要用途:

默認搜尋/lilb和/usr/lib,以及配置文件/etc/ld.so.conf內所列的目錄下的庫文件。

搜索出可共享的動態鏈接庫,庫文件的格式為:lib***.so.**,進而創建出動態裝入程序(ld.so)所需的連接和緩存文件。

緩存文件默認為/etc/ld.so.cache,該文件保存已排好序的動態鏈接庫名字列表。

ldconfig通常在系統啟動時運行,而當用戶安裝了一個新的動態鏈接庫時,就需要手工運行這個命令。

常用選項:

-v: 用此選項時,ldconfig將顯示正在掃描的目錄及搜索到的動態鏈接庫,還有它所創建的連接的名字.
-p: 顯示當前OS已經加載到的所有庫文件名稱及其文件所在路徑的映射關系;

ldconfig需要注意的地方:

(a)、往/lib和/usr/lib裡面加東西,是不用修改/etc/ld.so.conf文件的,但是添加完後需要調用下ldconfig,不然添加的library會找不到。

(b)、如果添加的library不在/lib和/usr/lib裡面的話,就一定要修改/etc/ld.so.conf文件,往該文件追加library所在的路徑,然後也需要重新調用下ldconfig命令。比如在安裝mysql的時候,其庫文件/usr/local/mysql/lib,就需要追加到/etc/ld.so.conf文件中。命令如下:

# echo "/usr/local/mysql/lib" >> /etc/ld.so.conf

# ldconfig -v | grep mysql

(c)、如果添加的library不在/lib或/usr/lib下,但是卻沒有權限操作寫/etc/ld.so.conf文件的話,這時就需要往export裡寫一個全局變量LD_LIBRARY_PATH,就可以了。

(3)、幫助文件導出

man命令搜索特定路徑查找手冊頁文件,這些路徑是定義在/etc/man.config中的MANPATH參數所指定的路徑下的;

新增辦法:編輯/etc/man.config文件,新增一個MANPATH參數,其值為新安裝程序的man手冊所在的目錄;

            /usr/local/nginx/share/man/{man1,man8}

            man -M /path/to/man KEYWORD

(4)、頭文件導出

有些程序安裝後會生成對自己擁有庫文件調用接口相關頭文件系統查找頭文件的路徑為/usr/include

導出獨立安裝應用程序的頭文件方法:創建鏈接至/usr/include下即可;

例如:

/usr/local/nginx/include
# ln -sv /usr/local/nginx/include/* /usr/include/
# ln -sv /usr/local/nginx/include /usr/include/nginx

perl源程序的編譯安裝方法:

    (1) perl Makefile.in
    (2) make
    (3) make install
Copyright © Linux教程網 All Rights Reserved