您现在的位置： Linux教程網 >> UnixLinux > >> Linux綜合 >> Linux內核

Linux內核分析方法談(1)

　　Linux的最大的好處之一就是它的源碼公開。同時，公開的核心源碼也吸引著無數的電腦愛好者和程序員；他們把解讀和分析Linux的核心源碼作為自己的最大興趣，把修改Linux源碼和改造Linux系統作為自己對計算機技術追求的最大目標。

　　Linux內核源碼是很具吸引力的，特別是當你弄懂了一個分析了好久都沒搞懂的問題；或者是被你修改過了的內核，順利通過編譯，一切運行正常的時候。那種成就感真是油然而生！而且，對內核的分析，除了出自對技術的狂熱追求之外，這種令人生畏的勞動所帶來的回報也是非常令人著迷的，這也正是它擁有眾多追隨者的主要原因：

　　首先，你可以從中學到很多的計算機的底層知識，如後面將講到的系統的引導和硬件提供的中斷機制等；其它，象虛擬存儲的實現機制，多任務機制，系統保護機制等等，這些都是非都源碼不能體會的。

　　同時，你還將從操作系統的整體結構中，體會整體設計在軟件設計中的份量和作用，以及一些宏觀設計的方法和技巧：Linux的內核為上層應用提供一個與具體硬件不相關的平台；同時在內核內部，它又把代碼分為與體系結構和硬件相關的部分，和可移植的部分；再例如，Linux雖然不是微內核的，但他把大部分的設備驅動處理成相對獨立的內核模塊，這樣減小了內核運行的開銷，增強了內核代碼的模塊獨立性。

　　而且你還能從對內核源碼的分析中，體會到它在解決某個具體細節問題時，方法的巧妙：如後面將分析到了的Linux通過Botoom_half機制來加快系統對中斷的處理。

　　最重要的是：在源碼的分析過程中，你將會被一點一點地、潛移默化地專業化。一個專業的程序員，總是把代碼的清晰性，兼容性，可移植性放在很重要的位置。他們總是通過定義大量的宏，來增強代碼的清晰度和可讀性，而又不增加編譯後的代碼長度和代碼的運行效率；他們總是在編碼的同時，就考慮到了以後的代碼維護和升級。甚至，只要分析百分之一的代碼後，你就會深刻地體會到，什麼樣的代碼才是一個專業的程序員寫的，什麼樣的代碼是一個業余愛好者寫的。而這一點是任何沒有真正分析過標准代碼的人都無法體會到的。

　　然而，由於內核代碼的冗長，和內核體系結構的龐雜，所以分析內核也是一個很艱難，很需要毅力的事；在缺乏指導和交流的情況下，尤其如此。只有方法正確，才能事半功倍。正是基於這種考慮，作者希望通過此文能給大家一些借鑒和啟迪。

　　由於本人所進行的分析都是基於2.2.5版本的內核；所以，如果沒有特別說明，以下分析都是基於i386單處理器的2.2.5版本的Linux內核。所有源文件均是相對於目錄/usr/src/linux的。

　　方法之一：從何入手

　　要分析Linux內核源碼，首先必須找到各個模塊的位置，也即要弄懂源碼的文件組織形式。雖然對於有經驗的高手而言，這個不是很難；但對於很多初級的Linux愛好者，和那些對源碼分析很有興趣但接觸不多的人來說，這還是很有必要的。

　　1、Linux核心源程序通常都安裝在/usr/src/linux下，而且它有一個非常簡單的編號約定：任何偶數的核心（的二個數為偶數，例如2.0.30）都是一個穩定地發行的核心，而任何奇數的核心（例如2.1.42）都是一個開發中的核心。

　　2、核心源程序的文件按樹形結構進行組織，在源程序樹的最上層，即目錄/usr/src/linux下有這樣一些目錄和文件：

　　◆ COPYING: GPL版權申明。對具有GPL版權的源代碼改動而形成的程序，或使用GPL工具產生的程序，具有使用GPL發表的義務，如公開源代碼；

　　◆ CREDITS: 光榮榜。對Linux做出過很大貢獻的一些人的信息；

　　◆ MAINTAINERS: 維護人員列表，對當前版本的內核各部分都有誰負責；

　　◆ Makefile: 第一個Makefile文件。用來組織內核的各模塊，記錄了個模塊間的相互這間的聯系和依托關系，編譯時使用；仔細閱讀各子目錄下的Makefile文件對弄清各個文件這間的聯系和依托關系很有幫助；

　　◆ ReadMe: 核心及其編譯配置方法簡單介紹；

　　◆ Rules.make: 各種Makefilemake所使用的一些共同規則；

　　◆ REPORTING-BUGS:有關報告Bug 的一些內容；

　　● Arch/ ：arch子目錄包括了所有和體系結構相關的核心代碼。它的每一個子目錄都代表一種支持的體系結構，例如i386就是關於intel cpu及與之相兼容體系結構的子目錄。PC機一般都基於此目錄；

　　● Include/: include子目錄包括編譯核心所需要的大部分頭文件。與平台無關的頭文件在 include/linux子目錄下，與 intel cpu相關的頭文件在include/asm-i386子目錄下,而include/scsi目錄則是有關scsi設備的頭文件目錄；

　　● Init/：這個目錄包含核心的初始化代碼(注：不是系統的引導代碼)，包含兩個文件main.c和Version.c，這是研究核心如何工作的好的起點之一。

　　● Mm/：這個目錄包括所有獨立於 cpu 體系結構的內存管理代碼，如頁式存儲管理內存的分配和釋放等；而和體系結構相關的內存管理代碼則位於arch/*/mm/，例如arch/i386/mm/Fault.c；

　　● Kernel/：主要的核心代碼，此目錄下的文件實現了大多數linux系統的內核函數，其中最重要的文件當屬sched.c；同樣，和體系結構相關的代碼在arch/*/kernel中；

　　● Drivers/：放置系統所有的設備驅動程序；每種驅動程序又各占用一個子目錄：如，/block 下為塊設備驅動程序，比如ide（ide.c）。如果你希望查看所有可能包含文件系統的設備是如何初始化的，你可以看drivers/block/genhd.c中的device_setup()。它不僅初始化硬盤，也初始化網絡，因為安裝nfs文件系統的時候需要網絡；

　　● Documentation/: 文檔目錄,沒有內核代碼，只是一套有用的文檔，可惜都是English的，看看應該有用的哦；

　　● Fs/: 所有的文件系統代碼和各種類型的文件操作代碼，它的每一個子目錄支持一個文件系統, 例如fat和ext2；

　　● Ipc/: 這個目錄包含核心的進程間通訊的代碼；

　　● Lib/: 放置核心的庫代碼；

　　● Net/: 核心與網絡相關的代碼；

　　● Modules/: 模塊文件目錄，是個空目錄，用於存放編譯時產生的模塊目標文件；

　　● Scripts/: 描述文件，腳本，用於對核心的配置；

　　一般，在每個子目錄下，都有一個 Makefile 和一個Readme 文件，仔細閱讀這兩個文件，對內核源碼的理解很有用。

　　對Linux內核源碼的分析，有幾個很好的入口點：一個就是系統的引導和初始化，即從機器加電到系統核心的運行；另外一個就是系統調用，系統調用是用戶程序或操作調用核心所提供的功能的接口。對於那些對硬件比較熟悉的愛好者，從系統的引導入手進行分析，可能來的容易一些；而從系統調用下口，則可能更合適於那些在dos或Uinx、Linux下有過C編程經驗的高手。這兩點，在後面還將介紹到。

　　方法之二：以程序流程為線索，一線串珠

　　從表面上看，Linux的源碼就象一團扎亂無章的亂麻，其實它是一個組織得有條有理的蛛網。要把整個結構分析清楚，除了找出線頭，還得理順各個部分之間的關系，有條不紊的一點一點的分析。

　　所謂以程序流程為線索、一線串珠，就是指根據程序的執行流程，把程序執行過程所涉及到的代碼分析清楚。這種方法最典型的應用有兩個：一是系統的初始化過程；二是應用程序的執行流程：從程序的裝載，到運行，一直到程序的退出。

　　為了簡便起見，遵從循序漸進的原理，現就系統的初始化過程來具體的介紹這種方法。系統的初始化流程包括：系統引導，實模式下的初始化，保護模式下的初始化共三個部分。下面將一一介紹。

　　Linux系統的常見引導方式有兩種：Lilo引導和Loadin引導；同時linux內核也自帶了一個bootsect-loader。由於它只能實現linux的引導，不像前兩個那樣具有很大的靈活性（lilo可實現多重引導、loadin可在dos下引導linux）,所以在普通應用場合實際上很少使用bootsect-loader。當然，bootsect-loader也具有它自己的優點：短小沒有多余的代碼、附帶在內核源碼中、是內核源碼的有機組成部分，等等。

　　bootsect-loader在內和源碼中對應的程序是 /Arch/i386/boot/bootsect.S 。下面將主要是針對此文件進行的分析。

　　幾個相關文件：

　　<1> /Arch/i386/boot/bootsect.S

　　<2> /include/linux/config.h

　　<3> /include/asm/boot.h

　　<4> /include/linux/autoconf.h

　　引導過程分析：

　　對於Intel x86 PC , 開啟電源後, 機器就會開始執行ROM BIOS的一系列系統測試動作，包括檢查RAM，keyboard，顯示器，軟硬磁盤等等。執行完bios的系統測試之後，緊接著控制權會轉移給ROM中的啟動程序(ROM bootstrap routine)；這個程序會將磁盤上的第0軌第0扇區（叫boot sector或MBR ，系統的引導程序就放在此處）讀入內存中，並放到自0x07C0:0x0000開始的512個字節處；然後處理機將跳到此處開始執行這一引導程序；也即裝入MBR中的引導程序後， CS:IP = 0x07C0:0x0000 。加電後處理機運行在與8086相兼容的實模式下。

　　如果要用bootsect-loader進行系統引導，則必須把bootsect.S編譯連接後對應的二進制代碼置於MBR；當ROM BIOS 把bootsect.S編譯連接後對應的二進制代碼裝入內存後，機器的控制權就完全轉交給bootsect；也就是說，bootsect將是第一個被讀入內存中並執行的程序。

　　Bootsect接管機器控制權後，將依次進行以下一些動作：

　　1．首先，bootsect將它"自己"(自位置0x07C0:0x0000開始的512個字節)從被ROM BIOS載入的地址0x07C0:0x0000處搬到0x9000:0000處; 這一任務由bootsect.S的前十條指令完成；第十一條指令“jmpi go,INITSEG”則把機器跳轉到“新”的bootsect的“jmpi go,INITSEG”後的那條指令“go: mov di,#0x4000-12”；之後，繼續執行bootsect的剩下的代碼；在bootsect.S中定義了幾個常量：

　　BOOTSEG = 0x07C0 bios 載入 MBR的約定位置的段址；

　　INITSEG = 0x9000 bootsect.S的前十條指令將自己搬到此處(段址)

　　SETUPSEG =0x9020 裝入Setup.S的段址

　　SYSSEG =0x1000 系統區段址

　　對於這些常量可參見/include/asm/boot.h中的定義；這些常量在下面的分析中將會經常用到；

　　2．以0x9000:0x4000-12為棧底，建立自己的棧區；其中0x9000:0x4000-12到0x9000:0x4000的一十二個字節預留作磁盤參數表區；

　　3．在0x9000:0x4000-12到0x9000:0x4000的一十二個預留字節中建立新的磁盤參數表，之所以叫“新”的磁盤參數表，是相對於bios建立的磁盤參數表而言的。由於設計者考慮到有些老的bios不能准確地識別磁盤“每個磁道的扇區數”，從而導致bios建立的磁盤參數表妨礙磁盤的最高性能發揮，所以，設計者就在bios建立的磁盤參數表的基礎上通過枚舉法測試，試圖建立准確的“新”的磁盤參數表(這是在後繼步驟中完成的)；並把參數表的位置由原來的0x0000:0x0078搬到0x9000:0x4000-12；且修改老的磁盤參數表區使之指向新的磁盤參數表；

　　4．接下來就到了load_setup子過程；它調用0x13中斷的第2號服務；把第0道第2扇區開始的連續的setup_sects (為常量4)個扇區讀到緊鄰bootsect的內存區；，即0x9000:0x0200開始的2048個字節；而這四個扇區的內容即是/arch/i386/boot/setup.S編譯連接後對應的二進制代碼；也就是說，如果要用bootsect-loader進行系統引導，不僅必須把bootsect.S編譯連接後對應的二進制代碼置於MBR，而且還得把setup.S編譯連接後對應的二進制代碼置於緊跟MBR後的連續的四個扇區中；當然，由於setup.S對應的可執行碼是由bootsect裝載的，所以，在我們的這個項目中可以通過修改bootsect來根據需要隨意地放置setup.S對應的可執行碼；

　　5．load_setup子過程的唯一出口是probe_loop子過程；該過程通過枚舉法測試磁盤“每個磁道的扇區數”;

　　6.接下來幾個子過程比較清晰易懂:打印我們熟悉的“Loading”；讀入系統到0x1000:0x0000; 關掉軟驅馬達；根據的5步測出的“每個磁道的扇區數”確定磁盤類型；最後跳轉到0x9000:0x0200,即setup.S對應的可執行碼的入口，將機器控制權轉交setup.S;整個bootsect代碼運行完畢；

　　引導過程執行完後的內存印象圖：

　　出於簡便考慮，在此分析中，我忽略了對大內核的處理的分析，因為對大內核的處理，只是此引導過程中的一個很小的部分，並不影響對整體的把握。完成了系統的引導後，系統將進入到初始化處理階段。系統的初始化分為實模式和保護模式兩部分。

上一篇文章： Linux內核模塊和驅動的編寫
下一篇文章： Linux內核分析方法談(2)

Linux內核