歡迎來到Linux教程網
Linux教程網
Linux教程網
Linux教程網
Linux教程網 >> Linux基礎 >> Linux教程 >> 從運行原理及使用場景看Apache和Nginx

從運行原理及使用場景看Apache和Nginx

日期:2017/2/27 15:57:19   编辑:Linux教程
Web服務器
Web服務器也稱為WWW(WORLD WIDE WEB)服務器,主要功能是提供網上信息浏覽服務。
  • 應用層使用HTTP協議。
  • HTML文檔格式。
  • 浏覽器統一資源定位器(URL)。
Web服務器常常以B/S(Browser/Server)方式提供服務。浏覽器和服務器的交互方式如下:
                 GET /index.php HTTP/1.1

 +---------------+                   +----------------+
 |               +------------------->                |
 |   Browser     |                   |   Server       |
 |               <-------------------+                |
 +---------------+                   +----------------+

                   HTTP/1.1 200 OK
  1. 浏覽器向服務器發出HTTP請求(Request)。
  2. 服務器收到浏覽器的請求數據,經過分析處理,向浏覽器輸出響應數據(Response)。
  3. 浏覽器收到服務器的響應數據,經過分析處理,將最終結果顯示在浏覽器中。

Apache和Nginx都屬於Web服務器,兩者都實現了HTTP 1.1協議。

Apache
概述
Apache HTTP Server是Apache軟件基金會的一個開放源代碼的網頁服務器,可以在大多數計算機操作系統中運行,由於其跨平台和安全性。被廣泛使用,是最流行的Web服務器端軟件之一。它快速、可靠並且可通過簡單的API擴充,將Perl/Python等解釋器編譯到服務器中。 -- 維基百科
Apache組件

Apache是基於模塊化設計的,它的核心代碼並不多,大多數的功能都被分散到各個模塊中,各個模塊在系統啟動的時候按需載入。
         +----------+
      +- | Module   | -----------------+
      |  +----------+                  |
      |                          +------------+
+-----------+   Apache HTTPD     | php module |
| Module    |                    +------------+
+-----------+              +----------+|
      +----------+-------- |  MPM     |+
                 |         +----+---+-+
               +-v-----------+  |   |
               |    ARP      <--+   |
               +------+------+      |
                      |             |
      +---------------v-------------v--+
      |      Operating  System         |
      +--------------------------------+
MPM(Multi -Processing Modules,多重處理模塊)是Apache的核心組件之一,Apache通過MPM來使用操作系統的資源,對進程和線程池進行管理。Apache為了能夠獲得最好的運行性能,針對不同的平台 (Unix/Linux、Window)做了優化,為不同的平台提供了不同的MPM,用戶可以根據實際情況進行選擇,其中最常使用的MPM有 prefork和worker兩種。至於您的服務器正以哪種方式運行,取決於安裝Apache過程中指定的MPM編譯參數,在X系統上默認的編譯參數為 prefork。

由於大多數的Unix都不支持真正的線程,所以采用了預派生子進程(prefork)方式,象Windows或者Solaris這些支持 線程的平台,基於多進程多線程混合的worker模式是一種不錯的選擇。Apache中還有一個重要的組件就是APR(Apache portable Runtime Library),即Apache可移植運行庫,它是一個對操作系統調用的抽象庫,用來實現Apache內部組件對操作系統的使用,提高系統的可移植性。 Apache對於php的解析,就是通過眾多Module中的php Module來完成的。

Apache生命周期
   +--------------------------------------------------------------+
   |                 +---------------------+       啟動階段        |
   |                 |    系統啟動, 配置     |                      |
   |                 +----------+----------+                      |
   |                            |                                 |
   |                 +----------v----------+                      |
   |                 |      模塊的初始化     |                      |
   |                 +-+--------+--------+-+                      |
   |                   |        |        |                        |
   |   +-------------+ | +------v-------+| +--------------+       |
   |   | 子進程初始化  |<+ | 子進程初始化   |+>|  子進程初始化  |       |
   |   +------+------+   +-------+------+  +-------+------+       |
   +--------------------------------------------------------------+
   |          |                  |                 |     運行階段  |
   |     +----v----+        +----v----+       +----v----+         |
   |     | 請求循環 |        |  請求循環 |       | 請求循環 |         |
   |     +----+----+        +----+----+       +----+----+         |
   |          |                  |                 |              |
   |   +------v------+    +------v------+   +------v------+       |
   |   |  子進程結束   |    |  子進程結束  |   |   子進程結束  |       |
   |   +-------------+    +-------------+   +-------------+       |
   +--------------------------------------------------------------+
這個生命周期是在perfork工作下的示意,從圖中可以看出,Apache對於每一個請求都要啟動一個單獨的進程來處理。

Apache的工作模式
prefork的工作原理
一個單獨的控制進程(父進程)負責產生子進程,這些子進程用於監聽請求並作出應答。Apache總是試圖保持一些備用的 (spare)或是空閒的子進程用於迎接即將到來的請求。這樣客戶端就無需在得到服務前等候子進程的產生。在Unix系統中,父進程通常以root身份運行以便邦定80端口,而 Apache產生的子進程通常以一個低特權的用戶運行。User和Group指令用於配置子進程的低特權用戶。運行子進程的用戶必須要對他所服務的內容有讀取的權限,但是對服務內容之外的其他資源必須擁有盡可能少的權限。

worker的工作原理
每個進程能夠擁有的線程數量是固定的。服務器會根據負載情況增加或減少進程數量。一個單獨的控制進程(父進程)負責子進程的建立。每個子進程能夠建立ThreadsPerChild數量的服務線程和一個監聽線程,該監聽線程監聽接入請求並將其傳遞給服務線程處理和應答。Apache總是試圖維持一個備用(spare)或是空閒的服務線程池。這樣,客戶端無須等待新線程或新進程的建立即可得到處理。在Unix中,為了能夠綁定80端口,父進程一般都是以root身份啟動,隨後,Apache以較低權限的用戶建立子進程和線程。User和Group指令用於配置Apache子進程的權限。雖然子進程必須對其提供的內容擁有讀權限,但應該盡可能給予他較少的特權。另外,除非使用了suexec ,否則,這些指令配置的權限將被CGI腳本所繼承。

Apache的運行
啟動階段
在啟動階段,Apache主要進行配置文件解析(例如http.conf以及Include指令設定的配置文件等)、模塊加載(例如modphp.so,modperl.so等)和系統資源初始化(例如日志文件、共享內存段等)工作。在這個階段,Apache為了獲得系統資源最大的使用權限,將以特權用戶root(X系統)或超級管理員administrator(Windows系統)完成啟動。

這個過程可以通過下圖來深入了解:
       +--------+      
       |  開始   |      
       +----+---+         
            |
 +----------v------------+   解析主配置文件http.conf中配置信息, 
 |     解析配置文件        |   像LoadModule, AddType
 +----------+------------+   等指令被加載至內存
            |
 +----------v------------+   依據AddModule, LoadModule等指令
 |   加載靜態/動態模塊      |   加載Apache模塊,像mod_php5.so被
 +----------+------------+   加載至內存,映射到Apache地址空間。
            |
 +----------v------------+   日志文件、共享內存段,數據庫鏈接
 |     系統資源初始化      |    等初始化
 +----------+------------+
            |
        +---v----+
        |  結束   |
        +--------+
運行階段
在運行階段,Apache主要工作是處理用戶的服務請求。在這個階段,Apache放棄特權用戶級別,使用普通權限,這主要是基於安全性的考慮,防止由於代碼的缺陷引起的安全漏洞。

由於Apache的Hook機制,Apache 允許模塊(包括內部模塊和外部模塊,例如mod_php5.so,mod_perl.so等)將自定義的函數注入到請求處理循環中。mod_php5.so/php5apache2.dll就是將所包含的自定義函數,通過Hook機制注入到Apache中,在Apache處理流程的各個階段負責處理php請求。

Apache將請求處理循環分為11個階段,依次是:Post-Read-Request,URI Translation,Header Parsing,Access Control,Authentication,Authorization,MIME Type Checking,FixUp,Response,Logging,CleanUp。

Apache處理http請求的生命周期:
  1. Post-Read-Request階段:在正常請求處理流程中,這是模塊可以插入鉤子的第一個階段。對於那些想很早進入處理請求的模塊來說,這個階段可以被利用。
  2. URI Translation階段 : Apache在本階段的主要工作:將請求的URL映射到本地文件系統。模塊可以在這階段插入鉤子,執行自己的映射邏輯。mod_alias就是利用這個階段工作的。
  3. Header Parsing階段 : Apache在本階段的主要工作:檢查請求的頭部。由於模塊可以在請求處理流程的任何一個點上執行檢查請求頭部的任務,因此這個鉤子很少被使用。mod_setenvif就是利用這個階段工作的。
  4. Access Control階段 : Apache在本階段的主要工作:根據配置文件檢查是否允許訪問請求的資源。Apache的標准邏輯實現了允許和拒絕指令。modauthzhost就是利用這個階段工作的。
  5. Authentication階段 : Apache在本階段的主要工作:按照配置文件設定的策略對用戶進行認證,並設定用戶名區域。模塊可以在這階段插入鉤子,實現一個認證方法。
  6. Authorization階段 : Apache在本階段的主要工作:根據配置文件檢查是否允許認證過的用戶執行請求的操作。模塊可以在這階段插入鉤子,實現一個用戶權限管理的方法。
  7. MIME Type Checking階段 : Apache在本階段的主要工作:根據請求資源的MIME類型的相關規則,判定將要使用的內容處理函數。標准模塊modnegotiation和modmime實現了這個鉤子。
  8. FixUp階段 : 這是一個通用的階段,允許模塊在內容生成器之前,運行任何必要的處理流程。和PostReadRequest類似,這是一個能夠捕獲任何信息的鉤子,也是最常使用的鉤子。
  9. Response階段 : Apache在本階段的主要工作:生成返回客戶端的內容,負責給客戶端發送一個恰當的回復。這個階段是整個處理流程的核心部分。
  10. Logging階段 : Apache在本階段的主要工作:在回復已經發送給客戶端之後記錄事務。模塊可能修改或者替換Apache的標准日志記錄。
  11. CleanUp階段 : Apache在本階段的主要工作:清理本次請求事務處理完成之後遺留的環境,比如文件、目錄的處理或者Socket的關閉等等,這是Apache一次請求處理的最後一個階段。

Nginx
概述
Nginx(發音同engine x)是一款由俄羅斯程序員Igor Sysoev所開發輕量級的網頁服務器、反向代理服務器以及電子郵件(IMAP/POP3)代理服務器。起初是供俄國大型的門戶網站及搜索引擎Rambler(俄語:Рамблер)使用。 -- 維基百科

Nginx的模塊與工作原理
Nginx由內核和模塊組成,其中,內核的設計非常微小和簡潔,完成的工作也非常簡單,僅僅通過查找配置文件將客戶端請求映射到一個location block(location是Nginx配置中的一個指令,用於URL匹配),而在這個location中所配置的每個指令將會啟動不同的模塊去完成相應的工作。

Nginx的模塊從結構上分為核心模塊、基礎模塊和第三方模塊:
  • 核心模塊:HTTP模塊、EVENT模塊和MAIL模塊
  • 基礎模塊:HTTP Access模塊、HTTP FastCGI模塊、HTTP Proxy模塊和HTTP Rewrite模塊,
  • 第三方模塊:HTTP Upstream Request Hash模塊、Notice模塊和HTTP Access Key模塊。

Nginx的模塊從功能上分為如下三類:
  • Handlers(處理器模塊)。此類模塊直接處理請求,並進行輸出內容和修改headers信息等操作。Handlers處理器模塊一般只能有一個。
  • Filters (過濾器模塊)。此類模塊主要對其他處理器模塊輸出的內容進行修改操作,最後由Nginx輸出。
  • Proxies (代理類模塊)。此類模塊是Nginx的HTTP Upstream之類的模塊,這些模塊主要與後端一些服務比如FastCGI等進行交互,實現服務代理和負載均衡等功能。

                     +                    ^
        Http Request |                    |  Http Response
                     |                    |
    +---------+------v-----+         +----+----+
    |  Conf   | Nginx Core |         | FilterN |
    +---------+------+-----+         +----^----+
                     |                    |
                     |               +----+----+
                     |               | Filter2 |
choose a handler     |               +----^----+
based conf           |                    |
                     |               +----+----+
                     |               | Filter1 |
                     |               +----^----+
                     |                    | Generate content
               +-----v--------------------+----+
               |           Handler             |
               +-------------------------------+
Nginx本身做的工作實際很少,當它接到一個HTTP請求時,它僅僅是通過查找配置文件將此次請求映射到一個location block,而此location中所配置的各個指令則會啟動不同的模塊去完成工作,因此模塊可以看做Nginx真正的勞動工作者。通常一個location中的指令會涉及一個handler模塊和多個filter模塊(當然,多個location可以復用同一個模塊)。handler模塊負責處理請求,完成響應內容的生成,而filter模塊對響應內容進行處理。

Nginx架構及工作流程
上圖是Nginx的架構,這個架構類似於Apache的Worker工作狀態,Nginx的每一個Worker進程都管理著大量的線程,真正處理請求的是Worker之下的線程。

所有實際上的業務處理邏輯都在worker進程。worker進程中有一個函數,執行無限循環,不斷處理收到的來自客戶端的請求,並進行處理,直到整個nginx服務被停止。Worker中這個函數執行內容如下:
  1. 操作系統提供的機制(例如epoll, kqueue等)產生相關的事件。
  2. 接收和處理這些事件,如是接受到數據,則產生更高層的request對象。
  3. 處理request的header和body。
  4. 產生響應,並發送回客戶端。
  5. 完成request的處理。
  6. 重新初始化定時器及其他事件。

Nginx和FastCGI
FastCGI
FastCGI是一個可伸縮地、高速地在HTTP server和動態腳本語言間通信的接口。多數流行的HTTP server都支持FastCGI,包括Apache、Nginx和lighttpd等。同時,FastCGI也被許多腳本語言支持,其中就有PHP。

FastCGI是從CGI發展改進而來的。傳統CGI接口方式的主要缺點是性能很差,因為每次HTTP服務器遇到動態程序時都需要重新啟動腳本解析器來執行解析,然後將結果返回給HTTP服務器。這在處理高並發訪問時幾乎是不可用的。另外傳統的CGI接口方式安全性也很差,現在已經很少使用了。

FastCGI接口方式采用C/S結構,可以將HTTP服務器和腳本解析服務器分開,同時在腳本解析服務器上啟動一個或者多個腳本解析守護進程。當HTTP服務器每次遇到動態程序時,可以將其直接交付給FastCGI進程來執行,然後將得到的結果返回給浏覽器。這種方式可以讓HTTP服務器專一地處理靜態請求或者將動態腳本服務器的結果返回給客戶端,這在很大程度上提高了整個應用系統的性能。

Nging和FastCGI合作
Nginx不支持對外部程序的直接調用或者解析,所有的外部程序(包括PHP)必須通過FastCGI接口來調用。FastCGI接口在Linux下是socket(這個socket可以是文件socket,也可以是ip socket)。

接下來以Nginx下PHP的運行過程來說明。PHP-FPM是管理FastCGI的一個管理器,它作為PHP的插件存在。
  1. FastCGI進程管理器php-fpm自身初始化,啟動主進程php-fpm和啟動start_servers個CGI 子進程。主進程php-fpm主要是管理fastcgi子進程,監聽9000端口。fastcgi子進程等待來自Web Server的連接。
  2. 當客戶端請求到達Web Server Nginx是時,Nginx通過location指令,將所有以php為後綴的文件都交給127.0.0.1:9000來處理,即Nginx通過location指令,將所有以php為後綴的文件都交給127.0.0.1:9000來處理。
  3. FastCGI進程管理器PHP-FPM選擇並連接到一個子進程CGI解釋器。Web server將CGI環境變量和標准輸入發送到FastCGI子進程。
  4. FastCGI子進程完成處理後將標准輸出和錯誤信息從同一連接返回Web Server。當FastCGI子進程關閉連接時,請求便告處理完成。
  5. FastCGI子進程接著等待並處理來自FastCGI進程管理器(運行在 WebServer中)的下一個連接。

Apache和Nginx比較
功能對比
Nginx和Apache一樣,都是HTTP服務器軟件,在功能實現上都采用模塊化結構設計,都支持通用的語言接口,如PHP、Perl、Python等,同時還支持正向和反向代理、虛擬主機、URL重寫、壓縮傳輸、SSL加密傳輸等。
  1. 在功能實現上,Apache的所有模塊都支持動、靜態編譯,而Nginx模塊都是靜態編譯的,
  2. 對FastCGI的支持,Apache對Fcgi的支持不好,而Nginx對Fcgi的支持非常好;
  3. 在處理連接方式上,Nginx支持epoll,而Apache卻不支持;
  4. 在空間使用上,Nginx安裝包僅僅只有幾百K,和Nginx比起來Apache絕對是龐然大物。

Nginx相對apache的優點
  • 輕量級,同樣起web 服務,比apache 占用更少的內存及資源
  • 靜態處理,Nginx 靜態處理性能比 Apache 高 3倍以上
  • 抗並發,nginx 處理請求是異步非阻塞的,而apache則是阻塞型的,在高並發下nginx 能保持低資源低消耗高性能。在Apache+PHP(prefork)模式下,如果PHP處理慢或者前端壓力很大的情況下,很容易出現Apache進程數飙升,從而拒絕服務的現象。
  • 高度模塊化的設計,編寫模塊相對簡單
  • 社區活躍,各種高性能模塊出品迅速啊

apache相對nginx的優點
  • rewrite,比nginx 的rewrite 強大
  • 模塊超多,基本想到的都可以找到
  • 少bug,nginx的bug相對較多
  • 超穩定
  • Apache對PHP支持比較簡單,Nginx需要配合其他後端用

選擇Nginx的優勢所在
  1. 作為Web服務器: Nginx處理靜態文件、索引文件,自動索引的效率非常高。
  2. 作為代理服務器,Nginx可以實現無緩存的反向代理加速,提高網站運行速度。
  3. 作為負載均衡服務器,Nginx既可以在內部直接支持Rails和PHP,也可以支持HTTP代理服務器對外進行服務,同時還支持簡單的容錯和利用算法進行負載均衡。
  4. 在性能方面,Nginx是專門為性能優化而開發的,在實現上非常注重效率。它采用內核Poll模型(epoll and kqueue ),可以支持更多的並發連接,最大可以支持對50 000個並發連接數的響應,而且只占用很低的內存資源。
  5. 在穩定性方面,Nginx采取了分階段資源分配技術,使得CPU與內存的占用率非常低。Nginx官方表示,Nginx保持10 000個沒有活動的連接,而這些連接只占用2.5MB內存,因此,類似DOS這樣的攻擊對Nginx來說基本上是沒有任何作用的。
  6. 在高可用性方面,Nginx支持熱部署,啟動速度特別迅速,因此可以在不間斷服務的情況下,對軟件版本或者配置進行升級,即使運行數月也無需重新啟動,幾乎可以做到7×24小時不間斷地運行。

同時使用Nginx和Apache
由於Nginx和Apache各自的優勢,現在很多人選擇了讓兩者在服務器中共存。在服務器端讓Nginx在前,Apache在後。由Nginx做負載均衡和反向代理,並且處理靜態文件,講動態請求(如PHP應用)交給Apache去處理。
原文:http://yansu.org/2014/02/15/apache-and-nginx.html
Copyright © Linux教程網 All Rights Reserved