摘要:與傳統(tǒng)模式的區(qū)別之一則是服務器不是直接執(zhí)行程序了,而是通過與響應器進程管理器進行交互,服務器需要將接口數(shù)據(jù)封裝在遵循協(xié)議包中發(fā)送給響應器程序。正是由于進程管理器是基于通信的,所以也是分布式的,服務器和響應器服務器分開部署。
廣告
很多工程師在工作1~3年的時候最容易遇到瓶頸,不知道自己應該學習什么,面試總是吃閉門羹。那么 PHP 后面應該怎么學呢?安利一波我的系列直播 《PHP 進階之路》
在討論 FastCGI 之前,不得不說傳統(tǒng)的 CGI 的工作原理,同時應該大概了解 CGI 1.1 協(xié)議
傳統(tǒng) CGI 工作原理分析客戶端訪問某個 URL 地址之后,通過 GET/POST/PUT 等方式提交數(shù)據(jù),并通過 HTTP 協(xié)議向 Web 服務器發(fā)出請求,服務器端的 HTTP Daemon(守護進程)將 HTTP 請求里描述的信息通過標準輸入 stdin 和環(huán)境變量(environment variable)傳遞給主頁指定的 CGI 程序,并啟動此應用程序進行處理(包括對數(shù)據(jù)庫的處理),處理結(jié)果通過標準輸出 stdout 返回給 HTTP Daemon 守護進程,再由 HTTP Daemon 進程通過 HTTP 協(xié)議返回給客戶端。
上面的這段話理解可能還是比較抽象,下面我們就通過一次GET請求為例進行詳細說明。
下面用代碼來實現(xiàn)圖中表述的功能。Web 服務器啟動一個 socket 監(jiān)聽服務,然后在本地執(zhí)行 CGI 程序。后面有比較詳細的代碼解讀。
#include如上代碼中的重點:#include #include #include #include #include #include #include #define SERV_PORT 9003 char* str_join(char *str1, char *str2); char* html_response(char *res, char *buf); int main(void) { int lfd, cfd; struct sockaddr_in serv_addr,clin_addr; socklen_t clin_len; char buf[1024],web_result[1024]; int len; FILE *cin; if((lfd = socket(AF_INET,SOCK_STREAM,0)) == -1){ perror("create socket failed"); exit(1); } memset(&serv_addr, 0, sizeof(serv_addr)); serv_addr.sin_family = AF_INET; serv_addr.sin_addr.s_addr = htonl(INADDR_ANY); serv_addr.sin_port = htons(SERV_PORT); if(bind(lfd, (struct sockaddr *)&serv_addr, sizeof(serv_addr)) == -1) { perror("bind error"); exit(1); } if(listen(lfd, 128) == -1) { perror("listen error"); exit(1); } signal(SIGCLD,SIG_IGN); while(1) { clin_len = sizeof(clin_addr); if ((cfd = accept(lfd, (struct sockaddr *)&clin_addr, &clin_len)) == -1) { perror("接收錯誤 "); continue; } cin = fdopen(cfd, "r"); setbuf(cin, (char *)0); fgets(buf,1024,cin); //讀取第一行 printf(" %s", buf); //============================ cgi 環(huán)境變量設置演示 ============================ // 例如 "GET /user.cgi?id=1 HTTP/1.1"; char *delim = " "; char *p; char *method, *filename, *query_string; char *query_string_pre = "QUERY_STRING="; method = strtok(buf,delim); // GET p = strtok(NULL,delim); // /user.cgi?id=1 filename = strtok(p,"?"); // /user.cgi if (strcmp(filename,"/favicon.ico") == 0) { continue; } query_string = strtok(NULL,"?"); // id=1 putenv(str_join(query_string_pre,query_string)); //============================ cgi 環(huán)境變量設置演示 ============================ int pid = fork(); if (pid > 0) { close(cfd); } else if (pid == 0) { close(lfd); FILE *stream = popen(str_join(".",filename),"r"); fread(buf,sizeof(char),sizeof(buf),stream); html_response(web_result,buf); write(cfd,web_result,sizeof(web_result)); pclose(stream); close(cfd); exit(0); } else { perror("fork error"); exit(1); } } close(lfd); return 0; } char* str_join(char *str1, char *str2) { char *result = malloc(strlen(str1)+strlen(str2)+1); if (result == NULL) exit (1); strcpy(result, str1); strcat(result, str2); return result; } char* html_response(char *res, char *buf) { char *html_response_template = "HTTP/1.1 200 OK Content-Type:text/html Content-Length: %d Server: mengkang %s"; sprintf(res,html_response_template,strlen(buf),buf); return res; }
66~81行找到CGI程序的相對路徑(我們?yōu)榱撕唵?,直接將其根目錄定義為Web程序的當前目錄),這樣就可以在子進程中執(zhí)行 CGI 程序了;同時設置環(huán)境變量,方便CGI程序運行時讀??;
94~95行將 CGI 程序的標準輸出結(jié)果寫入 Web 服務器守護進程的緩存中;
97行則將包裝后的 html 結(jié)果寫入客戶端 socket 描述符,返回給連接Web服務器的客戶端。
CGI 程序(user.c)#include#include // 通過獲取的 id 查詢用戶的信息 int main(void){ //============================ 模擬數(shù)據(jù)庫 ============================ typedef struct { int id; char *username; int age; } user; user users[] = { {}, { 1, "mengkang.zhou", 18 } }; //============================ 模擬數(shù)據(jù)庫 ============================ char *query_string; int id; query_string = getenv("QUERY_STRING"); if (query_string == NULL) { printf("沒有輸入數(shù)據(jù)"); } else if (sscanf(query_string,"id=%d",&id) != 1) { printf("沒有輸入id"); } else { printf("用戶信息查詢
學號: %d
姓名: %s
年齡: %d",id,users[id].username,users[id].age); } return 0; }
將上面的 CGI 程序編譯成gcc user.c -o user.cgi,放在上面web程序的同級目錄。
代碼中的第28行,從環(huán)境變量中讀取前面在Web服務器守護進程中設置的環(huán)境變量,是我們演示的重點。
相對于 CGI/1.1 規(guī)范在 Web 服務器在本地 fork 一個子進程執(zhí)行 CGI 程序,填充 CGI 預定義的環(huán)境變量,放入系統(tǒng)環(huán)境變量,把 HTTP body 體的 content 通過標準輸入傳入子進程,處理完畢之后通過標準輸出返回給 Web 服務器。FastCGI 的核心則是取締傳統(tǒng)的 fork-and-execute 方式,減少每次啟動的巨大開銷(后面以 PHP 為例說明),以常駐的方式來處理請求。
FastCGI 工作流程如下:
FastCGI 進程管理器自身初始化,啟動多個 CGI 解釋器進程,并等待來自 Web Server 的連接。
Web 服務器與 FastCGI 進程管理器進行 Socket 通信,通過 FastCGI 協(xié)議發(fā)送 CGI 環(huán)境變量和標準輸入數(shù)據(jù)給 CGI 解釋器進程。
CGI 解釋器進程完成處理后將標準輸出和錯誤信息從同一連接返回 Web Server。
CGI 解釋器進程接著等待并處理來自 Web Server 的下一個連接。
FastCGI 與傳統(tǒng) CGI 模式的區(qū)別之一則是 Web 服務器不是直接執(zhí)行 CGI 程序了,而是通過 socket 與 FastCGI 響應器(FastCGI 進程管理器)進行交互,Web 服務器需要將 CGI 接口數(shù)據(jù)封裝在遵循 FastCGI 協(xié)議包中發(fā)送給 FastCGI 響應器程序。正是由于 FastCGI 進程管理器是基于 socket 通信的,所以也是分布式的,Web服務器和CGI響應器服務器分開部署。
再啰嗦一句,F(xiàn)astCGI 是一種協(xié)議,它是建立在CGI/1.1基礎之上的,把CGI/1.1里面的要傳遞的數(shù)據(jù)通過FastCGI協(xié)議定義的順序、格式進行傳遞。
準備工作可能上面的內(nèi)容理解起來還是很抽象,這是由于第一對FastCGI協(xié)議還沒有一個大概的認識,第二沒有實際代碼的學習。所以需要預先學習下 FastCGI 協(xié)議的內(nèi)容,不一定需要完全看懂,可大致了解之后,看完本篇再結(jié)合著學習理解消化。
FastCGI 協(xié)議分析http://www.fastcgi.com/devkit... (英文原版)
http://andylin02.iteye.com/bl... (中文版)
下面結(jié)合 PHP 的 FastCGI 的代碼進行分析,不作特殊說明以下代碼均來自于 PHP 源碼。
FastCGI 消息類型FastCGI 將傳輸?shù)南⒆隽撕芏囝愋偷膭澐?,其結(jié)構(gòu)體定義如下:
typedef enum _fcgi_request_type { FCGI_BEGIN_REQUEST = 1, /* [in] */ FCGI_ABORT_REQUEST = 2, /* [in] (not supported) */ FCGI_END_REQUEST = 3, /* [out] */ FCGI_PARAMS = 4, /* [in] environment variables */ FCGI_STDIN = 5, /* [in] post data */ FCGI_STDOUT = 6, /* [out] response */ FCGI_STDERR = 7, /* [out] errors */ FCGI_DATA = 8, /* [in] filter data (not supported) */ FCGI_GET_VALUES = 9, /* [in] */ FCGI_GET_VALUES_RESULT = 10 /* [out] */ } fcgi_request_type;消息的發(fā)送順序
下圖是一個簡單的消息傳遞流程
最先發(fā)送的是FCGI_BEGIN_REQUEST,然后是FCGI_PARAMS和FCGI_STDIN,由于每個消息頭(下面將詳細說明)里面能夠承載的最大長度是65535,所以這兩種類型的消息不一定只發(fā)送一次,有可能連續(xù)發(fā)送多次。
FastCGI 響應體處理完畢之后,將發(fā)送FCGI_STDOUT、FCGI_STDERR,同理也可能多次連續(xù)發(fā)送。最后以FCGI_END_REQUEST表示請求的結(jié)束。
需要注意的一點,FCGI_BEGIN_REQUEST和FCGI_END_REQUEST分別標識著請求的開始和結(jié)束,與整個協(xié)議息息相關(guān),所以他們的消息體的內(nèi)容也是協(xié)議的一部分,因此也會有相應的結(jié)構(gòu)體與之對應(后面會詳細說明)。而環(huán)境變量、標準輸入、標準輸出、錯誤輸出,這些都是業(yè)務相關(guān),與協(xié)議無關(guān),所以他們的消息體的內(nèi)容則無結(jié)構(gòu)體對應。
由于整個消息是二進制連續(xù)傳遞的,所以必須定義一個統(tǒng)一的結(jié)構(gòu)的消息頭,這樣以便讀取每個消息的消息體,方便消息的切割。這在網(wǎng)絡通訊中是非常常見的一種手段。
FastCGI 消息頭如上,F(xiàn)astCGI 消息分10種消息類型,有的是輸入有的是輸出。而所有的消息都以一個消息頭開始。其結(jié)構(gòu)體定義如下:
typedef struct _fcgi_header { unsigned char version; unsigned char type; unsigned char requestIdB1; unsigned char requestIdB0; unsigned char contentLengthB1; unsigned char contentLengthB0; unsigned char paddingLength; unsigned char reserved; } fcgi_header;
字段解釋下:
version標識FastCGI協(xié)議版本。
type 標識FastCGI記錄類型,也就是記錄執(zhí)行的一般職能。
requestId標識記錄所屬的FastCGI請求。
contentLength記錄的contentData組件的字節(jié)數(shù)。
關(guān)于上面的xxB1和xxB0的協(xié)議說明:當兩個相鄰的結(jié)構(gòu)組件除了后綴“B1”和“B0”之外命名相同時,它表示這兩個組件可視為估值為B1<<8 + B0的單個數(shù)字。該單個數(shù)字的名字是這些組件減去后綴的名字。這個約定歸納了一個由超過兩個字節(jié)表示的數(shù)字的處理方式。
比如協(xié)議頭中requestId和contentLength表示的最大值就是65535
#include#include #include int main() { unsigned char requestIdB1 = UCHAR_MAX; unsigned char requestIdB0 = UCHAR_MAX; printf("%d ", (requestIdB1 << 8) + requestIdB0); // 65535 }
你可能會想到如果一個消息體長度超過65535怎么辦,則分割為多個相同類型的消息發(fā)送即可。
FCGI_BEGIN_REQUEST 的定義typedef struct _fcgi_begin_request { unsigned char roleB1; unsigned char roleB0; unsigned char flags; unsigned char reserved[5]; } fcgi_begin_request;
字段解釋
role表示W(wǎng)eb服務器期望應用扮演的角色。分為三個角色(而我們這里討論的情況一般都是響應器角色)
typedef enum _fcgi_role { FCGI_RESPONDER = 1, FCGI_AUTHORIZER = 2, FCGI_FILTER = 3 } fcgi_role;
而FCGI_BEGIN_REQUEST中的flags組件包含一個控制線路關(guān)閉的位:flags & FCGI_KEEP_CONN:如果為0,則應用在對本次請求響應后關(guān)閉線路。如果非0,應用在對本次請求響應后不會關(guān)閉線路;Web服務器為線路保持響應性。
FCGI_END_REQUEST 的定義typedef struct _fcgi_end_request { unsigned char appStatusB3; unsigned char appStatusB2; unsigned char appStatusB1; unsigned char appStatusB0; unsigned char protocolStatus; unsigned char reserved[3]; } fcgi_end_request;
字段解釋
appStatus組件是應用級別的狀態(tài)碼。
protocolStatus組件是協(xié)議級別的狀態(tài)碼;protocolStatus的值可能是:
FCGI_REQUEST_COMPLETE:請求的正常結(jié)束。
FCGI_CANT_MPX_CONN:拒絕新請求。這發(fā)生在Web服務器通過一條線路向應用發(fā)送并發(fā)的請求時,后者被設計為每條線路每次處理一個請求。
FCGI_OVERLOADED:拒絕新請求。這發(fā)生在應用用完某些資源時,例如數(shù)據(jù)庫連接。
FCGI_UNKNOWN_ROLE:拒絕新請求。這發(fā)生在Web服務器指定了一個應用不能識別的角色時。
protocolStatus在 PHP 中的定義如下
typedef enum _fcgi_protocol_status { FCGI_REQUEST_COMPLETE = 0, FCGI_CANT_MPX_CONN = 1, FCGI_OVERLOADED = 2, FCGI_UNKNOWN_ROLE = 3 } dcgi_protocol_status;
需要注意dcgi_protocol_status和fcgi_role各個元素的值都是 FastCGI 協(xié)議里定義好的,而非 PHP 自定義的。
消息通訊樣例為了簡單的表示,消息頭只顯示消息的類型和消息的 id,其他字段都不予以顯示。下面的例子來自于官網(wǎng)
{FCGI_BEGIN_REQUEST, 1, {FCGI_RESPONDER, 0}} {FCGI_PARAMS, 1, "