成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

【Nginx源碼研究】Nginx的事件模塊介紹

heartFollower / 3346人閱讀

摘要:在中,用戶(hù)主要通過(guò)配置文件的塊來(lái)控制和調(diào)節(jié)事件模塊的參數(shù)。中,事件會(huì)使用結(jié)構(gòu)體來(lái)表示。初始化定時(shí)器,該定時(shí)器就是一顆紅黑樹(shù),根據(jù)時(shí)間對(duì)事件進(jìn)行排序。

運(yùn)營(yíng)研發(fā)團(tuán)隊(duì) 譚淼

一、nginx模塊介紹

高并發(fā)是nginx最大的優(yōu)勢(shì)之一,而高并發(fā)的原因就是nginx強(qiáng)大的事件模塊。本文將重點(diǎn)介紹nginx是如果利用Linux系統(tǒng)的epoll來(lái)完成高并發(fā)的。

首先介紹nginx的模塊,nginx1.15.5源碼中,自帶的模塊主要分為core模塊、conf模塊、event模塊、http模塊和mail模塊五大類(lèi)。其中mail模塊比較特殊,本文暫不討論。

查看nginx模塊屬于哪一類(lèi)也很簡(jiǎn)單,對(duì)于每一個(gè)模塊,都有一個(gè)ngx_module_t類(lèi)型的結(jié)構(gòu)體,該結(jié)構(gòu)體的type字段就是標(biāo)明該模塊是屬于哪一類(lèi)模塊的。以ngx_http_module為例:

ngx_module_t  ngx_http_module = {
    NGX_MODULE_V1,
    &ngx_http_module_ctx,                  /* module context */
    ngx_http_commands,                     /* module directives */
    NGX_CORE_MODULE,                       /* module type */
    NULL,                                  /* init master */
    NULL,                                  /* init module */
    NULL,                                  /* init process */
    NULL,                                  /* init thread */
    NULL,                                  /* exit thread */
    NULL,                                  /* exit process */
    NULL,                                  /* exit master */
    NGX_MODULE_V1_PADDING
};

可以ngx_core_module是屬于NGX_CORE_MODULE類(lèi)型的模塊。

由于本文主要介紹使用epoll來(lái)完成nginx的事件驅(qū)動(dòng),故主要介紹core模塊的ngx_events_module與event模塊的ngx_event_core_module、ngx_epoll_module。

二、epoll介紹 2.1、epoll原理

關(guān)于epoll的實(shí)現(xiàn)原理,本文不會(huì)具體介紹,這里只是介紹epoll的工作流程。具體的實(shí)現(xiàn)參考:https://titenwang.github.io/2...

epoll的使用是三個(gè)函數(shù):

int epoll_create(int size);
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout);

首先epoll_create函數(shù)會(huì)在內(nèi)核中創(chuàng)建一塊獨(dú)立的內(nèi)存存儲(chǔ)一個(gè)eventpoll結(jié)構(gòu)體,該結(jié)構(gòu)體包括一顆紅黑樹(shù)和一個(gè)鏈表,如下圖所示:

然后通過(guò)epoll_ctl函數(shù),可以完成兩件事。

(1)將事件添加到紅黑樹(shù)中,這樣可以防止重復(fù)添加事件;

(2)將事件與網(wǎng)卡建立回調(diào)關(guān)系,當(dāng)事件發(fā)生時(shí),網(wǎng)卡驅(qū)動(dòng)會(huì)回調(diào)ep_poll_callback函數(shù),將事件添加到epoll_create創(chuàng)建的鏈表中。

最后,通過(guò)epoll_wait函數(shù),檢查并返回鏈表中是否有事件。該函數(shù)是阻塞函數(shù),阻塞時(shí)間為timeout,當(dāng)雙向鏈表有事件或者超時(shí)的時(shí)候就會(huì)返回鏈表長(zhǎng)度(發(fā)生事件的數(shù)量)。

2.2、epoll相關(guān)函數(shù)的參數(shù)

(1)epoll_create函數(shù)的參數(shù)size表示該紅黑樹(shù)的大致數(shù)量,實(shí)際上很多操作系統(tǒng)沒(méi)有使用這個(gè)參數(shù)。

(2)epoll_ctl函數(shù)的參數(shù)為epfd,op,fd和event。

(3)epoll_wait函數(shù)的參數(shù)為epfd,events,maxevents和timeout

三、事件模塊的初始化

眾所周知,nginx是master/worker框架,在nginx啟動(dòng)時(shí)是一個(gè)進(jìn)程,在啟動(dòng)的過(guò)程中master會(huì)fork出了多個(gè)子進(jìn)程作為worker。master主要是管理worker,本身并不處理請(qǐng)求。而worker負(fù)責(zé)處理請(qǐng)求。因此,事件模塊的初始化也是分成兩部分。一部分發(fā)生在fork出worker前,主要是配置文件解析等操作,另外一部分發(fā)生在fork之后,主要是向epoll中添加監(jiān)聽(tīng)事件。

3.1 啟動(dòng)進(jìn)程對(duì)事件模塊的初始化

啟動(dòng)進(jìn)程對(duì)事件模塊的初始化分為配置文件解析、開(kāi)始監(jiān)聽(tīng)端口和ngx_event_core_module模塊的初始化。這三個(gè)步驟均在ngx_init_cycle函數(shù)進(jìn)行。

調(diào)用關(guān)系:main() ---> ngx_init_cycle()

下圖是ngx_init_cycle函數(shù)的流程,紅框是本節(jié)將要介紹的三部分內(nèi)容。

3.1.1 配置文件解析

啟動(dòng)進(jìn)程的一個(gè)主要工作是解析配置文件。在nginx中,用戶(hù)主要通過(guò)nginx配置文件nginx.conf的event塊來(lái)控制和調(diào)節(jié)事件模塊的參數(shù)。下面是一個(gè)event塊配置的示例:

user  nobody;
worker_processes  1;
error_log  logs/error.log;
pid        logs/nginx.pid;
......
 
events {
    use epoll;
    worker_connections  1024;
    accept_mutex on;
}
 
http {
    ......
}

首先我們先看看nginx是如何解析event塊,并將event塊存儲(chǔ)在什么地方。

在nginx中,解析配置文件的工作是調(diào)用ngx_init_cycle函數(shù)完成的。下圖是該函數(shù)在解析配置文件部分的一個(gè)流程:

(1)ngx_init_cycle函數(shù)首先會(huì)進(jìn)行一些初始化工作,包括更新時(shí)間,創(chuàng)建內(nèi)存池和創(chuàng)建并更新ngx_cycle_t結(jié)構(gòu)體cycle;

(2)調(diào)用各個(gè)core模塊的create_conf方法,可以創(chuàng)建cycle的conf_ctx數(shù)組,該階段完成后cycle->conf_ctx如下圖所示:

(3)初始化ngx_conf_t類(lèi)型的結(jié)構(gòu)體conf,將cycle->conf_ctx結(jié)構(gòu)體賦值給conf的ctx字段

(4)解析配置文件

解析配置文件會(huì)調(diào)用ngx_conf_parse函數(shù),該函數(shù)會(huì)解析一行命令,當(dāng)遇到塊時(shí)會(huì)遞歸調(diào)用自身。解析的方法也很簡(jiǎn)單,就是讀取一個(gè)命令,然后在所有模塊的cmd數(shù)組中尋找該命令,若找到則調(diào)用該命令的cmd->set(),完成參數(shù)的解析。下面介紹event塊的解析。

event命令是在event/ngx_event.c文件中定義的,代碼如下。

static ngx_command_t  ngx_events_commands[] = {
 
    { ngx_string("events"),
      NGX_MAIN_CONF|NGX_CONF_BLOCK|NGX_CONF_NOARGS,
      ngx_events_block,
      0,
      0,
      NULL },
 
      ngx_null_command
};

在從配置文件中讀取到event后,會(huì)調(diào)用ngx_events_block函數(shù)。下面是ngx_events_block函數(shù)的主要工作:

解析完配置文件中的event塊后,cycle->conf_ctx如下圖所示:

(5)解析完整個(gè)配置文件后,調(diào)用各個(gè)core類(lèi)型模塊的init_conf方法。ngx_event_module的ctx的init_conf方法為ngx_event_init_conf。該方法并沒(méi)有實(shí)際的用途,暫不詳述。

3.1.2 監(jiān)聽(tīng)socket

雖然監(jiān)聽(tīng)socket和事件模塊并沒(méi)有太多的關(guān)系,但是為了使得整個(gè)流程完整,此處會(huì)簡(jiǎn)單介紹一下啟動(dòng)進(jìn)程是如何監(jiān)聽(tīng)端口的。

該過(guò)程首先檢查old_cycle,如果old_cycle中有和cycle中相同的socket,就直接把old_cycle中的fd賦值給cycle。之后會(huì)調(diào)用ngx_open_listening_socket函數(shù),監(jiān)聽(tīng)端口。

下面是ngx_open_listening_sockets函數(shù),該函數(shù)的作用是遍歷所有需要監(jiān)聽(tīng)的端口,然后調(diào)用socket(),bind()和listen()函數(shù),該函數(shù)會(huì)重試5次。

ngx_int_t
ngx_open_listening_sockets(ngx_cycle_t *cycle)
{
    ......
 
    /* 重試5次 */
    for (tries = 5; tries; tries--) {
        failed = 0;
 
        /* 遍歷需要監(jiān)聽(tīng)的端口 */
        ls = cycle->listening.elts;
        for (i = 0; i < cycle->listening.nelts; i++) {
            ......
 
            /* ngx_socket函數(shù)就是socket函數(shù) */
            s = ngx_socket(ls[i].sockaddr->sa_family, ls[i].type, 0);
 
            ......
 
            /* 設(shè)置socket屬性 */
            if (setsockopt(s, SOL_SOCKET, SO_REUSEADDR,
                           (const void *) &reuseaddr, sizeof(int))
                == -1)
            {
                ......
            }
 
            ......
 
            /* IOCP事件操作 */
            if (!(ngx_event_flags & NGX_USE_IOCP_EVENT)) {
                if (ngx_nonblocking(s) == -1) {
                    ......
                }
            }
 
            ......
 
            /* 綁定socket和地址 */
            if (bind(s, ls[i].sockaddr, ls[i].socklen) == -1) {
               ......
            }
 
            ......
 
            /* 開(kāi)始監(jiān)聽(tīng) */
            if (listen(s, ls[i].backlog) == -1) {
                ......
            }
 
            ls[i].listen = 1;
 
            ls[i].fd = s;
        }
 
        ......
 
        /* 兩次重試間隔500ms */
        ngx_msleep(500);
    }
 
    ......
 
    return NGX_OK;
}
3.1.3 ngx_event_core_module模塊的初始化

在ngx_init_cycle函數(shù)監(jiān)聽(tīng)完端口,并提交新的cycle后,便會(huì)調(diào)用ngx_init_modules函數(shù),該方法會(huì)遍歷所有模塊并調(diào)用其init_module方法。對(duì)于該階段,和事件驅(qū)動(dòng)模塊有關(guān)系的只有ngx_event_core_module的ngx_event_module_init方法。該方法主要做了下面三個(gè)工作:

(1)獲取core模塊配置結(jié)構(gòu)體中的時(shí)間精度timer_resolution,用在epoll里更新緩存時(shí)間

(2)調(diào)用getrlimit方法,檢查連接數(shù)是否超過(guò)系統(tǒng)的資源限制

(3)利用 mmap 分配一塊共享內(nèi)存,存儲(chǔ)負(fù)載均衡鎖(ngx_accept_mutex)、連接計(jì)數(shù)器(ngx_connection_counter)

3.2 worker進(jìn)程對(duì)事件模塊的初始化

啟動(dòng)進(jìn)程在完成一系列操作后,會(huì)fork出master進(jìn)程,并自我關(guān)閉,讓master進(jìn)程繼續(xù)完成初始化工作。master進(jìn)程會(huì)在ngx_spawn_process函數(shù)中fork出worker進(jìn)程,并讓worker進(jìn)程調(diào)用ngx_worker_process_cycle函數(shù)。ngx_worker_process_cycle函數(shù)是worker進(jìn)程的主循環(huán)函數(shù),該函數(shù)首先會(huì)調(diào)用ngx_worker_process_init函數(shù)完成worker的初始化,然后就會(huì)進(jìn)入到一個(gè)循環(huán)中,持續(xù)監(jiān)聽(tīng)處理請(qǐng)求。

事件模塊的初始化就發(fā)生在ngx_worker_process_init函數(shù)中。

其調(diào)用關(guān)系:main() ---> ngx_master_process_cycle() ---> ngx_start_worker_processes() ---> ngx_spawn_process() ---> ngx_worker_process_cycle() ---> ngx_worker_process_init()。

對(duì)于ngx_worker_process_init函數(shù),會(huì)調(diào)用各個(gè)模塊的init_process方法:

static void
ngx_worker_process_init(ngx_cycle_t *cycle, ngx_int_t worker)
{
     
    ......
 
    for (i = 0; cycle->modules[i]; i++) {
        if (cycle->modules[i]->init_process) {
            if (cycle->modules[i]->init_process(cycle) == NGX_ERROR) {
                /* fatal */
                exit(2);
            }
        }
    }
 
    ......
}

在此處,會(huì)調(diào)用ngx_event_core_module的ngx_event_process_init函數(shù)。該函數(shù)較為關(guān)鍵,將會(huì)重點(diǎn)解析。在介紹ngx_event_process_init函數(shù)前,先介紹兩個(gè)終于的結(jié)構(gòu)體,由于這兩個(gè)結(jié)構(gòu)體較為復(fù)雜,故只介紹部分字段:

(1)ngx_event_s結(jié)構(gòu)體。nginx中,事件會(huì)使用ngx_event_s結(jié)構(gòu)體來(lái)表示。

ngx_event_s
struct ngx_event_s {
    /* 通常指向ngx_connection_t結(jié)構(gòu)體 */
    void            *data;
 
    /* 事件可寫(xiě) */   
    unsigned         write:1;
 
    /* 事件可建立新連接 */
    unsigned         accept:1;
 
    /* 檢測(cè)事件是否過(guò)期 */
    unsigned         instance:1;
 
    /* 通常將事件加入到epoll中會(huì)將該字段置為1 */
    unsigned         active:1;
 
    ......
 
    /* 事件超時(shí) */
    unsigned         timedout:1;
 
    /* 事件是否在定時(shí)器中 */
    unsigned         timer_set:1;
 
    ......
 
    /* 事件是否在延遲處理隊(duì)列中 */
    unsigned         posted:1;
 
    ......
 
    /* 事件的處理函數(shù) */
    ngx_event_handler_pt  handler;
 
    ......
 
    /* 定時(shí)器紅黑樹(shù)節(jié)點(diǎn) */
    ngx_rbtree_node_t   timer;
 
    /* 延遲處理隊(duì)列節(jié)點(diǎn) */
    ngx_queue_t      queue;
 
    ......
};

(2)ngx_connection_s結(jié)構(gòu)體代表一個(gè)nginx連接

struct ngx_connection_s {
    /* 若該結(jié)構(gòu)體未使用,則指向下一個(gè)為使用的ngx_connection_s,若已使用,則指向ngx_http_request_t */
    void               *data;
 
    /* 指向一個(gè)讀事件結(jié)構(gòu)體,這個(gè)讀事件結(jié)構(gòu)體表示該連接的讀事件 */
    ngx_event_t        *read;
 
    /* 指向一個(gè)寫(xiě)事件結(jié)構(gòu)體,這個(gè)寫(xiě)事件結(jié)構(gòu)體表示該連接的寫(xiě)事件 */
    ngx_event_t        *write;
 
    /* 連接的套接字 */
    ngx_socket_t        fd;
 
    ......
 
    /* 該連接對(duì)應(yīng)的監(jiān)聽(tīng)端口,表示是由該端口建立的連接 */
    ngx_listening_t    *listening;
 
    ......
};

下面介紹ngx_event_process_init函數(shù)的實(shí)現(xiàn),代碼如下:

/* 此方法在worker進(jìn)程初始化時(shí)調(diào)用 */
static ngx_int_t
ngx_event_process_init(ngx_cycle_t *cycle)
{
    ......
 
    /* 打開(kāi)accept_mutex負(fù)載均衡鎖,用于防止驚群 */
    if (ccf->master && ccf->worker_processes > 1 && ecf->accept_mutex) {
        ngx_use_accept_mutex = 1;
        ngx_accept_mutex_held = 0;
        ngx_accept_mutex_delay = ecf->accept_mutex_delay;
 
    } else {
        ngx_use_accept_mutex = 0;
    }
 
    /* 初始化兩個(gè)隊(duì)列,一個(gè)用于存放不能及時(shí)處理的建立連接事件,一個(gè)用于存儲(chǔ)不能及時(shí)處理的讀寫(xiě)事件 */
    ngx_queue_init(&ngx_posted_accept_events);
    ngx_queue_init(&ngx_posted_events);
 
    /* 初始化定時(shí)器 */
    if (ngx_event_timer_init(cycle->log) == NGX_ERROR) {
        return NGX_ERROR;
    }
 
    /**
      * 調(diào)用使用的ngx_epoll_module的ctx的actions的init方法,即ngx_epoll_init函數(shù)
      * 該函數(shù)主要的作用是調(diào)用epoll_create()和創(chuàng)建用于epoll_wait()返回事件鏈表的event_list
      **/
    for (m = 0; cycle->modules[m]; m++) {
        ......
 
        if (module->actions.init(cycle, ngx_timer_resolution) != NGX_OK) {
            exit(2);
        }
 
        break;
    }
 
    /* 如果在配置中設(shè)置了timer_resolution,則要設(shè)置控制時(shí)間精度。通過(guò)setitimer方法會(huì)設(shè)置一個(gè)定時(shí)器,每隔timer_resolution的時(shí)間會(huì)發(fā)送一個(gè)SIGALRM信號(hào) */
    if (ngx_timer_resolution && !(ngx_event_flags & NGX_USE_TIMER_EVENT)) {
        ......
        sa.sa_handler = ngx_timer_signal_handler;
        sigemptyset(&sa.sa_mask);
 
        if (sigaction(SIGALRM, &sa, NULL) == -1) {
            ......
        }
 
        itv.it_interval.tv_sec = ngx_timer_resolution / 1000;
        ......
 
        if (setitimer(ITIMER_REAL, &itv, NULL) == -1) {
            ......
        }
    }
 
    ......
 
    /* 分配連接池空間 */
    cycle->connections =
        ngx_alloc(sizeof(ngx_connection_t) * cycle->connection_n, cycle->log);
    ......
 
    c = cycle->connections;
 
    /* 分配讀事件結(jié)構(gòu)體數(shù)組空間,并初始化讀事件的closed和instance */
    cycle->read_events = ngx_alloc(sizeof(ngx_event_t) * cycle->connection_n,
                                   cycle->log);
    ......
 
    rev = cycle->read_events;
    for (i = 0; i < cycle->connection_n; i++) {
        rev[i].closed = 1;
        rev[i].instance = 1;
    }
 
    /* 分配寫(xiě)事件結(jié)構(gòu)體數(shù)組空間,并初始化寫(xiě)事件的closed */
    cycle->write_events = ngx_alloc(sizeof(ngx_event_t) * cycle->connection_n,
                                    cycle->log);
    ......
 
    wev = cycle->write_events;
    for (i = 0; i < cycle->connection_n; i++) {
        wev[i].closed = 1;
    }
 
    /* 將序號(hào)為i的讀事件結(jié)構(gòu)體和寫(xiě)事件結(jié)構(gòu)體賦值給序號(hào)為i的connections結(jié)構(gòu)體的元素 */
    i = cycle->connection_n;
    next = NULL;
 
    do {
        i--;
         
        /* 將connection的data字段設(shè)置為下一個(gè)connection */
        c[i].data = next;
        c[i].read = &cycle->read_events[i];
        c[i].write = &cycle->write_events[i];
        c[i].fd = (ngx_socket_t) -1;
 
        next = &c[i];
    } while (i);
 
    /* 初始化cycle->free_connections */
    cycle->free_connections = next;
    cycle->free_connection_n = cycle->connection_n;
     
    /* 為每個(gè)監(jiān)聽(tīng)端口分配連接 */
    ls = cycle->listening.elts;
    for (i = 0; i < cycle->listening.nelts; i++) {
 
        ......
 
        c = ngx_get_connection(ls[i].fd, cycle->log);
 
        ......
 
        rev = c->read;
 
        ......
 
        /* 為監(jiān)聽(tīng)的端口的connection結(jié)構(gòu)體的read事件設(shè)置回調(diào)函數(shù) */
        rev->handler = (c->type == SOCK_STREAM) ? ngx_event_accept
                                                : ngx_event_recvmsg;
                                  
        /* 將監(jiān)聽(tīng)的connection的read事件添加到事件驅(qū)動(dòng)模塊(epoll) */
        ......
        if (ngx_add_event(rev, NGX_READ_EVENT, 0) == NGX_ERROR) {
            return NGX_ERROR;
        }
 
    }
 
    return NGX_OK;
}

該方法主要做了下面幾件事:

(1)打開(kāi)accept_mutex負(fù)載均衡鎖,用于防止驚群。驚群是指當(dāng)多個(gè)worker都處于等待事件狀態(tài),如果突然來(lái)了一個(gè)請(qǐng)求,就會(huì)同時(shí)喚醒多個(gè)worker,但是只有一個(gè)worker會(huì)處理該請(qǐng)求,這就造成系統(tǒng)資源浪費(fèi)。為了解決這個(gè)問(wèn)題,nginx使用了accept_mutex負(fù)載均衡鎖。各個(gè)worker首先會(huì)搶鎖,搶到鎖的worker才會(huì)監(jiān)聽(tīng)各個(gè)端口。

(2)初始化兩個(gè)隊(duì)列,一個(gè)用于存放不能及時(shí)處理的建立連接事件,一個(gè)用于存儲(chǔ)不能及時(shí)處理的讀寫(xiě)事件。

(3)初始化定時(shí)器,該定時(shí)器就是一顆紅黑樹(shù),根據(jù)時(shí)間對(duì)事件進(jìn)行排序。

(4)調(diào)用使用的ngx_epoll_module的ctx的actions的init方法,即ngx_epoll_init函數(shù)。該函數(shù)較為簡(jiǎn)單,主要的作用是調(diào)用epoll_create()和創(chuàng)建用于存儲(chǔ)epoll_wait()返回事件的鏈表event_list。

(5)如果再配置中設(shè)置了timer_resolution,則要設(shè)置控制時(shí)間精度,用于控制nginx時(shí)間。這部分在第五部分重點(diǎn)講解。

(6)分配連接池空間、讀事件結(jié)構(gòu)體數(shù)組、寫(xiě)事件結(jié)構(gòu)體數(shù)組。

上文介紹了ngx_connection_s和ngx_event_s結(jié)構(gòu)體,我們了解到每一個(gè)ngx_connection_s結(jié)構(gòu)體都有兩個(gè)ngx_event_s結(jié)構(gòu)體,一個(gè)讀事件,一個(gè)寫(xiě)事件。在這個(gè)階段,會(huì)向內(nèi)存池中申請(qǐng)三個(gè)數(shù)組:cycle->connections、cycle->read_events和cycle->write_events,并將序號(hào)為i的讀事件結(jié)構(gòu)體和寫(xiě)事件結(jié)構(gòu)體賦值給序號(hào)為i的connections結(jié)構(gòu)體的元素。并將cycle->free_connections指向第一個(gè)未使用的ngx_connections結(jié)構(gòu)體。

(7)為每個(gè)監(jiān)聽(tīng)端口分配連接

在此階段,會(huì)獲取cycle->listening數(shù)組中的ngx_listening_s結(jié)構(gòu)體元素。在3.1.2小節(jié)中,我們已經(jīng)講了nginx啟動(dòng)進(jìn)程會(huì)監(jiān)聽(tīng)端口,并將socket連接的fd存儲(chǔ)在cycle->listening數(shù)組中。在這里,會(huì)獲取到3.1.2小節(jié)中監(jiān)聽(tīng)的端口,并為每個(gè)監(jiān)聽(tīng)分配連接結(jié)構(gòu)體。

(8)為每個(gè)監(jiān)聽(tīng)端口的連接的讀事件設(shè)置handler

在為cycle->listening的元素分配完ngx_connection_s類(lèi)型的連接后,會(huì)為連接的讀事件設(shè)置回調(diào)方法handler。這里handler為ngx_event_accept函數(shù),對(duì)于該函數(shù),將在后文講解。

(9)將每個(gè)監(jiān)聽(tīng)端口的連接的讀事件添加到epoll中

在此處,會(huì)調(diào)用ngx_epoll_module的ngx_epoll_add_event函數(shù),將監(jiān)聽(tīng)端口的連接的讀事件(ls[i].connection->read)添加到epoll中。ngx_epoll_add_event函數(shù)的流程如下:

在向epoll中添加事件前,需要判斷之前是否添加過(guò)該連接的事件。

至此,ngx_event_process_init的工作完成,事件模塊的初始化也完成了。后面worker開(kāi)始進(jìn)入循環(huán)監(jiān)聽(tīng)階段。

四、事件處理 4.1 worker的主循環(huán)函數(shù)ngx_worker_process_cycle

worker在初始化完成之后,開(kāi)始循環(huán)監(jiān)聽(tīng)端口,并處理請(qǐng)求。下面開(kāi)始我們開(kāi)始講解worker是如何處理事件的。worker的循環(huán)代碼如下:

static void
ngx_worker_process_cycle(ngx_cycle_t *cycle, void *data)
{
    ngx_int_t worker = (intptr_t) data;
 
    ngx_process = NGX_PROCESS_WORKER;
    ngx_worker = worker;
 
    /* 初始化worker */
    ngx_worker_process_init(cycle, worker);
 
    ngx_setproctitle("worker process");
 
    for ( ;; ) {
 
        if (ngx_exiting) {
            ......
        }
 
        ngx_log_debug0(NGX_LOG_DEBUG_EVENT, cycle->log, 0, "worker cycle");
 
        /* 處理IO事件和時(shí)間事件 */
        ngx_process_events_and_timers(cycle);
 
        if (ngx_terminate) {
            ......
        }
 
        if (ngx_quit) {
            ......
        }
 
        if (ngx_reopen) {
            ......
        }
    }
}

可以看到,在worker初始化后進(jìn)入一個(gè)for循環(huán),所有的IO事件和時(shí)間事件都是在函數(shù)ngx_process_events_and_timers中處理的。

4.2 worker的事件處理函數(shù)ngx_process_events_and_timers

在worker的主循環(huán)中,所有的事件都是通過(guò)函數(shù)ngx_process_events_and_timers處理的,該函數(shù)的代碼如下:

/* 事件處理函數(shù)和定時(shí)器處理函數(shù) */
void
ngx_process_events_and_timers(ngx_cycle_t *cycle)
{
    ngx_uint_t  flags;
    ngx_msec_t  timer, delta;
 
    /* timer_resolution模式,設(shè)置epoll_wait函數(shù)阻塞ngx_timer_resolution的時(shí)間 */
    if (ngx_timer_resolution) {
        /* timer_resolution模式 */
        timer = NGX_TIMER_INFINITE;
        flags = 0;
 
    } else {
        /* 非timer_resolution模式,epoll_wait函數(shù)等待至下一個(gè)定時(shí)器事件到來(lái)時(shí)返回 */
        timer = ngx_event_find_timer();
        flags = NGX_UPDATE_TIME;
    }
 
    /* 是否使用accept_mutex */
    if (ngx_use_accept_mutex) {
        /**
         * 該worker是否負(fù)載過(guò)高,若負(fù)載過(guò)高則不搶鎖
         * 判斷負(fù)載過(guò)高是判斷該worker建立的連接數(shù)是否大于該worker可以建立的最大連接數(shù)的7/8
         **/
        if (ngx_accept_disabled > 0) {
            ngx_accept_disabled--;
 
        } else {
            /* 搶鎖 */
            if (ngx_trylock_accept_mutex(cycle) == NGX_ERROR) {
                return;
            }
 
            if (ngx_accept_mutex_held) {
                /* 搶到鎖,則收到事件后暫不處理,先扔到事件隊(duì)列中 */
                flags |= NGX_POST_EVENTS;
 
            } else {
                /* 未搶到鎖,要修改worker在epoll_wait函數(shù)等待的時(shí)間,使其不要過(guò)大 */
                if (timer == NGX_TIMER_INFINITE
                    || timer > ngx_accept_mutex_delay)
                {
                    timer = ngx_accept_mutex_delay;
                }
            }
        }
    }
 
    /* delta用于計(jì)算ngx_process_events的耗時(shí) */
    delta = ngx_current_msec;
 
    /* 事件處理函數(shù),epoll使用的是ngx_epoll_process_events函數(shù) */
    (void) ngx_process_events(cycle, timer, flags);
 
    delta = ngx_current_msec - delta;
 
    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                   "timer delta: %M", delta);
 
    /* 處理ngx_posted_accept_events隊(duì)列的連接事件 */
    ngx_event_process_posted(cycle, &ngx_posted_accept_events);
 
    /* 若持有accept_mutex,則釋放鎖 */
    if (ngx_accept_mutex_held) {
        ngx_shmtx_unlock(&ngx_accept_mutex);
    }
 
    /* 若事件處理函數(shù)的執(zhí)行時(shí)間不為0,則要處理定時(shí)器事件 */
    if (delta) {
        ngx_event_expire_timers();
    }
 
    /* 處理ngx_posted_events隊(duì)列的讀寫(xiě)事件 */
    ngx_event_process_posted(cycle, &ngx_posted_events);
}

ngx_process_events_and_timers函數(shù)是nginx處理事件的核心函數(shù),主要的工作可以分為下面幾部分:

(1)設(shè)置nginx更新時(shí)間的方式。

nginx會(huì)將時(shí)間存儲(chǔ)在內(nèi)存中,每隔一段時(shí)間調(diào)用ngx_time_update函數(shù)更新時(shí)間。那么多久更新一次呢?nginx提供兩種方式:

方式一:timer_resolution模式。在nginx配置文件中,可以使用timer_resolution之類(lèi)來(lái)選擇此方式。如果使用此方式,會(huì)將epoll_wait的阻塞時(shí)間設(shè)置為無(wú)窮大,即一直阻塞。那么如果nginx一直都沒(méi)有收到事件,會(huì)一直阻塞嗎?答案是不會(huì)的。在本文3.2節(jié)中講解的ngx_event_process_init函數(shù)(第5步)將會(huì)設(shè)置一個(gè)時(shí)間定時(shí)器和一個(gè)信號(hào)處理函數(shù),其中時(shí)間定時(shí)器會(huì)每隔timer_resolution的時(shí)間發(fā)送一個(gè)SIGALRM信號(hào),而當(dāng)worker收到時(shí)間定時(shí)器發(fā)送的信號(hào),會(huì)將epoll_wait函數(shù)終端,同時(shí)調(diào)用SIGALRM信號(hào)的中斷處理函數(shù),將全局變量ngx_event_timer_alarm置為1。后面會(huì)檢查該變量,調(diào)用ngx_time_update函數(shù)來(lái)更新nginx的時(shí)間。

方式二:如果不在配置文件中設(shè)置timer_resolution,nginx默認(rèn)會(huì)使用方式二來(lái)更新nginx的時(shí)間。首先會(huì)調(diào)用ngx_event_find_timer函數(shù)來(lái)設(shè)置epoll_wait的阻塞時(shí)間,ngx_event_find_timer函數(shù)返回的是下一個(gè)時(shí)間事件發(fā)生的時(shí)間與當(dāng)前時(shí)間的差值,即讓epoll_wait阻塞到下一個(gè)時(shí)間事件發(fā)生為止。當(dāng)使用這種模式,每當(dāng)epoll_wait返回,都會(huì)調(diào)用ngx_time_update函數(shù)更新時(shí)間。

(2)使用負(fù)載均衡鎖ngx_use_accept_mutex。

上文曾經(jīng)提過(guò)一個(gè)問(wèn)題,當(dāng)多個(gè)worker都處于等待事件狀態(tài),如果突然來(lái)了一個(gè)請(qǐng)求,就會(huì)同時(shí)喚醒多個(gè)worker,但是只有一個(gè)worker會(huì)處理該請(qǐng)求,這就造成系統(tǒng)資源浪費(fèi)。nginx如果解決這個(gè)問(wèn)題呢?答案就是使用一個(gè)鎖來(lái)解決。在監(jiān)聽(tīng)事件前,各個(gè)worker會(huì)進(jìn)行一次搶鎖行為,只有搶到鎖的worker才會(huì)監(jiān)聽(tīng)端口,而其他worker值處理已經(jīng)建立連接的事件。

首先函數(shù)會(huì)通過(guò)ngx_accept_disabled是否大于0來(lái)判斷是否過(guò)載,過(guò)載的worker是不允許搶鎖的。ngx_accept_disabled的計(jì)算方式如下。

/**
 * ngx_cycle->connection_n是每個(gè)進(jìn)程最大連接數(shù),也是連接池的總連接數(shù),ngx_cycle->free_connection_n是連接池中未使用的連接數(shù)量。
 * 當(dāng)未使用的數(shù)量小于總數(shù)量的1/8時(shí),會(huì)使ngx_accept_disabled大于0。這時(shí)認(rèn)為該worker過(guò)載。
 **/
ngx_accept_disabled = ngx_cycle->connection_n / 8 - ngx_cycle->free_connection_n;

若ngx_accept_disabled小于0,worker可以搶鎖。這時(shí)會(huì)通過(guò)ngx_trylock_accept_mutex函數(shù)搶鎖。該函數(shù)的流程如下圖所示:

在搶鎖結(jié)束后,若worker搶到鎖,設(shè)置該worker的flag為NGX_POST_EVENTS,表示搶到鎖的這個(gè)worker在收到事件后并不會(huì)立即調(diào)用事件的處理函數(shù),而是會(huì)把事件放到一個(gè)隊(duì)列里,后期處理。

(3)調(diào)用事件處理函數(shù)ngx_process_events,epoll使用的是ngx_epoll_process_events函數(shù)。此代碼較為重要,下面是代碼:

static ngx_int_t
ngx_epoll_process_events(ngx_cycle_t *cycle, ngx_msec_t timer, ngx_uint_t flags)
{
    int                events;
     
    uint32_t           revents;
    ngx_int_t          instance, i;
    ngx_uint_t         level;
    ngx_err_t          err;
    ngx_event_t       *rev, *wev;
    ngx_queue_t       *queue;
    ngx_connection_t  *c;
 
    ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                   "epoll timer: %M", timer);
 
    /* 調(diào)用epoll_wait,從epoll中獲取發(fā)生的事件 */
    events = epoll_wait(ep, event_list, (int) nevents, timer);
 
    err = (events == -1) ? ngx_errno : 0;
 
    /* 兩種方式更新nginx時(shí)間,timer_resolution模式ngx_event_timer_alarm為1,非timer_resolution模式flags & NGX_UPDATE_TIME不為0,均會(huì)進(jìn)入if條件 */
    if (flags & NGX_UPDATE_TIME || ngx_event_timer_alarm) {
        ngx_time_update();
    }
 
    /* 處理epoll_wait返回為-1的情況 */
    if (err) {
 
        /**
         * 對(duì)于timer_resolution模式,如果worker接收到SIGALRM信號(hào),會(huì)調(diào)用該信號(hào)的處理函數(shù),將ngx_event_timer_alarm置為1,從而更新時(shí)間。
         * 同時(shí)如果在epoll_wait阻塞的過(guò)程中接收到SIGALRM信號(hào),會(huì)中斷epoll_wait,使其返回NGX_EINTR。由于上一步已經(jīng)更新了時(shí)間,這里要把ngx_event_timer_alarm置為0。
         **/
        if (err == NGX_EINTR) {
 
            if (ngx_event_timer_alarm) {
                ngx_event_timer_alarm = 0;
                return NGX_OK;
            }
 
            level = NGX_LOG_INFO;
 
        } else {
            level = NGX_LOG_ALERT;
        }
 
        ngx_log_error(level, cycle->log, err, "epoll_wait() failed");
        return NGX_ERROR;
    }
 
    /* 若events返回為0,判斷是因?yàn)閑poll_wait超時(shí)還是其他原因 */
    if (events == 0) {
        if (timer != NGX_TIMER_INFINITE) {
            return NGX_OK;
        }
 
        ngx_log_error(NGX_LOG_ALERT, cycle->log, 0,
                      "epoll_wait() returned no events without timeout");
        return NGX_ERROR;
    }
 
    /* 對(duì)epoll_wait返回的鏈表進(jìn)行遍歷 */
    for (i = 0; i < events; i++) {
        c = event_list[i].data.ptr;
 
        /* 從data中獲取connection & instance的值,并解析出instance和connection */
        instance = (uintptr_t) c & 1;
        c = (ngx_connection_t *) ((uintptr_t) c & (uintptr_t) ~1);
 
        /* 取出connection的read事件 */
        rev = c->read;
 
        /* 判斷讀事件是否過(guò)期 */
        if (c->fd == -1 || rev->instance != instance) {
            ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                           "epoll: stale event %p", c);
            continue;
        }
 
        /* 取出事件的類(lèi)型 */
        revents = event_list[i].events;
 
        ngx_log_debug3(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                       "epoll: fd:%d ev:%04XD d:%p",
                       c->fd, revents, event_list[i].data.ptr);
 
        /* 若連接發(fā)生錯(cuò)誤,則將EPOLLIN、EPOLLOUT添加到revents中,在調(diào)用讀寫(xiě)事件時(shí)能夠處理連接的錯(cuò)誤 */
        if (revents & (EPOLLERR|EPOLLHUP)) {
            ngx_log_debug2(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                           "epoll_wait() error on fd:%d ev:%04XD",
                           c->fd, revents);
 
            revents |= EPOLLIN|EPOLLOUT;
        }
 
        /* 事件為讀事件且讀事件在epoll中 */
        if ((revents & EPOLLIN) && rev->active) {
 
#if (NGX_HAVE_EPOLLRDHUP)
            if (revents & EPOLLRDHUP) {
                rev->pending_eof = 1;
            }
 
            rev->available = 1;
#endif
 
            rev->ready = 1;
 
            /* 事件是否需要延遲處理?對(duì)于搶到鎖監(jiān)聽(tīng)端口的worker,會(huì)將事件延遲處理 */
            if (flags & NGX_POST_EVENTS) {
                /* 根據(jù)事件的是否是accept事件,加到不同的隊(duì)列中 */
                queue = rev->accept ? &ngx_posted_accept_events
                                    : &ngx_posted_events;
 
                ngx_post_event(rev, queue);
 
            } else {
                /* 若不需要延遲處理,直接調(diào)用read事件的handler */
                rev->handler(rev);
            }
        }
 
        /* 取出connection的write事件 */
        wev = c->write;
 
        /* 事件為寫(xiě)事件且寫(xiě)事件在epoll中 */
        if ((revents & EPOLLOUT) && wev->active) {
 
            /* 判斷寫(xiě)事件是否過(guò)期 */
            if (c->fd == -1 || wev->instance != instance) {
                ngx_log_debug1(NGX_LOG_DEBUG_EVENT, cycle->log, 0,
                               "epoll: stale event %p", c);
                continue;
            }
 
            wev->ready = 1;
#if (NGX_THREADS)
            wev->complete = 1;
#endif
 
            /* 事件是否需要延遲處理?對(duì)于搶到鎖監(jiān)聽(tīng)端口的worker,會(huì)將事件延遲處理 */
            if (flags & NGX_POST_EVENTS) {
                ngx_post_event(wev, &ngx_posted_events);
 
            } else {
                /* 若不需要延遲處理,直接調(diào)用write事件的handler */
                wev->handler(wev);
            }
        }
    }
 
    return NGX_OK;
}

該函數(shù)的流程圖如下:

(4)計(jì)算ngx_process_events函數(shù)的調(diào)用時(shí)間。

(5)處理ngx_posted_accept_events隊(duì)列的連接事件。這里就是遍歷ngx_posted_accept_events隊(duì)列,調(diào)用事件的handler方法,這里accept事件的handler為ngx_event_accept。

(6)釋放負(fù)載均衡鎖。

(7)處理定時(shí)器事件,具體操作是在定時(shí)器紅黑樹(shù)中查找過(guò)期的事件,調(diào)用其handler方法。

(8)處理ngx_posted_events隊(duì)列的讀寫(xiě)事件,即遍歷ngx_posted_events隊(duì)列,調(diào)用事件的handler方法。

結(jié)束

至此,我們介紹完了nginx事件模塊的事件處理函數(shù)ngx_process_events_and_timers。nginx事件模塊的相關(guān)知識(shí)也初步介紹完了。

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/40152.html

相關(guān)文章

  • Nginx源碼研究nginx限流模塊詳解

    摘要:限流算法最簡(jiǎn)單粗暴的限流算法就是計(jì)數(shù)器法了,而比較常用的有漏桶算法和令牌桶算法計(jì)數(shù)器計(jì)數(shù)器法是限流算法里最簡(jiǎn)單也是最容易實(shí)現(xiàn)的一種算法。 運(yùn)營(yíng)研發(fā)團(tuán)隊(duì) 李樂(lè) 高并發(fā)系統(tǒng)有三把利器:緩存、降級(jí)和限流; 限流的目的是通過(guò)對(duì)并發(fā)訪(fǎng)問(wèn)/請(qǐng)求進(jìn)行限速來(lái)保護(hù)系統(tǒng),一旦達(dá)到限制速率則可以拒絕服務(wù)(定向到錯(cuò)誤頁(yè))、排隊(duì)等待(秒殺)、降級(jí)(返回兜底數(shù)據(jù)或默認(rèn)數(shù)據(jù)); 高并發(fā)系統(tǒng)常見(jiàn)的限流有:限制總并發(fā)...

    voyagelab 評(píng)論0 收藏0
  • 我眼中 Nginx(五):Nginx — 子請(qǐng)求設(shè)計(jì)之道

    摘要:上圖中,每個(gè)紅圈表示一個(gè)請(qǐng)求,每一層的請(qǐng)求分別是上一層請(qǐng)求的子請(qǐng)求。換而言之,父請(qǐng)求是依賴(lài)于子請(qǐng)求的。特別地,的子請(qǐng)求運(yùn)行時(shí),會(huì)阻塞父請(qǐng)求掛起其對(duì)應(yīng)的協(xié)程。 張超:又拍云系統(tǒng)開(kāi)發(fā)高級(jí)工程師,負(fù)責(zé)又拍云 CDN 平臺(tái)相關(guān)組件的更新及維護(hù)。Github ID: tokers,活躍于 OpenResty 社區(qū)和 Nginx 郵件列表等開(kāi)源社區(qū),專(zhuān)注于服務(wù)端技術(shù)的研究;曾為 ngx_lua 貢...

    Jioby 評(píng)論0 收藏0
  • Nginx源碼研究】?jī)?nèi)存管理部分

    摘要:而對(duì)于堆內(nèi)存,通常需要程序員進(jìn)行管理。二內(nèi)存池管理說(shuō)明本部分使用的版本為具體源碼參見(jiàn)文件實(shí)現(xiàn)使用流程內(nèi)存池的使用較為簡(jiǎn)單可以分為步,調(diào)用函數(shù)獲取指針。將內(nèi)存塊按照的整數(shù)次冪進(jìn)行劃分最小為最大為。 運(yùn)營(yíng)研發(fā)團(tuán)隊(duì) 施洪寶 一. 概述 應(yīng)用程序的內(nèi)存可以簡(jiǎn)單分為堆內(nèi)存,棧內(nèi)存。對(duì)于棧內(nèi)存而言,在函數(shù)編譯時(shí),編譯器會(huì)插入移動(dòng)棧當(dāng)前指針位置的代碼,實(shí)現(xiàn)??臻g的自管理。而對(duì)于堆內(nèi)存,通常需要程序...

    sarva 評(píng)論0 收藏0
  • Nginx源碼分析】Nginx配置文件解析(一)

    摘要:本文將從源碼從此深入分析配置文件的解析,配置存儲(chǔ),與配置查找。在學(xué)習(xí)配置文件的解析過(guò)程之前,需要先了解一下模塊與指令的一些基本知識(shí)。 運(yùn)營(yíng)研發(fā)團(tuán)隊(duì) 李樂(lè) 配置文件是nginx的基礎(chǔ),對(duì)于學(xué)習(xí)nginx源碼甚至開(kāi)發(fā)nginx模塊的同學(xué)來(lái)說(shuō)更是必須深究。本文將從源碼從此深入分析nginx配置文件的解析,配置存儲(chǔ),與配置查找。 看本文之前讀者可以先思考兩個(gè)問(wèn)題: 1.nginx源碼中隨處可以...

    JasonZhang 評(píng)論0 收藏0
  • nginx架構(gòu)

    摘要:反向代理反向代理反向代理負(fù)載均衡鑒權(quán)限流等邏輯架構(gòu)在邏輯上分為入口層,模塊化的功能處理層,系統(tǒng)調(diào)用層。多個(gè)共同監(jiān)聽(tīng)事件并處理,反向代理會(huì)把請(qǐng)求轉(zhuǎn)發(fā)給后端服務(wù)。 一.概述 本文將深入剖析nginx的架構(gòu)。 第一部分介紹nginx現(xiàn)有框架,用典型的4+1視圖闡述,包括邏輯架構(gòu),開(kāi)發(fā)架構(gòu),運(yùn)行架構(gòu),物理架構(gòu),功能用例,nginx為單機(jī)服務(wù),不考慮物理架構(gòu)。其中功能用例概述nginx功能;邏輯...

    smartlion 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

heartFollower

|高級(jí)講師

TA的文章

閱讀更多
最新活動(dòng)
閱讀需要支付1元查看
<