baiyan
全部視頻:https://segmentfault.com/a/11...
復(fù)習(xí) 基本概念
首先復(fù)習(xí)幾個基本概念:
opline:在zend虛擬機(jī)中,每條指令都是一個opline,每個opline由操作數(shù)、指令操作、返回值組成
opcode:每個指令操作都對應(yīng)一個opcode(如ZEND_ASSIGN/ZEND_ADD等等),在PHP7中,有100多種指令操作,所有的指令集被稱作opcodes
handler:每個opcode指令操作都對應(yīng)一個handler指令處理函數(shù),處理函數(shù)中有具體的指令操作執(zhí)行邏輯
我們知道,在經(jīng)過編譯階段(zend_compile函數(shù))中,我們生成AST并對其遍歷,生成一條條指令,每一條指令都是一個opline。之后通過pass_two函數(shù)生成了這些指令所對應(yīng)的handler,這些信息均存在op_array中。既然指令和handler已經(jīng)生成完畢,接下來的任務(wù)就是要交給zend虛擬機(jī),加載這些指令,并最終執(zhí)行對應(yīng)的handler邏輯。
指令在PHP7中,由以下元素構(gòu)成:
struct _zend_op { const void *handler; //操作執(zhí)行的函數(shù) znode_op op1; //操作數(shù)1 znode_op op2; //操作數(shù)2 znode_op result; //返回值 uint32_t extended_value; //擴(kuò)展值 uint32_t lineno; //行號 zend_uchar opcode; //opcode值 zend_uchar op1_type; //操作數(shù)1的類型 zend_uchar op2_type; //操作數(shù)2的類型 zend_uchar result_type; //返回值的類型 };
在PHP7中,每個操作數(shù)有5種類型可選,如下:
#define IS_CONST (1<<0) #define IS_TMP_VAR (1<<1) #define IS_VAR (1<<2) #define IS_UNUSED (1<<3) /* Unused variable */ #define IS_CV (1<<4) /* Compiled variable */
IS_CONST類型:值為1,表示常量,如$a = 1中的1或者$a = "hello world"中的hello world
IS_TMP_VAR類型:值為2,表示臨時變量,如$a=”123”.time(); 這里拼接的臨時變量”123”.time()的類型就是IS_TMP_VAR,一般用于操作的中間結(jié)果
IS_VAR類型:值為4,表示變量,但是這個變量并不是PHP中常見的聲明變量,而是返回的臨時變量,如$a = time()中的time()
IS_UNUSED:值為8,表示沒有使用的操作數(shù)
IS_CV:值為16,表示形如$a這樣的變量
對AST進(jìn)行遍歷之后,最終存放所有指令集(oplines)的地方為op_array:
struct _zend_op_array { uint32_t last; //下面oplines數(shù)組大小 zend_op *opcodes; //oplines數(shù)組,存放所有指令 int last_var;//操作數(shù)類型為IS_CV的個數(shù) uint32_t T;//操作數(shù)類型為IS_VAR和IS_TMP_VAR的個數(shù)之和 zend_string **vars;//存放IS_CV類型操作數(shù)的數(shù)組 ... int last_literal;//下面常量數(shù)組大小 zval *literals;//存放IS_CONST類型操作數(shù)的數(shù)組 };op_array的存儲情況
為了復(fù)習(xí)op_array的存儲情況,我們具體gdb一下,使用下面的測試用例:
根據(jù)以上測試用例,在zend_execute處打一個斷點(diǎn),這里完成了對AST的遍歷并生成了最終的op_array,已經(jīng)進(jìn)入到虛擬機(jī)執(zhí)行指令的入口。首先我們先觀察傳入的參數(shù)op_array,它是經(jīng)過AST遍歷之后生成的最終的op_array:
last = 2;表示一共有兩個opcodes:一個是賦值A(chǔ)SSIGN,另一個是腳本為我們自動生成的返回語句return 1,opcodes是一個數(shù)組,每個數(shù)組單元具體存儲了每條指令的信息(操作數(shù)、返回值等等),我們打印一下數(shù)組的內(nèi)容:
last_var = 1;表示有一個CV類型的變量,這里就是$a
T = 1;表示IS_TMP_VAR和IS_VAR變量類型的數(shù)量之和,而我們腳本中并沒有這樣的變量,它是在存儲中間的返回值的時候,這個返回值類型就是一個IS_VAR類型,所以T的值一開始就為1
vars是一個二級指針,可以理解為外層的一級指針首先指向一個數(shù)組,這個數(shù)組里每個存儲單元都是一個zend_string*類型的指針,而每個指針都指向了一個zend_string結(jié)構(gòu)體,我們打印數(shù)組第一個單元的值,發(fā)現(xiàn)其指向的zend_string值為a:
last_literal = 2;表示腳本中一共有2個常量,一個是我們自己復(fù)制的值2,另一個是腳本為我們自動生成的返回語句return 1中的值1:
literals是一個zend_array,里面每一個單元都是一個zval,存儲這些常量的實(shí)際的值,我們可以看到,其值為2和1,與上面的描述相符:
我們可以畫出最終的op_array存儲結(jié)構(gòu)圖:
這樣一來,我們就可以清晰地看出指令在op_array中是如何存儲的。那么接下來,我們需要將其加載到虛擬機(jī)的執(zhí)行棧楨上,來最終執(zhí)行這些指令。
在虛擬機(jī)上執(zhí)行指令下面讓我們真正執(zhí)行op_array中的指令,執(zhí)行指令的入口為zend_execute函數(shù),傳入?yún)?shù)為op_array以及一個zval指針:
ZEND_API void zend_execute(zend_op_array *op_array, zval *return_value) { zend_execute_data *execute_data; if (EG(exception) != NULL) { return; } execute_data = zend_vm_stack_push_call_frame(ZEND_CALL_TOP_CODE | ZEND_CALL_HAS_SYMBOL_TABLE, (zend_function*)op_array, 0, zend_get_called_scope(EG(current_execute_data)), zend_get_this_object(EG(current_execute_data))); if (EG(current_execute_data)) { execute_data->symbol_table = zend_rebuild_symbol_table(); } else { execute_data->symbol_table = &EG(symbol_table); } EX(prev_execute_data) = EG(current_execute_data); i_init_code_execute_data(execute_data, op_array, return_value); zend_execute_ex(execute_data); zend_vm_stack_free_call_frame(execute_data); }觀察第一行,聲明了一個zend_execute_data類型的指針,這個類型非常重要,存儲了虛擬機(jī)執(zhí)行指令時的基本信息:
struct _zend_execute_data { const zend_op *opline; //當(dāng)前執(zhí)行的指令 8B zend_execute_data *call; //指向自己的指針 8B zval *return_value; //存儲返回值 8B zend_function *func; //執(zhí)行的函數(shù) 8B zval This; /* this + call_info + num_args 16B */ zend_execute_data *prev_execute_data; //鏈表,指向前一個zend_execute_data 8B zend_array *symbol_table; //符號表 8B #if ZEND_EX_USE_RUN_TIME_CACHE void **run_time_cache; /* cache op_array->run_time_cache 8B*/ #endif #if ZEND_EX_USE_LITERALS zval *literals; /* cache op_array->literals 8B */ #endif };可以看到,這個zend_execute_data一共是80個字節(jié)
隨后執(zhí)行zend_vm_stack_push_call_frame(ZEND_CALL_TOP_CODE | ZEND_CALL_HAS_SYMBOL_TABLE,(zend_function*)op_array, 0, zend_get_called_scope(EG(current_execute_data)), zend_get_this_object(EG(current_execute_data)));這個函數(shù),我們s進(jìn)去看下:
static zend_always_inline zend_execute_data *zend_vm_stack_push_call_frame(uint32_t call_info, zend_function *func, uint32_t num_args, zend_class_entry *called_scope, zend_object *object) { uint32_t used_stack = zend_vm_calc_used_stack(num_args, func); return zend_vm_stack_push_call_frame_ex(used_stack, call_info, func, num_args, called_scope, object); }先不看復(fù)雜的函數(shù)參數(shù),直接看zend_vm_calc_used_stack(num_args, func);這個函數(shù)調(diào)用,它用來計算虛擬機(jī)在執(zhí)行棧楨上所用的空間,此時應(yīng)該沒有占用任何空間,我們打印一下used_stack:
發(fā)現(xiàn)這里的used_stack果然是0,然后進(jìn)入下一個if中,繼續(xù)執(zhí)行used_stack += func->op_array.last_var + func->op_array.T - MIN(func->op_array.num_args, num_args);這個與函數(shù)相關(guān),我們還沒有講,那么我們直接看這個函數(shù)外層返回的used_stack值,為112B:
那么繼續(xù)往下執(zhí)行zend_vm_stack_push_call_frame_ex(used_stack, call_info,func, num_args, called_scope, object):
static zend_always_inline zend_execute_data *zend_vm_stack_push_call_frame_ex(uint32_t used_stack, uint32_t call_info, zend_function *func, uint32_t num_args, zend_class_entry *called_scope, zend_object *object) { zend_execute_data *call = (zend_execute_data*)EG(vm_stack_top); ZEND_ASSERT_VM_STACK_GLOBAL; if (UNEXPECTED(used_stack > (size_t)(((char*)EG(vm_stack_end)) - (char*)call))) { call = (zend_execute_data*)zend_vm_stack_extend(used_stack); ZEND_ASSERT_VM_STACK_GLOBAL; zend_vm_init_call_frame(call, call_info | ZEND_CALL_ALLOCATED, func, num_args, called_scope, object); return call; } else { EG(vm_stack_top) = (zval*)((char*)call + used_stack); zend_vm_init_call_frame(call, call_info, func, num_args, called_scope, object); return call; } }同樣忽略復(fù)雜的函數(shù)參數(shù),只關(guān)注傳入的used_stack = 112即可。我們首先看第一行:把executor_globals中的vm_stack_top字段賦值給當(dāng)前的zend_execute_data指向自己的指針,說明zend_execute_data的起始地址為EG這個宏的返回值,查看這個值:
可以看到,zend_execute_data的起始地址為0x7ffff5e1c030,繼續(xù)往下執(zhí)行代碼:
下面的if是用來判斷棧上是否有足夠的空間,如果已經(jīng)使用的??臻g太多,那么需要重新分配棧空間,顯然我們這里沒有進(jìn)這個if,說明??臻g還是夠的,那么執(zhí)行下面的else。重點(diǎn)在于:
EG(vm_stack_top) = (zval*)((char*)call + used_stack);現(xiàn)在這個棧頂?shù)奈恢米兂闪?x7ffff5e1c0a0,也就是0x7ffff5e1c030 + 112的結(jié)果。至于指針加法步長的運(yùn)算,本質(zhì)上就是地址a + 步長 * sizeof(地址類型)(地址類型如果是char *,步長就是1;如果是Int *,步長就是4),舉例子:
int *p; p+3;假如p的地址是0x7ffff5e1c030,那么p+3的結(jié)果就應(yīng)該是0x7ffff5e1c030 + 3 * sizeof(int) = 0x7ffff5e1c03c
我們畫出此時棧上的結(jié)構(gòu)圖:
此時這個返回值call就是棧頂?shù)奈恢?,但是top指針并不指向棧頂,而是指向棧的中間:
接下來回到最外層的zend_execute函數(shù),繼續(xù)往下執(zhí)行:
可以看到,接下來將符號表中的內(nèi)容賦值給了execute_data中的symbol_table字段,這個符號表是一個zend_array,此時還只有幾個默認(rèn)的_GET這幾個預(yù)先添加的符號,并沒有我們自己的$a:
那么我們繼續(xù)往下走,關(guān)注i_init_code_execute_data()函數(shù):
static zend_always_inline void i_init_code_execute_data(zend_execute_data *execute_data, zend_op_array *op_array, zval *return_value) /* {{{ */ { ZEND_ASSERT(EX(func) == (zend_function*)op_array); EX(opline) = op_array->opcodes; EX(call) = NULL; EX(return_value) = return_value; zend_attach_symbol_table(execute_data); if (!op_array->run_time_cache) { op_array->run_time_cache = emalloc(op_array->cache_size); memset(op_array->run_time_cache, 0, op_array->cache_size); } EX_LOAD_RUN_TIME_CACHE(op_array); EX_LOAD_LITERALS(op_array); EG(current_execute_data) = execute_data; }這里的EX宏對應(yīng)全局變量execute_data,EG宏對應(yīng)全局變量executor_globals,要區(qū)分開
重點(diǎn)關(guān)注zend_attach_symbol_table(execute_data)函數(shù):
ZEND_API void zend_attach_symbol_table(zend_execute_data *execute_data) /* {{{ */ { zend_op_array *op_array = &execute_data->func->op_array; HashTable *ht = execute_data->symbol_table; /* copy real values from symbol table into CV slots and create INDIRECT references to CV in symbol table */ // 從符號表中拷貝真實(shí)的值到CV槽中,并且創(chuàng)建對符號表中CV變量的間接引用 if (EXPECTED(op_array->last_var)) { zend_string **str = op_array->vars; zend_string **end = str + op_array->last_var; zval *var = EX_VAR_NUM(0); do { zval *zv = zend_hash_find(ht, *str); if (zv) { if (Z_TYPE_P(zv) == IS_INDIRECT) { zval *val = Z_INDIRECT_P(zv); ZVAL_COPY_VALUE(var, val); } else { ZVAL_COPY_VALUE(var, zv); } } else { ZVAL_UNDEF(var); zv = zend_hash_add_new(ht, *str, var); } ZVAL_INDIRECT(zv, var); str++; var++; } while (str != end); } }我們此時的符號表只包含_GET這類默認(rèn)初始化的變量,并不包含我們自己的$a。首先進(jìn)入if,因?yàn)閘ast_var = 1($a),所以將str和end賦值,他們分別指向vars和vars后面1偏移量的位置,如圖:
接下來在符號表ht中遍歷,查找是否有$a這個CV型變量,現(xiàn)在肯定是沒有的,所以進(jìn)入else分支,執(zhí)行ZVAL_UNDEF(var)與zv = zend_hash_add_new(ht, *str, var);
上面 EX_VAR_NUM(0)這個宏是一個申請一個CV槽大小的空間,但是在這里我們沒有使用,所以ZVAL_UNDEF(var)將這個槽中的zval類型置為IS_UNDEF類型,然后通過zend_hash_add_new將$a加入到符號表這個zend_array中。那么如果下一次再引用$a的時候,就會走上面的if分支,這樣CV槽就有了用武之地。把$a拷貝到CV槽中,那么在符號表中通過間接引用找到它即可,就不用多次將其加入到符號表中,節(jié)省時間與空間。最后將str與var指針的位置往后挪,說明本次遍歷完成
回到i_init_code_execute_data函數(shù),下面幾行是用來操作運(yùn)行時緩存的代碼,我們暫時跳過,回到zend_execute主函數(shù),接下來會調(diào)用zend_execute()函數(shù),在這里真正執(zhí)行指令所對應(yīng)的handler邏輯:
賦值操作對應(yīng)的是ZEND_ASSIGN_SPEC_CV_CONST_RETVAL_UNUSED_HANDLER,我們看看這個handler里具體做了什么:
static ZEND_OPCODE_HANDLER_RET ZEND_FASTCALL ZEND_ASSIGN_SPEC_CV_CONST_RETVAL_UNUSED_HANDLER(ZEND_OPCODE_HANDLER_ARGS) { USE_OPLINE zval *value; zval *variable_ptr; SAVE_OPLINE(); //從literals數(shù)組中獲取op2對應(yīng)的值,也就是值2 value = EX_CONSTANT(opline->op2); //在execute_data的符號表中獲取op1的位置,也就是$a variable_ptr = _get_zval_ptr_cv_undef_BP_VAR_W(execute_data, opline->op1.var); ... //最終將1賦值給$a value = zend_assign_to_variable(variable_ptr, value, IS_CONST); ... }這樣,一個賦值指令就被虛擬機(jī)執(zhí)行完畢,那么還有一個return 1默認(rèn)的腳本返回值的指令,也是同理,這里不再展開,那么最終的虛擬機(jī)執(zhí)行棧楨的情況如下:
回到zend_execute主函數(shù),最后調(diào)用了zend_vm_stack_free_call_frame(execute_data)函數(shù),最終釋放虛擬機(jī)占用的??臻g,完畢。
參考資料【PHP7源碼分析】PHP7源碼研究之淺談Zend虛擬機(jī)
【PHP7源碼分析】如何理解PHP虛擬機(jī)(一)
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/31649.html
摘要:此文用于匯總跟隨陳雷老師及團(tuán)隊(duì)的視頻,學(xué)習(xí)源碼過程中的思考整理與心得體會,此文會不斷更新視頻傳送門每日學(xué)習(xí)記錄使用錄像設(shè)備記錄每天的學(xué)習(xí)源碼學(xué)習(xí)源碼學(xué)習(xí)內(nèi)存管理筆記源碼學(xué)習(xí)內(nèi)存管理筆記源碼學(xué)習(xí)內(nèi)存管理筆記源碼學(xué)習(xí)基本變量筆記 此文用于匯總跟隨陳雷老師及團(tuán)隊(duì)的視頻,學(xué)習(xí)源碼過程中的思考、整理與心得體會,此文會不斷更新 視頻傳送門:【每日學(xué)習(xí)記錄】使用錄像設(shè)備記錄每天的學(xué)習(xí) PHP7...
摘要:操作數(shù)本身并無數(shù)據(jù)類型,它的數(shù)據(jù)類型由操作碼確定任何架構(gòu)的計算機(jī)都會對外提供指令集合運(yùn)算器通過執(zhí)行指令直接發(fā)出控制信號控制計算機(jī)各項(xiàng)操作。 順風(fēng)車運(yùn)營研發(fā)團(tuán)隊(duì) 李樂 1.從物理機(jī)說起 虛擬機(jī)也是計算機(jī),設(shè)計思想和物理機(jī)有很多相似之處; 1.1馮諾依曼體系結(jié)構(gòu) 馮·諾依曼是當(dāng)之無愧的數(shù)字計算機(jī)之父,當(dāng)前計算機(jī)都采用的是馮諾依曼體系結(jié)構(gòu);設(shè)計思想主要包含以下幾個方面: 指令和數(shù)據(jù)不加區(qū)別...
摘要:中詞法語法分析,生成抽象語法樹,然后編譯成及被執(zhí)行均由虛擬機(jī)完成。通常情況下這部分是可選部分,主要為便于程序的讀寫方便而使用。指令虛擬機(jī)的指令稱為,每條指令對應(yīng)一個。 作者 陳雷編程語言的虛擬機(jī)是一種可以運(yùn)行中間語言的程序。中間語言是抽象出的指令集,由原生語言編譯而成,作為虛擬機(jī)執(zhí)行階段的輸入。很多語言都實(shí)現(xiàn)了自己的虛擬機(jī),比如Java、C#和Lua。PHP語言也有自己的虛擬機(jī),稱為Z...
閱讀 3488·2021-10-13 09:39
閱讀 1469·2021-10-08 10:05
閱讀 2274·2021-09-26 09:56
閱讀 2290·2021-09-03 10:28
閱讀 2688·2019-08-29 18:37
閱讀 2048·2019-08-29 17:07
閱讀 610·2019-08-29 16:23
閱讀 2200·2019-08-29 11:24