摘要:編譯器,和處理器會(huì)共同確保單線程程序的執(zhí)行結(jié)果與該程序在順序一致性模型中的執(zhí)行結(jié)果相同。正確同步的多線程程序的執(zhí)行將具有順序一致性程序的執(zhí)行結(jié)果與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果相同。
前情提要 深入理解Java內(nèi)存模型(六)——final
處理器內(nèi)存模型順序一致性內(nèi)存模型是一個(gè)理論參考模型,JMM和處理器內(nèi)存模型在設(shè)計(jì)時(shí)通常會(huì)把順序一致性內(nèi)存模型作為參照。JMM和處理器內(nèi)存模型在設(shè)計(jì)時(shí)會(huì)對(duì)順序一致性模型做一些放松,因?yàn)槿绻耆凑枕樞蛞恢滦阅P蛠韺?shí)現(xiàn)處理器和JMM,那么很多的處理器和編譯器優(yōu)化都要被禁止,這對(duì)執(zhí)行性能將會(huì)有很大的影響。
根據(jù)對(duì)不同類型讀/寫操作組合的執(zhí)行順序的放松,可以把常見處理器的內(nèi)存模型劃分為下面幾種類型:
放松程序中寫-讀操作的順序,由此產(chǎn)生了total store ordering內(nèi)存模型(簡稱為TSO)。
在前面1的基礎(chǔ)上,繼續(xù)放松程序中寫-寫操作的順序,由此產(chǎn)生了partial store order 內(nèi)存模型(簡稱為PSO)。
在前面1和2的基礎(chǔ)上,繼續(xù)放松程序中讀-寫和讀-讀操作的順序,由此產(chǎn)生了relaxed memory order內(nèi)存模型(簡稱為RMO)和PowerPC內(nèi)存模型。
注意,這里處理器對(duì)讀/寫操作的放松,是以兩個(gè)操作之間不存在數(shù)據(jù)依賴性為前提的(因?yàn)樘幚砥饕袷豠s-if-serial語義,處理器不會(huì)對(duì)存在數(shù)據(jù)依賴性的兩個(gè)內(nèi)存操作做重排序)。
下面的表格展示了常見處理器內(nèi)存模型的細(xì)節(jié)特征:
-------------- -------------- ------------------- ------------------- ------------------------------ ------------------------------ ------------------------------ 內(nèi)存模型名稱 對(duì)應(yīng)的處理器 Store-Load 重排序 Store-Store重排序 Load-Load 和Load-Store重排序 可以更早讀取到其它處理器的寫 可以更早讀取到當(dāng)前處理器的寫 TSO sparc-TSOX64 Y Y PSO sparc-PSO Y Y Y RMO ia64 Y Y Y Y PowerPC PowerPC Y Y Y Y Y -------------- -------------- ------------------- ------------------- ------------------------------ ------------------------------ ------------------------------
在這個(gè)表格中,我們可以看到所有處理器內(nèi)存模型都允許寫-讀重排序,原因在第一章以說明過:它們都使用了寫緩存區(qū),寫緩存區(qū)可能導(dǎo)致寫-讀操作重排序。同時(shí),我們可以看到這些處理器內(nèi)存模型都允許更早讀到當(dāng)前處理器的寫,原因同樣是因?yàn)閷懢彺鎱^(qū):由于寫緩存區(qū)僅對(duì)當(dāng)前處理器可見,這個(gè)特性導(dǎo)致當(dāng)前處理器可以比其他處理器先看到臨時(shí)保存在自己的寫緩存區(qū)中的寫。
上面表格中的各種處理器內(nèi)存模型,從上到下,模型由強(qiáng)變?nèi)?。越是追求性能的處理器,?nèi)存模型設(shè)計(jì)的會(huì)越弱。因?yàn)檫@些處理器希望內(nèi)存模型對(duì)它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來提高性能。
由于常見的處理器內(nèi)存模型比JMM要弱,java編譯器在生成字節(jié)碼時(shí),會(huì)在執(zhí)行指令序列的適當(dāng)位置插入內(nèi)存屏障來限制處理器的重排序。同時(shí),由于各種處理器內(nèi)存模型的強(qiáng)弱并不相同,為了在不同的處理器平臺(tái)向程序員展示一個(gè)一致的內(nèi)存模型,JMM在不同的處理器中需要插入的內(nèi)存屏障的數(shù)量和種類也不相同。下圖展示了JMM在不同處理器內(nèi)存模型中需要插入的內(nèi)存屏障的示意圖:
如上圖所示,JMM屏蔽了不同處理器內(nèi)存模型的差異,它在不同的處理器平臺(tái)之上為java程序員呈現(xiàn)了一個(gè)一致的內(nèi)存模型。
JMM,處理器內(nèi)存模型與順序一致性內(nèi)存模型之間的關(guān)系JMM是一個(gè)語言級(jí)的內(nèi)存模型,處理器內(nèi)存模型是硬件級(jí)的內(nèi)存模型,順序一致性內(nèi)存模型是一個(gè)理論參考模型。下面是語言內(nèi)存模型,處理器內(nèi)存模型和順序一致性內(nèi)存模型的強(qiáng)弱對(duì)比示意圖:
從上圖我們可以看出:常見的4種處理器內(nèi)存模型比常用的3中語言內(nèi)存模型要弱,處理器內(nèi)存模型和語言內(nèi)存模型都比順序一致性內(nèi)存模型要弱。同處理器內(nèi)存模型一樣,越是追求執(zhí)行性能的語言,內(nèi)存模型設(shè)計(jì)的會(huì)越弱。
JMM的設(shè)計(jì)從JMM設(shè)計(jì)者的角度來說,在設(shè)計(jì)JMM時(shí),需要考慮兩個(gè)關(guān)鍵因素:
程序員對(duì)內(nèi)存模型的使用。程序員希望內(nèi)存模型易于理解,易于編程。程序員希望基于一個(gè)強(qiáng)內(nèi)存模型來編寫代碼。
編譯器和處理器對(duì)內(nèi)存模型的實(shí)現(xiàn)。編譯器和處理器希望內(nèi)存模型對(duì)它們的束縛越少越好,這樣它們就可以做盡可能多的優(yōu)化來提高性能。編譯器和處理器希望實(shí)現(xiàn)一個(gè)弱內(nèi)存模型。
由于這兩個(gè)因素互相矛盾,所以JSR-133專家組在設(shè)計(jì)JMM時(shí)的核心目標(biāo)就是找到一個(gè)好的平衡點(diǎn):一方面要為程序員提供足夠強(qiáng)的內(nèi)存可見性保證;另一方面,對(duì)編譯器和處理器的限制要盡可能的放松。下面讓我們看看JSR-133是如何實(shí)現(xiàn)這一目標(biāo)的。
為了具體說明,請(qǐng)看前面提到過的計(jì)算圓面積的示例代碼:
double pi = 3.14; //A double r = 1.0; //B double area = pi * r * r; //C
上面計(jì)算圓的面積的示例代碼存在三個(gè)happens- before關(guān)系:
A happens- before B;
B happens- before C;
A happens- before C;
由于A happens- before B,happens- before的定義會(huì)要求:A操作執(zhí)行的結(jié)果要對(duì)B可見,且A操作的執(zhí)行順序排在B操作之前。 但是從程序語義的角度來說,對(duì)A和B做重排序既不會(huì)改變程序的執(zhí)行結(jié)果,也還能提高程序的執(zhí)行性能(允許這種重排序減少了對(duì)編譯器和處理器優(yōu)化的束縛)。也就是說,上面這3個(gè)happens- before關(guān)系中,雖然2和3是必需要的,但1是不必要的。因此,JMM把happens- before要求禁止的重排序分為了下面兩類:
會(huì)改變程序執(zhí)行結(jié)果的重排序。
不會(huì)改變程序執(zhí)行結(jié)果的重排序。
JMM對(duì)這兩種不同性質(zhì)的重排序,采取了不同的策略:
對(duì)于會(huì)改變程序執(zhí)行結(jié)果的重排序,JMM要求編譯器和處理器必須禁止這種重排序。
對(duì)于不會(huì)改變程序執(zhí)行結(jié)果的重排序,JMM對(duì)編譯器和處理器不作要求(JMM允許這種重排序)。
下面是JMM的設(shè)計(jì)示意圖:
從上圖可以看出兩點(diǎn):
JMM向程序員提供的happens- before規(guī)則能滿足程序員的需求。JMM的happens- before規(guī)則不但簡單易懂,而且也向程序員提供了足夠強(qiáng)的內(nèi)存可見性保證(有些內(nèi)存可見性保證其實(shí)并不一定真實(shí)存在,比如上面的A happens- before B)。
JMM對(duì)編譯器和處理器的束縛已經(jīng)盡可能的少。從上面的分析我們可以看出,JMM其實(shí)是在遵循一個(gè)基本原則:只要不改變程序的執(zhí)行結(jié)果(指的是單線程程序和正確同步的多線程程序),編譯器和處理器怎么優(yōu)化都行。比如,如果編譯器經(jīng)過細(xì)致的分析后,認(rèn)定一個(gè)鎖只會(huì)被單個(gè)線程訪問,那么這個(gè)鎖可以被消除。再比如,如果編譯器經(jīng)過細(xì)致的分析后,認(rèn)定一個(gè)volatile變量僅僅只會(huì)被單個(gè)線程訪問,那么編譯器可以把這個(gè)volatile變量當(dāng)作一個(gè)普通變量來對(duì)待。這些優(yōu)化既不會(huì)改變程序的執(zhí)行結(jié)果,又能提高程序的執(zhí)行效率。
JMM的內(nèi)存可見性保證Java程序的內(nèi)存可見性保證按程序類型可以分為下列三類:
單線程程序。單線程程序不會(huì)出現(xiàn)內(nèi)存可見性問題。編譯器,runtime和處理器會(huì)共同確保單線程程序的執(zhí)行結(jié)果與該程序在順序一致性模型中的執(zhí)行結(jié)果相同。
正確同步的多線程程序。正確同步的多線程程序的執(zhí)行將具有順序一致性(程序的執(zhí)行結(jié)果與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果相同)。這是JMM關(guān)注的重點(diǎn),JMM通過限制編譯器和處理器的重排序來為程序員提供內(nèi)存可見性保證。
未同步/未正確同步的多線程程序。JMM為它們提供了最小安全性保障:線程執(zhí)行時(shí)讀取到的值,要么是之前某個(gè)線程寫入的值,要么是默認(rèn)值(0,null,false)。
下圖展示了這三類程序在JMM中與在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果的異同:
只要多線程程序是正確同步的,JMM保證該程序在任意的處理器平臺(tái)上的執(zhí)行結(jié)果,與該程序在順序一致性內(nèi)存模型中的執(zhí)行結(jié)果一致。
JSR-133對(duì)舊內(nèi)存模型的修補(bǔ)JSR-133對(duì)JDK5之前的舊內(nèi)存模型的修補(bǔ)主要有兩個(gè):
增強(qiáng)volatile的內(nèi)存語義。舊內(nèi)存模型允許volatile變量與普通變量重排序。JSR-133嚴(yán)格限制volatile變量與普通變量的重排序,使volatile的寫-讀和鎖的釋放-獲取具有相同的內(nèi)存語義。
增強(qiáng)final的內(nèi)存語義。在舊內(nèi)存模型中,多次讀取同一個(gè)final變量的值可能會(huì)不相同。為此,JSR-133為final增加了兩個(gè)重排序規(guī)則?,F(xiàn)在,final具有了初始化安全性。
參考文獻(xiàn)Computer Architecture: A Quantitative Approach, 4th Edition
Shared memory consistency models: A tutorial
Intel? Itanium? Architecture Software Developer’s Manual Volume 2: System Architecture
Concurrent Programming on Windows
JSR 133 (Java Memory Model) FAQ
The JSR-133 Cookbook for Compiler Writers
Java theory and practice: Fixing the Java Memory Model, Part 2
關(guān)于作者程曉明,Java軟件工程師,國家認(rèn)證的系統(tǒng)分析師、信息項(xiàng)目管理師。專注于并發(fā)編程,個(gè)人郵箱:[email protected]。
via ifeve
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/64091.html
摘要:我的是忙碌的一年,從年初備戰(zhàn)實(shí)習(xí)春招,年三十都在死磕源碼,三月份經(jīng)歷了阿里五次面試,四月順利收到實(shí)習(xí)。因?yàn)槲倚睦砗芮宄?,我的目?biāo)是阿里。所以在收到阿里之后的那晚,我重新規(guī)劃了接下來的學(xué)習(xí)計(jì)劃,將我的短期目標(biāo)更新成拿下阿里轉(zhuǎn)正。 我的2017是忙碌的一年,從年初備戰(zhàn)實(shí)習(xí)春招,年三十都在死磕JDK源碼,三月份經(jīng)歷了阿里五次面試,四月順利收到實(shí)習(xí)offer。然后五月懷著忐忑的心情開始了螞蟻金...
摘要:對(duì)于域,編譯器和處理器要遵守兩個(gè)重排序規(guī)則在構(gòu)造函數(shù)內(nèi)對(duì)一個(gè)域的寫入,與隨后把這個(gè)被構(gòu)造對(duì)象的引用賦值給一個(gè)引用變量,這兩個(gè)操作之間不能重排序。這個(gè)屏障禁止處理器把域的寫重排序到構(gòu)造函數(shù)之外。下一篇深入理解內(nèi)存模型七總結(jié) 與前面介紹的鎖和volatile相比較,對(duì)final域的讀和寫更像是普通的變量訪問。對(duì)于final域,編譯器和處理器要遵守兩個(gè)重排序規(guī)則: 在構(gòu)造函數(shù)內(nèi)對(duì)一個(gè)fi...
摘要:導(dǎo)讀閱讀本文需要有足夠的時(shí)間,筆者會(huì)由淺到深帶你一步一步了解一個(gè)資深架構(gòu)師所要掌握的各類知識(shí)點(diǎn),你也可以按照文章中所列的知識(shí)體系對(duì)比自身,對(duì)自己進(jìn)行查漏補(bǔ)缺,覺得本文對(duì)你有幫助的話,可以點(diǎn)贊關(guān)注一下。目錄一基礎(chǔ)篇二進(jìn)階篇三高級(jí)篇四架構(gòu)篇五擴(kuò) 導(dǎo)讀:閱讀本文需要有足夠的時(shí)間,筆者會(huì)由淺到深帶你一步一步了解一個(gè)資深架構(gòu)師所要掌握的各類知識(shí)點(diǎn),你也可以按照文章中所列的知識(shí)體系對(duì)比自身,對(duì)自己...
摘要:掌握的內(nèi)存模型,你就是解決并發(fā)問題最靚的仔編譯優(yōu)化說的具體一些,這些方法包括和關(guān)鍵字,以及內(nèi)存模型中的規(guī)則。掌握的內(nèi)存模型,你就是解決并發(fā)問題最靚的仔共享變量藍(lán)色的虛線箭頭代表禁用了緩存,黑色的實(shí)線箭頭代表直接從主內(nèi)存中讀寫數(shù)據(jù)。 摘要:如果編寫的并發(fā)程序出現(xiàn)問題時(shí),很難通過調(diào)試來解決相應(yīng)的問題,此時(shí),需要一行行的檢查代碼...
摘要:上一篇文章講解了虛擬機(jī)中的內(nèi)存布局,這里就稍作拓展,聊聊對(duì)象在虛擬機(jī)中的一些存儲(chǔ)細(xì)節(jié)吧。參考文檔深入理解虛擬機(jī)高級(jí)特效與最佳實(shí)現(xiàn),第章周志明著系列筆記內(nèi)存區(qū)域和機(jī)制明舞深入理解結(jié)構(gòu)團(tuán)長聯(lián)系作者 上一篇文章講解了 java 虛擬機(jī)中的內(nèi)存布局,這里就稍作拓展,聊聊 java 對(duì)象在虛擬機(jī)中的一些存儲(chǔ)細(xì)節(jié)吧。 本文主要圍繞虛擬機(jī)中對(duì)象如何創(chuàng)建?對(duì)象內(nèi)存都放些什么?如何訪問對(duì)象內(nèi)存?這么三...
閱讀 3306·2021-11-24 09:39
閱讀 3881·2021-11-22 09:34
閱讀 4832·2021-08-11 11:17
閱讀 1068·2019-08-29 13:58
閱讀 2582·2019-08-28 18:18
閱讀 549·2019-08-26 12:24
閱讀 836·2019-08-26 12:14
閱讀 745·2019-08-26 11:58