成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

有贊容器化實(shí)踐

EscapedDog / 2105人閱讀

摘要:有贊容器化方案我們的容器化方案基于和,下面介紹一下我們?cè)诟鱾€(gè)方面遇到的問(wèn)題以及解決方案。不過(guò)對(duì)于上線來(lái)說(shuō),需要整個(gè)運(yùn)維體系來(lái)適配容器化,比如監(jiān)控發(fā)布日志等等。

前言

容器化已經(jīng)成為一種趨勢(shì),它可以解決很多運(yùn)維中的痛點(diǎn),比如效率、成本、穩(wěn)定性等問(wèn)題,而接入容器的過(guò)程中往往也會(huì)碰到很多問(wèn)題和不便。在有贊最開(kāi)始做容器化是為了快速交付開(kāi)發(fā)測(cè)試環(huán)境,在容器化的過(guò)程中,我們碰到過(guò)容器技術(shù)、運(yùn)維體系適配、用戶使用習(xí)慣改變等各種問(wèn)題,本文主要介紹有贊容器化過(guò)程中碰到的問(wèn)題以及采取的方案。

有贊容器化的初衷

在有贊同時(shí)會(huì)有很多個(gè)項(xiàng)目、日常在并行開(kāi)發(fā),環(huán)境的搶占問(wèn)題嚴(yán)重影響了開(kāi)發(fā)、測(cè)試和上線的效率,我們需要給每個(gè)項(xiàng)目提供一套開(kāi)發(fā)聯(lián)調(diào)(daily)、測(cè)試環(huán)境(qa),并且隨著項(xiàng)目、日常的生命周期項(xiàng)目環(huán)境也會(huì)隨著創(chuàng)建和銷毀,我們最早的容器化需求就是怎么解決環(huán)境快速交付的問(wèn)題。

[有贊環(huán)境]

上面是有贊大致的研發(fā)流程,在標(biāo)準(zhǔn)流程中我們有四套穩(wěn)定環(huán)境,分別是 Daily 環(huán)境、Qa 環(huán)境、預(yù)發(fā)環(huán)境和測(cè)試環(huán)境。我們的開(kāi)發(fā)、測(cè)試、聯(lián)調(diào)工作一般并不會(huì)直接在穩(wěn)定環(huán)境中進(jìn)行,而是會(huì)拉一套獨(dú)立的項(xiàng)目環(huán)境出來(lái),隨著代碼經(jīng)過(guò)開(kāi)發(fā)、測(cè)試、預(yù)發(fā)驗(yàn)收最終發(fā)布到生產(chǎn)環(huán)境后再同步回 Daily/Qa 的穩(wěn)定環(huán)境中。

[項(xiàng)目環(huán)境]

我們提供了一套以最小的資源投入滿足最大項(xiàng)目并行度的環(huán)境交付方案,在 Daily/Qa 穩(wěn)定環(huán)境的基礎(chǔ)上,隔離出N個(gè)項(xiàng)目環(huán)境,在項(xiàng)目環(huán)境里只需要?jiǎng)?chuàng)建該項(xiàng)目所涉及應(yīng)用的計(jì)算資源,其它缺失的服務(wù)調(diào)用由穩(wěn)定環(huán)境提供,在項(xiàng)目環(huán)境里,我們大量使用了容器技術(shù)。

[持續(xù)交付]

后面我們又在項(xiàng)目環(huán)境快速交付的解決方案的基礎(chǔ)上實(shí)現(xiàn)了持續(xù)交付流水線,目前已經(jīng)有超過(guò) 600 套項(xiàng)目/持續(xù)交付環(huán)境,加上 Daily/Qa 穩(wěn)定環(huán)境,涉及計(jì)算實(shí)例四五千個(gè),這些計(jì)算實(shí)例無(wú)論是 cpu 還是內(nèi)存使用率都是非常低的,容器化可以非常好的解決環(huán)境交付的效率問(wèn)題,以及提高資源使用率來(lái)節(jié)省成本的投入。

有贊容器化方案

我們的容器化方案基于 kubernetes(1.7.10)和 docker(1.12.6)、docker(1.13.1),下面介紹一下我們?cè)诟鱾€(gè)方面遇到的問(wèn)題以及解決方案。

網(wǎng)絡(luò)

有贊后端主要是 java 應(yīng)用,采用定制的 dubbo 服務(wù)化方案,過(guò)程中無(wú)法做到整個(gè)單元全量容器化,和原有集群在網(wǎng)絡(luò)路由上互通也就成了剛需,由于我們無(wú)法解決公有云上 overlay 網(wǎng)絡(luò)和公有云網(wǎng)絡(luò)的互通問(wèn)題,所以一開(kāi)始我們放棄了 overlay 網(wǎng)絡(luò)方案,采用了托管網(wǎng)絡(luò)下的 macvlan 方案,這樣既解決了網(wǎng)絡(luò)互通的問(wèn)題也不存在網(wǎng)絡(luò)性能問(wèn)題,但是也就享受不到公有云彈性資源的優(yōu)勢(shì)了。隨著有贊多云架構(gòu)的發(fā)展以及越來(lái)越多的云廠商支持容器 overlay 網(wǎng)絡(luò)和 vpc 網(wǎng)絡(luò)打通,彈性資源的問(wèn)題才得到了緩解。

隔離性

容器的隔離主要利用內(nèi)核的 namespace 和 cgroup 技術(shù),在進(jìn)程、cpu、內(nèi)存、IO等資源隔離限制上有比較好的表現(xiàn),但其他方面和虛擬機(jī)相比存在著很多的不足,我們?cè)谑褂眠^(guò)程中碰到最多的問(wèn)題是容器里看到的 cpu 數(shù)和內(nèi)存大小不準(zhǔn)確,因?yàn)?proc文件系統(tǒng)無(wú)法隔離,導(dǎo)致容器里的進(jìn)程"看到"的是物理機(jī)的 cpu 數(shù)以及內(nèi)存大小。

內(nèi)存問(wèn)題

我們的 java 應(yīng)用會(huì)根據(jù)服務(wù)器的內(nèi)存大小來(lái)決定 jvm 參數(shù)應(yīng)該怎么配置,我們是采用 lxcfs 方案來(lái)規(guī)避的。

CPU 數(shù)的問(wèn)題

因?yàn)槲覀冇谐u(mài)的需求以及 kubernetes 默認(rèn)也是采用 cpu share 來(lái)做 cpu 限制,雖然我們使用了 lxcfs,CPU 數(shù)還是不準(zhǔn)的。jvm 以及很多 Java sdk 都會(huì)根據(jù)系統(tǒng)的 CPU 數(shù)來(lái)決定創(chuàng)建多少線程,導(dǎo)致 java 應(yīng)用在線程數(shù)和內(nèi)存使用上都比虛擬機(jī)多的多,嚴(yán)重影響運(yùn)行,其他類型的應(yīng)用也有類似的問(wèn)題。
我們會(huì)根據(jù)容器的規(guī)格內(nèi)置一個(gè)環(huán)境變量 NUM_CPUS,然后比如 nodejs 應(yīng)用就會(huì)按照這個(gè)變量來(lái)創(chuàng)建它的 worker 進(jìn)程數(shù)。在解決 java 類應(yīng)用的問(wèn)題時(shí),我們索性通過(guò) LD_PRELOAD 將 JVM_ActiveProcessorCount 函數(shù)覆蓋掉,讓它直接返回 NUM_CPUS 的值[1]。

應(yīng)用接入

在容器化之前,有贊的應(yīng)用已經(jīng)全部接入到發(fā)布系統(tǒng),在發(fā)布系統(tǒng)里已經(jīng)標(biāo)準(zhǔn)化了應(yīng)用的打包、發(fā)布流程,所以在應(yīng)用接入方面成本還是比較小的,業(yè)務(wù)方無(wú)需提供 Dockerfile。

nodejs, python,php-soa 等用 supervisord 托管的應(yīng)用,只需要在 git 倉(cāng)庫(kù)里提供 app.yaml 文件定義運(yùn)行需要的 runtime 和啟動(dòng)命令即可。

java 標(biāo)準(zhǔn)化啟動(dòng)的應(yīng)用業(yè)務(wù)方無(wú)需改動(dòng)

java 非標(biāo)準(zhǔn)化的應(yīng)用需要做標(biāo)準(zhǔn)化改造

鏡像集成


容器鏡像我們分了三層,依次為 stack 層(os),runtime 層(語(yǔ)言環(huán)境),應(yīng)用層(業(yè)務(wù)代碼和一些輔助agent),應(yīng)用以及輔助 agent 由 runit 來(lái)啟動(dòng)。由于我們的配置還沒(méi)有完全分離,在應(yīng)用層目前還是每個(gè)環(huán)境獨(dú)立打包,鏡像里除了業(yè)務(wù)代碼之外,我們還會(huì)根據(jù)業(yè)務(wù)的語(yǔ)言類型放一些輔助的 agent。我們一開(kāi)始也想將各種 agent 拆成多個(gè)鏡像,然后每個(gè) pod 運(yùn)行多個(gè)容器,后來(lái)因?yàn)榻鉀Q不了 pod 里容器的啟動(dòng)順序(服務(wù)啟動(dòng)有依賴)問(wèn)題,就把所有服務(wù)都扔到一個(gè)容器里去運(yùn)行了。


我們的容器鏡像集成過(guò)程也是通過(guò) kubernetes 來(lái)調(diào)度的(會(huì)調(diào)度到指定的打包節(jié)點(diǎn)上),在發(fā)布任務(wù)發(fā)起時(shí),管控系統(tǒng)會(huì)在集群中創(chuàng)建一個(gè)打包的 pod,打包程序會(huì)根據(jù)應(yīng)用類型等參數(shù)編譯代碼、安裝依賴,并且生成 Dockerifile,然后在這個(gè) pod 中使用 docker in docker 的方式來(lái)集成容器鏡像并推送到倉(cāng)庫(kù)。
為了加速應(yīng)用的打包速度,我們用 pvc 緩存了 python 的 virtualenv,nodejs 的 node_modules,java 的 maven 包等文件。另外就是 docker 早的版本里,Dockerfile ADD 指令是不支持指定文件屬主和分組的,這樣會(huì)帶來(lái)一個(gè)問(wèn)題就是需要指定文件屬主時(shí)(我們的應(yīng)用是以 app 賬號(hào)運(yùn)行的)需要多運(yùn)行一次 RUN chown,這樣鏡像也就多了一層數(shù)據(jù),所以我們打包節(jié)點(diǎn)的 docker 版本采用了官方比較新的 ce 版本,因?yàn)樾掳姹局С?ADD --chown 特性。

負(fù)載均衡(ingress)


有贊的應(yīng)用內(nèi)部調(diào)用有比較完善的服務(wù)化和 service mesh 方案,集群內(nèi)的訪問(wèn)不用過(guò)多考慮,負(fù)載均衡只需要考慮用戶和系統(tǒng)訪問(wèn)的 http 流量,在容器化之前我們已經(jīng)自研了一套統(tǒng)一接入系統(tǒng),所以在容器化負(fù)載均衡上我們并沒(méi)有完整按照 ingress 的機(jī)制來(lái)實(shí)現(xiàn) controller,ingress 的資源配置是配在統(tǒng)一接入里的,配置里面轉(zhuǎn)發(fā)的 upstream 會(huì)和 kubernetes 里的 service 關(guān)聯(lián),我們只是做了一個(gè) sync 程序 watch kube-api,感知 service 的變化來(lái)實(shí)時(shí)更新統(tǒng)一接入系統(tǒng)中 upstream 的服務(wù)器列表信息。

容器登錄和調(diào)試


在容器化接入過(guò)程中開(kāi)發(fā)會(huì)反饋是控制臺(tái)比較難用,雖然我們優(yōu)化了多次,和 iterm2 等的體驗(yàn)還是有所不足,最終我們還是放開(kāi)了項(xiàng)目/持續(xù)交付環(huán)境這種需要頻繁登陸調(diào)試的 ssh 登陸權(quán)限。
另外一個(gè)比較嚴(yán)重的問(wèn)題是,當(dāng)一個(gè)應(yīng)用啟動(dòng)后健康檢查有問(wèn)題會(huì)導(dǎo)致 pod 一直在重新調(diào)度,而在開(kāi)發(fā)過(guò)程中開(kāi)發(fā)肯定是希望看到失敗現(xiàn)場(chǎng)的,我們提供了調(diào)試發(fā)布模式,讓容器不做健康檢查。

日志


有贊有專門(mén)的日志系統(tǒng),我們內(nèi)部叫天網(wǎng),大部分日志以及業(yè)務(wù)監(jiān)控?cái)?shù)據(jù)都是通過(guò) sdk 直接打到天網(wǎng)里去了,所以容器的標(biāo)準(zhǔn)輸出日志僅僅作為一種輔助排查問(wèn)題的手段。我們?nèi)萜鞯娜罩臼占捎玫氖?fluentd,經(jīng)過(guò) fluentd 處理后按照天網(wǎng)約定的日志格式打到 kafka,最終由天網(wǎng)處理進(jìn)入 es 做存儲(chǔ)。

灰度發(fā)布

我們涉及到灰度發(fā)布的流量主要包含三部分:

用戶端的 http 訪問(wèn)流量

應(yīng)用之間的 http 調(diào)用

應(yīng)用之間的 dubbo 調(diào)用

首先,我們?cè)谌肟诘慕y(tǒng)一接入上統(tǒng)一打上灰度需要用的各種維度的標(biāo)簽(比如用戶、店鋪等),然后需要對(duì)統(tǒng)一接入、http client 以及 dubbo client 做改造,目的是讓這些標(biāo)簽?zāi)軌蛟谡麄€(gè)調(diào)用鏈上透?jìng)?。我們?cè)谧鋈萜骰叶劝l(fā)布時(shí),會(huì)發(fā)一個(gè)灰度的 deployment,然后在統(tǒng)一接入以及灰度配置中心配置灰度規(guī)則,整個(gè)鏈路上的調(diào)用方都會(huì)感知這些灰度規(guī)則來(lái)實(shí)現(xiàn)灰度發(fā)布。

標(biāo)準(zhǔn)環(huán)境容器化 標(biāo)準(zhǔn)環(huán)境的出發(fā)點(diǎn)

和項(xiàng)目環(huán)境類似,標(biāo)準(zhǔn)穩(wěn)定環(huán)境中的 daily,qa,pre 以及 prod 中超過(guò)一半運(yùn)行在低水位的服務(wù)器的資源非常浪費(fèi)。

因?yàn)槌杀究紤] daily,qa,pre 里都是以單臺(tái)虛擬機(jī)運(yùn)行的,這樣一旦需要發(fā)布穩(wěn)定環(huán)境將會(huì)造成標(biāo)準(zhǔn)穩(wěn)定環(huán)境和項(xiàng)目環(huán)境的短暫不可用。

虛擬機(jī)交付速度比較慢,使用虛擬機(jī)做灰度發(fā)布也比較復(fù)雜。

虛擬機(jī)往往會(huì)存在幾年甚至更長(zhǎng)的時(shí)間,運(yùn)行過(guò)程中操作系統(tǒng)以及基礎(chǔ)軟件版本的收斂非常麻煩。

標(biāo)準(zhǔn)環(huán)境容器化推進(jìn)

經(jīng)過(guò)之前項(xiàng)目/持續(xù)交付的上線和迭代,大部分應(yīng)用本身已經(jīng)具備了容器化的條件。不過(guò)對(duì)于上線來(lái)說(shuō),需要整個(gè)運(yùn)維體系來(lái)適配容器化,比如監(jiān)控、發(fā)布、日志等等。目前我們生產(chǎn)環(huán)境容器化準(zhǔn)備基本完成,生產(chǎn)網(wǎng)已經(jīng)上了部分前端 nodejs 應(yīng)用,其他應(yīng)用也在陸續(xù)推動(dòng)中,希望以后可以分享更多生產(chǎn)環(huán)境中的容器化經(jīng)驗(yàn)。

結(jié)束語(yǔ)

以上是有贊在容器化上的應(yīng)用,以及在容器化過(guò)程中碰到的一些問(wèn)題和解決方案,我們生產(chǎn)環(huán)境的容器化還處于開(kāi)始階段,后面還會(huì)碰到各種個(gè)樣的問(wèn)題,希望能夠和大家互相學(xué)習(xí),后面能夠有更多的經(jīng)驗(yàn)分享給大家。

參考文獻(xiàn)

[1] https://github.com/fabianenar...

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/8075.html

相關(guān)文章

  • 有贊容器實(shí)踐

    摘要:有贊容器化方案我們的容器化方案基于和,下面介紹一下我們?cè)诟鱾€(gè)方面遇到的問(wèn)題以及解決方案。不過(guò)對(duì)于上線來(lái)說(shuō),需要整個(gè)運(yùn)維體系來(lái)適配容器化,比如監(jiān)控發(fā)布日志等等。 前言 容器化已經(jīng)成為一種趨勢(shì),它可以解決很多運(yùn)維中的痛點(diǎn),比如效率、成本、穩(wěn)定性等問(wèn)題,而接入容器的過(guò)程中往往也會(huì)碰到很多問(wèn)題和不便。在有贊最開(kāi)始做容器化是為了快速交付開(kāi)發(fā)測(cè)試環(huán)境,在容器化的過(guò)程中,我們碰到過(guò)容器技術(shù)、運(yùn)維體系...

    songze 評(píng)論0 收藏0
  • Flink 在有贊實(shí)時(shí)計(jì)算的實(shí)踐

    摘要:第三個(gè)就是比較重點(diǎn)的內(nèi)容,在有贊的實(shí)踐。第四部分是將實(shí)時(shí)計(jì)算化,界面化的一些實(shí)踐。二有贊實(shí)時(shí)平臺(tái)架構(gòu)有贊的實(shí)時(shí)平臺(tái)架構(gòu)呢有幾個(gè)主要的組成部分。實(shí)時(shí)平臺(tái)提供了集群管理,項(xiàng)目管理,任務(wù)管理和報(bào)警監(jiān)控的功能。。 一、前言 這篇主要由五個(gè)部分來(lái)組成: 首先是有贊的實(shí)時(shí)平臺(tái)架構(gòu)。 其次是在調(diào)研階段我們?yōu)槭裁催x擇了 Flink。在這個(gè)部分,主要是 Flink 與 Spark 的 structure...

    ?。琛?/span> 評(píng)論0 收藏0
  • Flink 在有贊實(shí)時(shí)計(jì)算的實(shí)踐

    摘要:第三個(gè)就是比較重點(diǎn)的內(nèi)容,在有贊的實(shí)踐。第四部分是將實(shí)時(shí)計(jì)算化,界面化的一些實(shí)踐。二有贊實(shí)時(shí)平臺(tái)架構(gòu)有贊的實(shí)時(shí)平臺(tái)架構(gòu)呢有幾個(gè)主要的組成部分。實(shí)時(shí)平臺(tái)提供了集群管理,項(xiàng)目管理,任務(wù)管理和報(bào)警監(jiān)控的功能。。 一、前言 這篇主要由五個(gè)部分來(lái)組成: 首先是有贊的實(shí)時(shí)平臺(tái)架構(gòu)。 其次是在調(diào)研階段我們?yōu)槭裁催x擇了 Flink。在這個(gè)部分,主要是 Flink 與 Spark 的 structure...

    fish 評(píng)論0 收藏0
  • 有贊業(yè)務(wù)對(duì)賬平臺(tái)的探索與實(shí)踐

    摘要:業(yè)務(wù)對(duì)賬平臺(tái)的核心目的,就是及時(shí)發(fā)現(xiàn)類似問(wèn)題,并及時(shí)修復(fù)。這對(duì)對(duì)賬平臺(tái)的吞吐量造成了挑戰(zhàn)。五健康度對(duì)賬中心可以拿到業(yè)務(wù)系統(tǒng)及其所在整個(gè)鏈路的數(shù)據(jù)一致性信息。在分布式環(huán)境下,沒(méi)有人能回避數(shù)據(jù)一致性問(wèn)題,我們對(duì)此充滿著敬畏。 一、引子 根據(jù)CAP原理,分布式系統(tǒng)無(wú)法在保證了可用性(Availability)和分區(qū)容忍性(Partition)之后,繼續(xù)保證一致性(Consistency)。我...

    wangjuntytl 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<