摘要:應用的研發(fā)上線運維運營形成閉環(huán),順利完成從對內服務到公共平臺的升級。從功能角度,只能支持靜態(tài)方式設置反向代理,然后,而平臺有服務對應的后端服務和端口是有動態(tài)調整需求。架構上是基礎組件需要進行升級,數(shù)據訪問層日志監(jiān)控系統(tǒng)等。
介紹
? ? ? ?MaxLeap早期是一家研發(fā)、運營移動應用和手機游戲公司,發(fā)展過程中積累了很多通用組件。這些組件很大程度幫公司在移動研發(fā)過程中節(jié)省了時間和成本,有沒有可能以云服務的方式開放出去,創(chuàng)造更大的價值?延續(xù)這個思路,公司成立了云服務部門,嘗試服務的商業(yè)化。
? ? ? ?從對內提供接口服務到對外提供云服務,經歷了三個階段發(fā)展:1.0時代,定位對內服務,為公司研發(fā)的幾十款應用提供服務端功能,推送、統(tǒng)一用戶管理等API接口,可以說是非常普通的接口服務;2.0時代,定位對外服務,除了支撐公司的移動研發(fā)以外,同時對外開放服務,提供更多的功能接口,也參考了行業(yè)的通用做法,形成了針對移動研發(fā)加速和提高運營效率的BaaS云平臺;3.0時代,定位基礎研發(fā)平臺,工具鏈逐漸完整,從研發(fā)、上線、運維到運營,提供應用管理、支付、IM、推送等SaaS功能,也提供托管、發(fā)布、監(jiān)控、日志等PaaS功能,逐步形成SaaS + PaaS的研發(fā)平臺。
云服務概念? ? ? ?常見的云服務有幾種方式。
? ? ? ?IaaS(Infrastructure as a Service),基礎設施即服務。提供云端的基礎設施為主,比如提供主機、存儲、網絡、CDN、域名解析等功能,知名廠商有阿里云、AWS、Azure等。
? ? ? ?PaaS(Platform),平臺即服務。提供云端的發(fā)布、數(shù)據庫服務、文件存儲、緩存服務、容器管理等基礎存儲和管理組件,自動化了程序的配置、發(fā)布、管理–Heroku、Google App Engine、Force.com等。
? ? ? ?SaaS(Software as a Service),軟件即服務。提供云端的應用服務,ERP、HR、CRM等在線系統(tǒng),每個賬戶或者每家公司有獨立的數(shù)據存儲,通過賬戶進行權限和訪問隔離,知名廠商有Salesforce、Successfactor、Zendesk等。
? ? ? ?BaaS(Backen as a Service),后端即服務,起初專指針對移動端的研發(fā)提供的云服務,降低移動研發(fā)的復雜度,讓開發(fā)者關注與移動端開發(fā)即可。流行的服務有幾大類:綜合類,Parse、Kinvey;分析類,友盟、TalkingData、神策數(shù)據;支付類,Beecloud、Ping++;IM類,環(huán)信、網易;消息類,極光、個推等。
? ? ? ?我們在2.0時代把自己定位于BaaS,隨著功能的不斷演進3.0著眼于PaaS和SaaS。
1.0 單應用架構 背景? ? ? ?當時公司有幾十款App需要研發(fā)和運營,每個應用功能各異,種類包括瀏覽器、音視頻工具、社交工具、清理大師、圖片存儲類和手游等,門類很多、很雜。如何提高研發(fā)效率,實現(xiàn)一套統(tǒng)一的研發(fā)、管理和運營體系,是當時的主要訴求。對主要功能進行梳理之后發(fā)現(xiàn),各類應用共同需要依賴的組件包括,用戶體系、云參數(shù)體系、推送服務、數(shù)據存儲和廣告服務。
圖1 1.0業(yè)務模型
? ? ? ?需求基本明確了,目標是快速上線,然后小版本迭代。
設計? ? ? ?當時4個后端研發(fā)人員,Java出身,人少但是技術精干。結合團隊情況和產品需求,決定采用如下架構,簡單但給力。
圖2 1.0架構
? ? ? ?典型的web應用架構方式,使用Nginx做反向代理和負載均衡,后面跟了多個JVM實例。每個JVM實例由Jetty作為應用服務器,提供REST接口,服務層實現(xiàn)具體的邏輯。DAL層對DB和緩存進行封裝,提供統(tǒng)一的數(shù)據訪問接口。Redis作為緩存方案,支持多個shard水平擴容,TPS高、性能好。Cassandra作為數(shù)據存儲引擎,無中心、可水平擴展、易維護,沒有專門的運維人員,對研發(fā)人員非常友好,由于沒有事務場景,NoSQL完全滿足當時的需求。RabbitMQ作為消息中間件方案,不同進程間通信,支持HA,支持持久化。Zookeeper用于存儲基礎配置信息。
小結? ? ? ?這種簡單的設計,有效支持了公司幾十款應用的運行,日訪問量達數(shù)十億級別。統(tǒng)一后臺基礎服務和移動端SDK后,提高了移動應用的研發(fā)和上線速度,研發(fā)了用戶管理、推送這些基礎功能,在移動端幾行代碼搞定。通過控制臺,能有效管理應用和配置信息。其實對于多數(shù)十多個研發(fā)人員的公司來講,這樣的單應用架構性價比最高,解決商業(yè)上的問題才是關鍵。
? ? ? ?也有不少需要改進的地方,Cassandra作為業(yè)務數(shù)據的存儲,查詢非常不靈活,依賴設計時對row key和composit key的精確把握,擴展非常困難,再加上對翻頁、排序等支持有限,在數(shù)據層做了很多特殊處理。整個系統(tǒng)沒有脫單,Redis、Nginx還有單點問題,脫單是高可用系統(tǒng)中首要需要解決的問題。所有服務部署在一起,出問題時相互影響,項目耦合度高,擴展困難。開發(fā)效率低,發(fā)布新功能時相互依賴等,這些都是單用架構設計最明顯的問題。
2.0 服務化架構 背景? ? ? ?隨著業(yè)務不斷發(fā)展以及新的產品定位,單應用架構的弊端不斷暴露出來,要求我們在新的規(guī)劃中,重新設計整個后端架構。
? ? ? ?來看新的需求:
定位公有云,服務標準化
多租戶支持,用戶數(shù)據需要隔離,每個公司都有自己的后臺管理和賬號管理,不同工作人員區(qū)分權限職責,允許同時有多款應用,應用在邏輯上相互獨立,每個應用可以使用所有服務
更靈活的存儲和查詢服務
提供基礎數(shù)據分析功能,提供代碼托管等更多云服務
圖3 2.0業(yè)務模型
設計? ? ? ?服務規(guī)模擴大后,大家解決單應用弊端的方法也都類似,以獨立運行的業(yè)務為單位,對服務縱向拆分,提高單個服務的聚合程度,降低服務間的相互依賴,從而解決降低研發(fā)、測試、上線過程中各個服務相互依賴、相互影響的問題。
? ? ? ?除此以外,我們對數(shù)據存儲和網絡層也進行了改進。平臺所支持的兩類服務,分別是云服務和云計算。在新的設計中,云服務部分的重點是重構、支持在新架構上快速研發(fā)新服務,云計算部分的重點是,構建起來一個穩(wěn)定、可靠、高效的基礎架構。
云服務部分圖4 2.0云服務架構
? ? ? ?網絡,最外層增加了ELB,IP地址直接暴露在公網是非常危險的方式,通過DNS配置CNAME指向域名,降低了被DDOS的風險,提高了Nginx的可用性。ELB本身會在訪問增加時,自動伸縮,配合IaaS廠商提供的AutoScalling服務,可以抵御多數(shù)DDOS攻擊。通過Nginx作為反向代理和負載均衡,不同服務指向不同的upstram地址和端口。服務間禁止相互依賴。
? ? ? ?容器,每個服務都運行在Docker中,服務之間環(huán)境和資源隔離,能夠快速遷移和部署,統(tǒng)一了交付和發(fā)布流程。每個容器無狀態(tài),服務遷移、擴容、宕機等問題迎刃而解,在服務化過程中起到很關鍵的作用。
? ? ? ?數(shù)據,NoSQL部分主要依賴MongoDB,Wired Tiger + SSD,由于MongoDB的Schema-less特性,開發(fā)者可以根據自己的需求隨時調整實體的定義。天生為分布式設計,支持復制集高可用方案,支持多Shard水平擴展。關系型數(shù)據庫采用MySQL,用于實現(xiàn)支付、訂單、配置信息等需要事務支持的業(yè)務,我們基于MHA實現(xiàn)MySQL的高可用和讀寫分離。不同服務所依賴的庫必須分離,從數(shù)據著手保障用戶資源的隔離。
? ? ? ?存儲/緩存,塊數(shù)據依賴AWS的S3,權限控制、分桶策略比較實用,可用性有保障;緩存依然使用Redis,為了解決單點問題,對原有版本進行了升級,采用官方的3.0集群方案,支持分片和高可用,當然也有其它方案可選,比如codis等代理的方案。
云計算部分圖5 2.0云分析架構
? ? ? ?數(shù)據收集部分采用REST + Kafka方式,其中很重要的一部分是DataTransform,用于數(shù)據標準化、過濾、流控等用途,基于vert.x實現(xiàn)。
? ? ? ?計算部分參考Lambda架構實現(xiàn),分為Speed Layer、Batch Layer、Serving Layer三層。
? ? ? ?Speed Layer,基于Storm實現(xiàn),引擎監(jiān)聽Kafka中收集到的新數(shù)據,把一些對實時性要求高的指標計算完成,寫入展示層。Batch Layer,基于Hadoop生態(tài)實現(xiàn),通過開源項目Camus,把Kafka中監(jiān)聽到的數(shù)據存儲在HDFS中,然后通過HIVE或者M/R的Job,計算各種指標,工作流通過oozie來調度,最終結果也寫入展示層,并且覆蓋掉實時計算的結果。結果數(shù)據根據不同指標,按天、周、月分別存儲在Cassandra中,有很高的寫速度,無限水平擴展。展示層,數(shù)據同時用antlr4j實現(xiàn)了SQL解析,訪問Cassandra中的計算結果。
小結? ? ? ?相比較1.0時期,架構上更合理,擴展性、維護性、魯棒性都有很明顯提升。功能上,完成移動應用研發(fā)大部分組件(統(tǒng)計分析、支付、IM、社交、在線參數(shù)、推送、營銷、云數(shù)據、云存儲、云代碼)。應用的研發(fā)、上線、運維、運營形成閉環(huán),順利完成從對內服務到公共BaaS平臺的升級。團隊上,1-3人一個服務的研發(fā),測試、上線的節(jié)奏可以自己把控。
? ? ? ?當然,業(yè)務在演進,也有新的問題需要去解決。從功能角度,Nginx只能支持靜態(tài)方式設置反向代理,然后reload,而平臺有服務對應的后端服務和端口是有動態(tài)調整需求。從架構角度,在相對成熟的系統(tǒng)中,日志、監(jiān)控這些基礎組件需要統(tǒng)一收集、管理、處理。數(shù)據訪問層、RPC等基礎服務也要標準化。
3.0 平臺化 背景圖6 3.0業(yè)務模型
? ? ? ?對于創(chuàng)業(yè)公司而言,業(yè)務隨時會有調整,作為技術人員,需要能夠應對這種變化,架構上為這些變化做準備。產品向3.0演進由新的業(yè)務需求和架構自身的調整需求共同推動。新的業(yè)務需要支撐一個全網營銷的SaaS產品線,產品支持配置操作生成App + 微信商城 + 手機網站,以及營銷,就是需要本來專注于移動端研發(fā)定位的BaaS,向PaaS化和SaaS前進。架構上是基礎組件需要進行升級,數(shù)據訪問層、RPC、日志、監(jiān)控系統(tǒng)等。于是我們提出一個目標,就是平臺化,數(shù)據訪問的組件以PaaS形式提供給開發(fā)者和內部團隊,標準化API網關、日志、監(jiān)控系統(tǒng)。
設計? ? ? ?設計上依然延續(xù)穩(wěn)定、成熟、解決問題的思路。網關服務作為所有請求的入口,穩(wěn)定、性能、水平擴展是考慮的要素。數(shù)據訪問層,就像一個項目的大動脈,所有的訪問壓力、瓶頸、安全問題會在這里匯合,如何構建一條數(shù)據訪問的高速公路是我們的目標。日志和監(jiān)控,雖然沒有業(yè)務系統(tǒng)那么核心,但是關鍵時刻出現(xiàn)問題需要排查時他們很大程度會影響解決問題的效率,好的監(jiān)控系統(tǒng)能第一時間把正確的信號通知到正確的人,而爛的監(jiān)控只會為運維帶來困擾。
網關? ? ? ?我們設計網關的初衷是替代掉Nginx,在自研的網關上控制規(guī)則轉發(fā)、主機注冊、容器狀態(tài)檢查、負載均衡、服務拒絕、限速等功能。Nginx是非常優(yōu)秀的一個軟件,也滿足一部分網關的功能,但是無法滿足我們不斷進化的需求。
? ? ? ?整個網關系統(tǒng)由規(guī)則控制組件和容器管理組件兩部分組成。后的服務在啟動后,向Hydra-容器管理組件,注冊自己的服務、IP地址和端口信息,Hydra隨后接管容器的生命周期管理,進行健康檢查,F(xiàn)ailover處理,并把相關的信息保存在Zookeeper和MySQL中。規(guī)則控制組件在請求到達后,進行規(guī)制匹配、路由轉發(fā)、限制、限速等處理。
? ? ? ?目前網關用在了大多數(shù)服務中,下步計劃是所有服務統(tǒng)一由網關進行管理,下圖是網關系統(tǒng)的最終形態(tài)。
圖7 3.0網關架構
數(shù)據訪問? ? ? ?結構化的業(yè)務數(shù)據主要存儲在MySQL和MongoDB中,設計上我們增加了數(shù)據代理層,代理層完全兼容MySQL和MongoDB的數(shù)據訪問協(xié)議,讓開發(fā)人員對代理完全無感,表面上是在訪問特定的數(shù)據庫,實際上連接上數(shù)據代理后,由代理對數(shù)據操作做解析和路由。
? ? ? ?當然,如果是僅僅實現(xiàn)代理的功能,有很多開源項目可以使用比如MyCat、MySQL Proxy等,我們對代理有這些需求,數(shù)據訪問路由和配置變更,數(shù)據訪問鑒權和處理,日志采集發(fā)送,流控和服務拒絕。
圖8 3.0公共組件架構
日志系統(tǒng)? ? ? ?設計之初也有考慮自己研發(fā),通過調研后發(fā)現(xiàn)ElasticSearch + Logstash + Kibana完全滿足我們的需求,并且ES的生態(tài)和社區(qū)非常活躍。通過早期幾個服務的試水,最終決定整個平臺基于ELK構建日志系統(tǒng)。
? ? ? ?我們是這樣做的,在每臺主機上部署Logstash Angent采集格式化的日志數(shù)據,向Logstash Server發(fā)送日志。為了降低運維成本,我們把Logstash Forward做成Docker鏡像,通過Salt來管理所有的Agent。Logstash Server在拿到日志信息后,不做任何規(guī)則上的處理,將數(shù)據保存在ES中。其實Logstash Server自身有日志解析和格式化的功能,但這樣做會嚴重影響它的吞吐量,于是我們的方案是把日志標準的流程控制在源頭。接下來,在Kibana中建立各種服務的面板和視圖,便可以進行瀏覽和檢索了,還可以周期對日志進行rotate、分析。
圖9 3.0日志系統(tǒng)
監(jiān)控系統(tǒng)? ? ? ?基于日志系統(tǒng)的基礎架構,不同服務將Metrics輸出到文件系統(tǒng),通過LogStash和ES收集。在Kibana中定義視圖,Kibana使用ES作為自己的存儲引擎。比如新增一個視圖后,Kibana會在ES的.kibana這個索引中創(chuàng)建一份視圖的定義。
? ? ? ?有了Metrics數(shù)據和視圖的展示,下一步是報警。利用Nagios的報警機制,基于JNRPE實現(xiàn)報警的邏輯。報警邏輯通過讀取ES中.kibana某一個視圖的定義,和對應的閾值設置,通過比較當前值和閾值,返回某一個服務對應特定指標的監(jiān)控狀態(tài)。Nagios拿到狀態(tài)后,決定是否報警。
圖10 3.0監(jiān)控系統(tǒng)
小結? ? ? ?相比較2.0時期,統(tǒng)一了主要的基礎組件,降低了不同服務之間重復勞動部分。通過日志系統(tǒng)也提升了定位問題的效率,接下來還會考慮實現(xiàn)一套自己的請求trace系統(tǒng),希望能夠跟蹤整個請求的生命周期,為尋找問題和定位性能瓶頸做參考。
總結? ? ? ?從應用到平臺,公司業(yè)務和產品定位在不斷的演進,架構也隨之發(fā)生了天翻地覆的變化。有一點是我們研發(fā)人員時刻要提醒自己的,不能脫離業(yè)務去談技術,滿足業(yè)務是原動力,一切拋開業(yè)務去空談架構的做法都是耍流氓。
? ? ? ?成熟簡單的技術就是最合適的,踩坑在所難免,但是如何把有限的資源用于做對的事情,不僅對商業(yè)和產品適合,對研發(fā)也同樣適合。互聯(lián)網公司多數(shù)都有由小團隊、小想法、小產品,一步步發(fā)展起來的,在這個過程中能夠通過設計和決策,在正確的時間做正確的事情,讓產品能夠快速迭代,快速上線,才是架構人員最需要考慮的事情。
相關閱讀:
移動云平臺的基礎架構之旅-云應用篇
移動開發(fā)篇_暢談移動云平臺之云代碼的基礎架構設計
微服務系統(tǒng)中的服務發(fā)現(xiàn)機制
作者系力譜宿云 LeapCloud 團隊_云服務負責人:秦鵬【原創(chuàng)】
首發(fā)地址:https://blog.maxleap.cn/archives/940
2014.02 加入上海力譜宿云團隊,啟動云平臺的研發(fā)
負責公司 MaxLeap,MaxWon 后端研發(fā)和維護工作
現(xiàn)任架構和服務部負責人
關注分布式存儲、緩存、中間件、容器技術、微服務、公有云等領域
作者譯作:
微服務實戰(zhàn):從架構到發(fā)布(一)
微服務實戰(zhàn):從架構到發(fā)布(二)
歡迎關注微信訂閱號:從移動到云端(主推技術活動信息+技術文)
歡迎加入我們的力譜宿云 LeapCloud 活動QQ群:555973817,我們將不定期做技術分享活動。
若有轉載需要,請轉發(fā)時注意自帶作者信息一欄并本自媒體公號:力譜宿云 LeapCloud,尊重原創(chuàng)作者的勞動成果~ 謝謝配合~
近期線下技術活動預告:
活動主題:【技術分享】Vert.x中國用戶組(上海地區(qū))第一次技術沙龍
分享內容:
分享主題1:JVM上的高性能Reative工具Vert.x3介紹
分享主題1:Vert.x在maxleap的最佳實踐
分享主題1:Vert-web注解封裝
活動時間:2016/07/24(周日) 14:00 至 2016/07/24 17:00 ?
活動場地:上海浦東新區(qū)金科路2889弄(近祖沖之路)長泰廣場C座12層
報名鏈接:http://www.hdb.com/party/ydtru-comm.html
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/26637.html
摘要:通過新鮮出爐的調研數(shù)據讓我們一起來看看年中國市場云計算有哪些新的亮點和變化云計算持續(xù)增長,云原生成主要驅動力云依舊是企業(yè)級用戶年的第一戰(zhàn)略重點。調查顯示圖,目前中國企業(yè)將通過企業(yè)級一致性混合多云布局工業(yè)互聯(lián)網作為戰(zhàn)略重點。云計算從最初的概念到如今的廣泛落地,企業(yè)上云之路在逐漸豐富的同時,對于云的需求也在逐漸發(fā)生變化就IT現(xiàn)代化,相對于早期的云敏態(tài)和傳統(tǒng)架構穩(wěn)態(tài),如今企業(yè)用戶面臨更多的是如何打...
摘要:在該階段,云計算的網絡基礎架構如何結合新的趨勢,更好地支撐云計算從試點到實用階段的轉型,顯得尤為關鍵。對未來云計算網絡架構的幾點思考彈性網絡易管理網絡和開放的網絡,這個需求的提出是適應未來云計算的支撐關鍵。 針對云計算的變革,文章分析云計算發(fā)展的幾大趨勢,闡述適應云計算的關鍵是要提供高彈性、高擴展性、易管理和開放的網絡,并建議未來理想的云計算網絡架構應是一個無阻塞、可自愈、即插即用的黑盒網絡...
摘要:記者日前采訪了騰訊云高級工程師周顯平,對騰訊云的建設情況進行了深入探討。目前騰訊云的能力已覆蓋基礎設施等各個層級。騰訊云目前在大垂直行業(yè)多細分領域已經深耕出多種業(yè)務場景,包括基于平臺實時音視頻能源管理服務的智能家居智能零售智能能源等。讓地球上的每一粒沙子都有地址,沒錯,我們今天要談的是IPv6。在互聯(lián)網的發(fā)展進程中,TCP/IP協(xié)議是一塊重要的基石。其中,IP是網絡層協(xié)議,通過它才可以規(guī)范互...
摘要:架構演進單機架構以淘寶作為例子。隨著用戶數(shù)的增長,并發(fā)讀寫數(shù)據庫成為瓶頸第二次演進引入本地緩存和分布式緩存在同服務器上或同中增加本地緩存,并在外部增加分布式緩存,緩存熱門商品信息或熱門商品的頁面等。 1. 概述 本文以淘寶作為例子,介紹從一百個并發(fā)到千萬級并發(fā)情況下服務端的架構的演進過程,同時列舉出每個演進階段會遇到的相關技術,讓大家對架構的演進有一個整體的認知,文章最后匯總了一些架構...
閱讀 4183·2023-04-26 02:40
閱讀 2667·2023-04-26 02:31
閱讀 2760·2021-11-15 18:08
閱讀 577·2021-11-12 10:36
閱讀 1436·2021-09-30 09:57
閱讀 5210·2021-09-22 15:31
閱讀 2639·2019-08-30 14:17
閱讀 1286·2019-08-30 12:58