摘要:快杰云主機(jī)搭建??旖茉浦鳈C(jī),搭載選用第二代處理器,主頻,領(lǐng)先的制程工藝帶來顯著的性能提升,使之打破總體性價比世界記錄。因此,糖豆與神策數(shù)據(jù)此次最終共同選擇了快杰服務(wù)器。
在涼風(fēng)習(xí)習(xí)的夜晚里,璀璨的燈火映照下,隨處都能碰到翩翩起舞的人群,這就是廣場舞,在這嘹亮、節(jié)奏鮮明的歌聲里有一款大媽們熱愛的APP—-?糖豆APP。
在發(fā)展之初,多家企業(yè)看好廣場舞這個賽道,而糖豆創(chuàng)業(yè)初期,也同樣面臨不了解用戶畫像、客戶端crash、發(fā)展方向、決策依據(jù)等關(guān)乎企業(yè)命運(yùn)的問題。例如:
這些問題不但困擾著小糖,也困擾著當(dāng)時整個行業(yè)。幸運(yùn)的是,小糖當(dāng)機(jī)立斷,做出了一系列明智的決定。
作為IaaS服務(wù)商,UCloud也有幸見證小糖成長的過程,見證了這段不為人知的往事。并且希望通過分享出這段經(jīng)歷,以幫助到開辟新賽道的創(chuàng)業(yè)者們提供參考和啟發(fā),抓住快速發(fā)展的機(jī)遇脫穎而出。
就以上問題,當(dāng)時小糖選擇的是:用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)賦能業(yè)務(wù)。在實(shí)現(xiàn)的路徑中,當(dāng)時存在兩種選擇:
1、自建BI優(yōu)勢:
劣勢:
2、購買數(shù)據(jù)服務(wù)優(yōu)勢:
劣勢:
通過對比調(diào)研,公司最后決定采用專業(yè)的數(shù)據(jù)分析服務(wù)商——神策數(shù)據(jù)。依靠正確運(yùn)營決策帶來的業(yè)務(wù)增速,和APP穩(wěn)定性帶來的良好體驗(yàn),小糖抓住了這個黃金時期,從該賽道脫穎而出。?
小糖提出運(yùn)營目標(biāo),包括:
針對小糖的核心訴求1
神策提供了數(shù)字化運(yùn)營閉環(huán)解決方案,該解決方案是神策數(shù)據(jù)凝練四年多的數(shù)據(jù)采集、用戶行為分析研究經(jīng)驗(yàn),同時融合服務(wù)的 1000+ 各行業(yè)標(biāo)桿企業(yè)客戶成功經(jīng)驗(yàn)打磨出的一套完整的筑就業(yè)務(wù)數(shù)據(jù)流閉環(huán)的解決方案,全面擊破企業(yè)在數(shù)據(jù)采集、用戶洞察、業(yè)務(wù)行動、分析反饋四個關(guān)鍵環(huán)節(jié)的難點(diǎn),為企業(yè)增長筑就超強(qiáng)引擎。
?針對核心訴求2
神策對在糖豆APP客戶端中嵌入了其采集數(shù)據(jù)的SDK,作為終端埋點(diǎn),并做好用戶關(guān)聯(lián),進(jìn)行事件采集和用戶屬性設(shè)置。海量的終端數(shù)據(jù)匯總到神策分析平臺,提供全功能的多維分析能力剖析用戶行為——維度、指標(biāo)不需要預(yù)定義,漏斗分析、留存分析、分布分析都可以任意維度下鉆。
在神策分析產(chǎn)品上進(jìn)行數(shù)據(jù)的可視化展現(xiàn),如下圖(為保護(hù)用戶數(shù)據(jù)隱私,所有數(shù)據(jù)均為模擬數(shù)據(jù)):
基礎(chǔ)指標(biāo)留存概覽
針對核心訴求3
按照小糖的私有化部署的需求:
以確保后續(xù)數(shù)據(jù)增長避免帶來的性能問題。
基于以上條件,提供了2套部署方式:
為驗(yàn)證性能、價格、伸縮容能力這3個重要指標(biāo),進(jìn)行了可行性驗(yàn)證。
首先:神策的分析業(yè)務(wù)架構(gòu),如下:
該架構(gòu)很重要的基礎(chǔ)是存儲,這里存儲系統(tǒng)采用了HDFS,查詢引擎則采用了Impala。
Impala是查詢引擎,提供SQL語義,能查詢存儲在Hadoop的HDFS和HBase中的PB級大數(shù)據(jù)。
?接下來,測試:
這里使用的impala性能測試工具,是很出名的impala-tpcds-kit ,Github上開源的地址https://github.com/cloudera/impala-tpcds-kit/。它可以:
1、描述測試基準(zhǔn)與其自身業(yè)務(wù)的相關(guān)性。
2、模擬數(shù)據(jù)生成要具有真實(shí)性。
3、工作負(fù)載的設(shè)定具有可擴(kuò)展性。
4、度量的選取的可理解性。
5、滿足了客觀性與公正性。
6、SQL標(biāo)準(zhǔn)兼容性。所以很好的符合使用前性能、兼容、度量等要求。
被測試的云主機(jī)類型配置如下:
機(jī)型 | 數(shù)量 | CPU | 內(nèi)存 | 磁盤 |
快杰AMD主機(jī) | 3 | 32核 | 64G | 2TB RSSD云盤 |
SSD云盤主機(jī) | 3 | 32核 | 64G | 2TB SSD云盤 |
TPC-DS工具: 是一個面向決策支持系統(tǒng)的包含多維度常規(guī)應(yīng)用模型的決策支持基準(zhǔn),包括查詢(queries)與數(shù)據(jù)維護(hù)。此基準(zhǔn)對被測系統(tǒng)在決策支持系統(tǒng)層面上的表現(xiàn)進(jìn)行的評估具有代表性。TPC-DS采用星型、雪花型等多維數(shù)據(jù)模式。它包含7張事實(shí)表,17張緯度表平均每張表含有18列。其工作負(fù)載包含99個SQL查詢,覆蓋SQL99和2003的核心部分以及OLAP。這個測試集包含對大數(shù)據(jù)集的統(tǒng)計(jì)、報(bào)表生成、聯(lián)機(jī)查詢、數(shù)據(jù)挖掘等復(fù)雜應(yīng)用,測試用的數(shù)據(jù)和值是有傾斜的,與真實(shí)數(shù)據(jù)一致。可以說TPC-DS是與真實(shí)場景非常接近的一個測試集,也是難度較大的一個測試集。因此TPC-DS成為客觀衡量多個不同Hadoop版本以及SQL on Hadoop技術(shù)的最佳測試集。幾乎所有的測試案例都有很高的IO負(fù)載和CPU計(jì)算需求。
采用Cloudera Manager在快杰主機(jī)上,部署大數(shù)據(jù)環(huán)境,示意圖如下:
測試數(shù)據(jù)量在500G的情況下,SQL查詢時間在快杰AMD主機(jī)和SSD云盤主機(jī)的對比如下表:
快杰AMD云主機(jī)的各項(xiàng)性能指標(biāo)都超過了SSD云盤云主機(jī),綜合來看,查詢性能提升44.98%。從磁盤的成本角度上,RSSD云盤和SSD云盤都是0.6元/月/GB,成本并沒有增加。
1、快杰云主機(jī)的底層存儲采用最新的NVMe SSD磁盤,使用高性能RDMA(遠(yuǎn)程直接數(shù)據(jù)存?。┳鳛楹蠖舜鎯Φ耐ㄐ艆f(xié)議,實(shí)現(xiàn)遠(yuǎn)端存儲卸載到硬件,使得云盤的延遲降低到0.1毫秒,體驗(yàn)幾乎和本地盤一致,高并發(fā)下依然保持低時延。RDMA 是通過網(wǎng)絡(luò)把資料直接傳入計(jì)算機(jī)的存儲區(qū),將數(shù)據(jù)從一個系統(tǒng)快速移動到遠(yuǎn)程系統(tǒng)存儲器中,而不對操作系統(tǒng)造成任何影響,這樣就不需要用到多少計(jì)算機(jī)的處理功能.它消除了外部存儲器復(fù)制和文本交換操作,因而能騰出總線空間和CPU 周期用于改進(jìn)應(yīng)用系統(tǒng)性能. 目前通用的做法需由系統(tǒng)先對傳入的信息進(jìn)行分析與標(biāo)記,然后再存儲到正確的區(qū)域.整體結(jié)構(gòu)如圖所示。
同時,配合25G 底層物理網(wǎng)絡(luò),隨機(jī)讀寫性能達(dá)到最佳,實(shí)現(xiàn)120萬IOPS。
2、快杰云主機(jī)將底層數(shù)據(jù)中心網(wǎng)絡(luò)環(huán)境從10G升級到了25G;配備了Mellanox智能網(wǎng)卡實(shí)現(xiàn)了網(wǎng)絡(luò)加速,配合軟件的優(yōu)化,使得網(wǎng)絡(luò)性能有了大幅的提升:內(nèi)網(wǎng)帶寬提升2.5倍,內(nèi)網(wǎng)包量提升超過10倍、最高可達(dá)1000萬PPS。
3、快杰云主機(jī),搭載AMD選用第二代EPYC 處理器,主頻2.9GHZ,領(lǐng)先的7nm制程工藝帶來顯著的性能提升,使之打破TPC Benchmark總體性價比世界記錄。?
因此,糖豆與神策數(shù)據(jù)此次最終共同選擇了快杰服務(wù)器。通過實(shí)際運(yùn)行結(jié)果看,確實(shí)達(dá)到了業(yè)務(wù)當(dāng)初的性能要求、并且也達(dá)到了業(yè)務(wù)增長后的性能要求和容量要求。直到現(xiàn)在,依然每天支持著海量的數(shù)據(jù)記錄上報(bào)、分析、統(tǒng)計(jì)。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/117624.html
摘要:宋體在這場戰(zhàn)疫中,快杰云主機(jī)歷經(jīng)了多項(xiàng)考驗(yàn),在計(jì)算網(wǎng)絡(luò)存儲各方面均具備優(yōu)異性能。宋體宋體宋體快杰云主機(jī)的優(yōu)異表現(xiàn)依托于產(chǎn)品的技術(shù)優(yōu)化,來看一組快杰云主機(jī)的配置參數(shù)搭載最新硬盤網(wǎng)絡(luò),并通過最新的智能網(wǎng)卡提供硬件卸載。新冠肺炎催生了辦公、醫(yī)療、教育等行業(yè)的線上解決,加速了各行業(yè)與云的結(jié)合,也對不少服務(wù)企業(yè)提出了新的考驗(yàn):持續(xù)攀登的高并發(fā)、多連接,需要更加高性能穩(wěn)定的云平臺支撐,確保不宕機(jī)、不卡斷...
摘要:月日,國際芯片巨頭英特爾面向全球正式發(fā)布了基于制程工藝打造的第三代英特爾至強(qiáng)可擴(kuò)展處理器,代號。而作為英特爾全球戰(zhàn)略合作伙伴之一的,也將于月首發(fā)搭載全新一代至強(qiáng)處理器的升級版快杰型云主機(jī)。4月7日,國際芯片巨頭英特爾面向全球正式發(fā)布了基于10nm制程工藝打造的第三代英特爾? 至強(qiáng)? 可擴(kuò)展處理器 ,代號Ice Lake。而作為英特爾全球戰(zhàn)略合作伙伴之一的UCloud,也將于5月首發(fā)搭載全新一...
摘要:旗下產(chǎn)品有藍(lán)威仿真云計(jì)算平臺藍(lán)威風(fēng)場規(guī)劃智能決策平臺電子可靠性分析云平臺。而快杰云主機(jī)采用了第二代處理器,主頻高達(dá)另外,云主機(jī)采用的網(wǎng)絡(luò)增強(qiáng)技術(shù)使得內(nèi)網(wǎng)的最大包量可達(dá)萬,同步配置的云盤帶來的存儲性能高達(dá)萬。過去,高性能計(jì)算(HPC)因其高昂的成本和復(fù)雜的編程,長期只能被應(yīng)用于軍事、科研等高精尖領(lǐng)域。隨著工業(yè)制造、生物醫(yī)藥、基因檢測、影視渲染等行業(yè)的數(shù)字化轉(zhuǎn)型,各領(lǐng)域?qū)τ诟咝阅苄酒?、存儲和?nèi)網(wǎng)...
閱讀 2580·2021-11-22 13:53
閱讀 4091·2021-09-28 09:47
閱讀 877·2021-09-22 15:33
閱讀 824·2020-12-03 17:17
閱讀 3322·2019-08-30 13:13
閱讀 2129·2019-08-29 16:09
閱讀 1184·2019-08-29 12:24
閱讀 2455·2019-08-28 18:14