成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

基于TableStore的數(shù)據(jù)采集分析系統(tǒng)介紹

niuxiaowei111 / 3114人閱讀

摘要:今天我們來介紹一下基于阿里云表格存儲,以及相關(guān)的大數(shù)據(jù)產(chǎn)品來采集與分析數(shù)據(jù)的方案。我們嘗試一種基于和阿里云其他大數(shù)據(jù)產(chǎn)品的新方案,我們先看架構(gòu)圖圖中關(guān)鍵路徑分析頁等客戶端先通過埋點系統(tǒng)收集數(shù)據(jù),然后通過表格存儲的將數(shù)據(jù)寫入的原始數(shù)據(jù)表。

摘要: 摘要 在互聯(lián)網(wǎng)高度發(fā)達的今天,ipad、手機等智能終端設(shè)備隨處可見,運行在其中的APP、網(wǎng)站也非常多,如何采集終端數(shù)據(jù)進行分析,提升軟件的品質(zhì)非常重要,例如PV/UV統(tǒng)計、用戶行為數(shù)據(jù)統(tǒng)計與分析等。雖然場景簡單,但是數(shù)據(jù)量大,對系統(tǒng)的吞吐量、實時性、分析能力、查詢能力都有較高的要求,搭建起來并不容易。

摘要

在互聯(lián)網(wǎng)高度發(fā)達的今天,ipad、手機等智能終端設(shè)備隨處可見,運行在其中的APP、網(wǎng)站也非常多,如何采集終端數(shù)據(jù)進行分析,提升軟件的品質(zhì)非常重要,例如PV/UV統(tǒng)計、用戶行為數(shù)據(jù)統(tǒng)計與分析等。雖然場景簡單,但是數(shù)據(jù)量大,對系統(tǒng)的吞吐量、實時性、分析能力、查詢能力都有較高的要求,搭建起來并不容易。今天我們來介紹一下基于阿里云表格存儲,以及相關(guān)的大數(shù)據(jù)產(chǎn)品來采集與分析數(shù)據(jù)的方案。

TableStore

TableStore(表格存儲)是阿里云自主研發(fā)的專業(yè)級分布式NoSQL數(shù)據(jù)庫,是基于共享存儲的高性能、低成本、易擴展、全托管的半結(jié)構(gòu)化數(shù)據(jù)存儲平臺,支撐互聯(lián)網(wǎng)和物聯(lián)網(wǎng)數(shù)據(jù)的高效計算與分析。

目前不管是阿里巴巴集團內(nèi)部,還是外部公有云用戶,都有成千上萬的系統(tǒng)在使用。覆蓋了重吞吐的離線應(yīng)用,以及重穩(wěn)定性,性能敏感的在線應(yīng)用。表格存儲的具體的特性可以看下面這張圖片。

基于TableStore的數(shù)據(jù)采集分析系統(tǒng)

一個典型的數(shù)據(jù)采集分析統(tǒng)計平臺,對數(shù)據(jù)的處理,主要由如下五個步驟組成:

對于上圖流程的具體實現(xiàn),網(wǎng)上有許多可以參考的案例,數(shù)據(jù)在客戶端采集完以后,如果量比較小,我們可能直接在后端的API上做一次透傳,然后持久化到RDBMS類型的數(shù)據(jù)庫中就好了,通過Sql可以進行數(shù)據(jù)分析。如果數(shù)據(jù)量很大,就需要一些中間件來輔助收集和上傳,然后分別將數(shù)據(jù)寫入到在線和離線的系統(tǒng)中,比如先上傳到Flume,F(xiàn)lume可以做數(shù)據(jù)的采集與聚合,再將Flume作為消息的生產(chǎn)者,將生產(chǎn)的消息數(shù)據(jù)通過Kafka Sink發(fā)布到Kafka中,Kafka作為消息隊列的角色,可以對接后端的在線和離線計算平臺。如下圖所示:

引入Flume和Kafka的原因有很多,比如他們可以處理大流量的數(shù)據(jù)、做數(shù)據(jù)聚合、保證數(shù)據(jù)不丟失等,但最關(guān)鍵的原因是他們擁有高吞吐的能力。引入的組件多,系統(tǒng)的復(fù)雜性和成本也會相應(yīng)的增加,上圖中,Spark Streaming/Storm分析完成以后,結(jié)果數(shù)據(jù)還需要引入另外的存儲組件進行存儲,比如HBase/MySQL,如果引入MySQL可能還需要再引入Redis做熱點數(shù)據(jù)緩存,這樣一來就更加復(fù)雜了。
我們嘗試一種基于TableStore和阿里云其他大數(shù)據(jù)產(chǎn)品的新方案,我們先看架構(gòu)圖:

圖中關(guān)鍵路徑分析:
1、Web頁、APP等客戶端先通過埋點系統(tǒng)收集數(shù)據(jù),然后通過表格存儲的SDK將數(shù)據(jù)寫入TableStore的原始數(shù)據(jù)表。
2、MaxCompute直讀TableStore原始數(shù)據(jù)表的數(shù)據(jù)進行分析,然后QuickBI讀取MaxCompute的數(shù)據(jù)進行展示,具體操作可參考:MaxCompute直讀直寫表格存儲、QuickBI新建云數(shù)據(jù)源。
3、TableStore原始數(shù)據(jù)表中的數(shù)據(jù)可增量同步到ElasticSearch或者openSearch中,同步方法參考:TableStore數(shù)據(jù)同步到ElasticSearch,TableStore數(shù)據(jù)同步到OpenSearch。
4、TableStore中的數(shù)據(jù)可增量同步到Blink/Flink進行分析,分析完以后的數(shù)據(jù)再寫回TableStore的結(jié)果數(shù)據(jù)表中,DavaV讀取結(jié)果數(shù)據(jù)表的數(shù)據(jù)進行展示。

新架構(gòu)優(yōu)勢分析
1、客戶端數(shù)據(jù)直讀直寫TableStore,不需要再引入API層進行數(shù)據(jù)透傳,降低了復(fù)雜度,對于大型應(yīng)用來說也減少了不少的服務(wù)器成本。
2、TableStore已經(jīng)對接了豐富了大數(shù)據(jù)組件,包括阿里云的大數(shù)據(jù)產(chǎn)品和開源大數(shù)據(jù)產(chǎn)品,數(shù)據(jù)的同步與讀寫非常容易。
3、實時分析與離線分析后的結(jié)果數(shù)據(jù)再寫回TableStore,DataV直接讀取結(jié)果數(shù)據(jù)進行展示,因為TableStore具備高性能與高吞吐特點,不需要再引入Redis等緩存組件,可以簡化整個系統(tǒng)。

直讀直寫安全問題
關(guān)于數(shù)據(jù)直讀直寫TableStore,大家可能都會想到一個安全的問題,客戶端直連TableStore不是要把AccessKey和AccessId暴露在客戶端嗎?答案是不用,我們使用STSToken授權(quán)訪問TableStore,過程如下圖所示:

TableStore提供的SDK都支持使用STS授權(quán)的方式進行訪問,示例可參考TableStore NodeJs SDK使用STSToken,使用STS方式訪問TableStore需要控制好授權(quán)策略,客戶端不需要的接口請不要授權(quán)。

瀏覽器跨域訪問TableStore:
如果在瀏覽器端直接訪問TableStore,由于瀏覽器有同源策略的限制,會產(chǎn)生跨域問題。因為TableStore的EndPoint域名與用戶Web站點的域名不同。解決這個問題的思路有兩個:一是Web端不直接訪問TableStore,改為先請求自己的Web Server端,Web Server端再使用TableStore SDK來發(fā)起請求,這樣其實就是后端訪問了,問題解決了但也沒了我們直讀直寫的優(yōu)勢;二是TableStore服務(wù)端通過某種方式直接支持js跨域請求,這條路我們正在支持當(dāng)中,當(dāng)前處于開發(fā)階段,支持的方式是cors協(xié)議支持跨域。但目前也有快捷的支持方式,如果您有瀏覽器直接訪問TableStore的需求,可以直接聯(lián)系我們,支持起來也很快。
作者:boxiao

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/61912.html

相關(guān)文章

  • 三款新功能發(fā)布,助力阿里云表格存儲再次升級

    摘要:摘要阿里云表格存儲于近期功能再升級,升級后的表格存儲支持對采集的數(shù)據(jù)進行持久化存儲,其新增支持,以及最新發(fā)布的能夠幫助用戶輕松構(gòu)建千萬級和流系統(tǒng)。功能一支持對采集的數(shù)據(jù)進行持久化存儲阿里云表格存儲支持對采集的數(shù)據(jù)進行持久化存儲。 摘要: 阿里云表格存儲于近期功能再升級,升級后的表格存儲支持對DataHub采集的數(shù)據(jù)進行持久化存儲,其Python SDK新增支持Python 3.x,以及...

    Allen 評論0 收藏0
  • 【客戶案例】智能駕駛行業(yè)如何上云?

    摘要:產(chǎn)品新功能發(fā)布阿里云發(fā)布對象存儲支持默認加密功能對象存儲在客戶端和服務(wù)器端具備全面的安全加密能力。針對小鵬汽車的一系列需求,阿里云為其打造業(yè)界首個定制車載閃電立方深度學(xué)習(xí)解決方案?!咀钚聞討B(tài)】 表格存儲TableStore全新升級,打造統(tǒng)一的在線數(shù)據(jù)存儲平臺! 表格存儲 TableStore 是阿里云面向海量結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)自研的 Serverless NoSQL 數(shù)據(jù)庫,被廣泛用于社...

    kaka 評論0 收藏0
  • 從源碼看Element UI Table組件實現(xiàn)思路

    摘要:接下來來看一下是如何編寫一個組件的,在看源碼之前,首先還是要對他的組件的大致功能有一個了解,這樣我們在看源碼的時候才會知道這一段大概實現(xiàn)了什么功能。最后我實現(xiàn)的功能文檔以及最終的一個樣例 在你實現(xiàn)一個組件過程中,一定要注意一下幾點 將代碼模塊化并且分離。如果你將大量的邏輯或者是代碼都放在鉤子函數(shù)中(比如mounted),那么寫出來的組件代碼將非常丑陋,這樣子寫出的代碼也往往難以維護。...

    moven_j 評論0 收藏0
  • Element UI table組件源碼分析

    摘要:本文章從如下圖所示的最基本的入手,分析組件源代碼。本人已經(jīng)對組件原來的源碼進行削減,源碼點擊這里下載。還有兩個重要的函數(shù)與。在組件的階段會調(diào)用更新,從而觸發(fā)重新渲染。例如當(dāng)組件加載后發(fā)送請求,待請求響應(yīng)賦值,重新渲染。 本文章從如下圖所示的最基本的table入手,分析table組件源代碼。本人已經(jīng)對table組件原來的源碼進行削減,源碼點擊這里下載。本文只對重要的代碼片段進行講解,推薦...

    妤鋒シ 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<