摘要:俗名德魯伊是一個(gè)為在大數(shù)據(jù)集之上做實(shí)時(shí)統(tǒng)計(jì)分析而設(shè)計(jì)的開源數(shù)據(jù)存儲(chǔ)。下文都以德魯伊代表為什么創(chuàng)建德魯伊在最近幾年,互聯(lián)網(wǎng)技術(shù)的快速增長已經(jīng)產(chǎn)生了大量由機(jī)器產(chǎn)生的數(shù)據(jù)。通過請求訪問數(shù)據(jù)庫
什么是druid
與某連接池同名,但完全是兩個(gè)東西。Druid(俗名德魯伊)是一個(gè)為在大數(shù)據(jù)集之上做實(shí)時(shí)統(tǒng)計(jì)分析而設(shè)計(jì)的開源數(shù)據(jù)存儲(chǔ)。這個(gè)系統(tǒng)集合了一個(gè)面向列存儲(chǔ)的層,一個(gè)分布式、shared-nothing(共享)的架構(gòu),和一個(gè)高級(jí)的索引結(jié)構(gòu),來達(dá)成在秒級(jí)以內(nèi)對十億行級(jí)別的表進(jìn)行任意的探索分析。下文都以德魯伊代表druid
為什么創(chuàng)建德魯伊在最近幾年,互聯(lián)網(wǎng)技術(shù)的快速增長已經(jīng)產(chǎn)生了大量由機(jī)器產(chǎn)生的數(shù)據(jù)。多帶帶來看,這些數(shù)據(jù)包含很少的有用信息,價(jià)值都是很低的。雖然有基礎(chǔ)設(shè)施可以處理,但是價(jià)格極高
隨后出現(xiàn)了的hadoop擅長的是存儲(chǔ)和獲取大規(guī)模數(shù)據(jù),但是它并不提供任何性能上的保證它能多快獲取到數(shù)據(jù)。而且不能保證存入的數(shù)據(jù)立即可見
Metamarkets的產(chǎn)品開發(fā)在嘗試了關(guān)系型數(shù)據(jù)庫管理系統(tǒng)和NoSQL架構(gòu)后。得到一個(gè)結(jié)論,就是在開源的世界里,并沒有可以充分滿足我們需求的系統(tǒng)。最后我們創(chuàng)建了Druid
基于時(shí)間范圍查詢的類型
topN類型基于單維度的排名查詢
groupby類型基于多維度的分組查詢
具體如何使用詳見官方文檔
http://druid.io/docs/0.12.1/q...
簡單地說就是拼接符合要求的json。通過http請求訪問數(shù)據(jù)庫
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/76523.html
摘要:大數(shù)據(jù)架構(gòu)設(shè)計(jì)階段分布式。大數(shù)據(jù)數(shù)據(jù)采集階段。大數(shù)據(jù),或稱巨量資料,指的是需要新處理模式才能具有更強(qiáng)的決策力洞察力和流程優(yōu)化能力的海量高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)的特點(diǎn)大量高速多樣價(jià)值密度真實(shí)性。基礎(chǔ)階段:Linux、Docker、KVM、MySQL基礎(chǔ)、Oracle基礎(chǔ)、MongoDB、redis。hadoop mapreduce hdfs yarn:hadoop大數(shù)據(jù)存儲(chǔ)階段:hb...
閱讀 882·2021-11-18 10:02
閱讀 1705·2019-08-30 15:56
閱讀 2578·2019-08-30 13:47
閱讀 2649·2019-08-29 12:43
閱讀 864·2019-08-29 11:19
閱讀 1795·2019-08-28 18:23
閱讀 2680·2019-08-26 12:23
閱讀 3020·2019-08-23 15:29