摘要:請(qǐng)?jiān)徫乙韵滤薪貓D中都是使用的中文,有些地方翻譯略顯生硬。本來(lái)系統(tǒng)是使用的英文,奈何領(lǐng)導(dǎo)要求中文呀。時(shí)間字段的表示時(shí)間屬性必須勾選上一般會(huì)時(shí)間列默認(rèn)勾選??筛鶕?jù)來(lái)排查問(wèn)題所在,并且系統(tǒng)為用戶(hù)提供版的查詢(xún)工具來(lái)操作數(shù)據(jù)庫(kù)。
Superset簡(jiǎn)介Superset是一個(gè)受Apache軟件基金會(huì)支持的處于孵化階段的企業(yè)級(jí)數(shù)據(jù)可視化web項(xiàng)目。具有以下特點(diǎn):
內(nèi)含豐富的數(shù)據(jù)圖表樣式
支持多種數(shù)據(jù)源(Oracle、MySQL、Postgres, MariaDB等等)
提供易用的界面來(lái)自定義可視化數(shù)據(jù)
提供一個(gè)Web版SQL查詢(xún)工具
提供OpenID, LDAP, OAuth等多種認(rèn)證方式,易于集成。
Superset的主要功能是將基礎(chǔ)數(shù)據(jù)以直觀的可視化圖表形式渲染出來(lái)。本文檔對(duì)數(shù)據(jù)源的配置、自定義可視化數(shù)據(jù)進(jìn)行介紹。關(guān)于Superset的安裝不在本文探討范圍內(nèi),官方文檔中提供了基于docker的一鍵化安裝教程。
為了形象的表明Superset能做什么,最直接的方式就是放圖了。比如它能根據(jù)數(shù)據(jù)生成如下的圖表,只需要配置好了數(shù)據(jù)源,不需要編寫(xiě)一行代碼便可生成可視化圖表。前端再也不用和Echart打交道,后端增刪改查小王子也不要寫(xiě)代碼了。
當(dāng)然這只是最基礎(chǔ)的,下面還有賊多炫酷的圖表,恐怖的讓人不禁瑟瑟發(fā)抖。本人目前公司才用到一些基本圖表,暫時(shí)感覺(jué)數(shù)據(jù)可視化方面還是挺滿(mǎn)足項(xiàng)目需求的。
數(shù)據(jù)源的配置
可視化數(shù)據(jù)的前提是必須有數(shù)據(jù)源為其提供基礎(chǔ)數(shù)據(jù)。本節(jié)介紹如何配置可靠的數(shù)據(jù)源。Superset支持多種數(shù)據(jù)庫(kù)充當(dāng)數(shù)據(jù)源,如:Oracle、MySQL、Postgres, MariaDB等等。本節(jié)以O(shè)racle為例。
新增數(shù)據(jù)庫(kù)請(qǐng)?jiān)徫乙韵滤薪貓D中都是使用的中文,有些地方翻譯略顯生硬。本來(lái)系統(tǒng)是使用的英文,奈何領(lǐng)導(dǎo)要求中文呀。
①點(diǎn)擊數(shù)據(jù)源選擇數(shù)據(jù)庫(kù),進(jìn)入頁(yè)面后點(diǎn)擊右上角綠色的+號(hào)新增一個(gè)數(shù)據(jù)庫(kù)
②填寫(xiě)數(shù)據(jù)庫(kù)配置相關(guān)信息,點(diǎn)擊測(cè)試連接,出現(xiàn)seems OK!表明數(shù)據(jù)庫(kù)連接成功。
注:勾選“在SQL工具中公開(kāi)”選項(xiàng)則表明允許在Superset提供的SQL查詢(xún)工具中對(duì)該數(shù)據(jù)庫(kù)進(jìn)行操作,按需勾選。
新增數(shù)據(jù)表①點(diǎn)擊數(shù)據(jù)源選擇數(shù)據(jù)表,進(jìn)入頁(yè)面后點(diǎn)擊右上角的+號(hào)新增一個(gè)數(shù)據(jù)表
②下拉選擇剛剛配置的數(shù)據(jù)庫(kù),并填寫(xiě)數(shù)據(jù)庫(kù)中存在的某個(gè)表名,點(diǎn)擊保存
③點(diǎn)擊編輯表,在列列表中頁(yè)面中為每個(gè)列勾選后續(xù)數(shù)據(jù)分析時(shí)會(huì)使用到的一些屬性,
注:可分組和可過(guò)濾按需勾選,表示在后續(xù)分析數(shù)據(jù)時(shí)是否支持根據(jù)該列進(jìn)行分組和過(guò)濾。時(shí)間字段的表示時(shí)間屬性必須勾選上(一般Superset會(huì)時(shí)間列默認(rèn)勾選)。
經(jīng)過(guò)上述操作,我們便為后續(xù)的數(shù)據(jù)可視化操作提供了一個(gè)數(shù)據(jù)表充當(dāng)數(shù)據(jù)源。
新增看板數(shù)據(jù)源配置好后我們還需要新增一個(gè)看板用來(lái)保存我們之后生成的可視化圖表。你可以把看板理解成一個(gè)文件夾,用來(lái)存儲(chǔ)一系列相關(guān)的圖表
①點(diǎn)擊看板,進(jìn)入頁(yè)面后點(diǎn)擊右上角的+號(hào)新增一個(gè)看板
②填寫(xiě)看板名并選擇所屬者,點(diǎn)擊保存
完成上述操作后,我們便在系統(tǒng)內(nèi)新增了一個(gè)“景區(qū)指標(biāo)”看板來(lái)存儲(chǔ)后續(xù)生成的可視化圖表。
自定義可視化圖表現(xiàn)在所有準(zhǔn)備工作都已經(jīng)完成,可以正式開(kāi)始生成可視化圖表。為了事情的發(fā)展順利,先給出上一節(jié)中新增數(shù)據(jù)表的結(jié)構(gòu)信息:
仔細(xì)觀察上表的字段,該表的每條記錄表示某個(gè)景區(qū)某天某種出行方式出行的游客總?cè)藬?shù)。我們假設(shè)本次數(shù)據(jù)可視化的任務(wù)是將景區(qū)編號(hào)為201_1的景區(qū)前一周游客的出行方式渲染成可視化圖表。
配置可視化圖表
注意:盡管Superset提供了一個(gè)易用的配置界面來(lái)配置可視化圖表,但可能還是需要用戶(hù)在一定程度上熟悉簡(jiǎn)單的SQL語(yǔ)法。所以,如果你不熟悉SQL語(yǔ)法,那么下面的內(nèi)容對(duì)你來(lái)說(shuō)可能會(huì)略顯吃力。
①選擇需要分析的數(shù)據(jù)表
②配置圖表(以餅圖為例) 點(diǎn)擊數(shù)據(jù)表后進(jìn)入配置頁(yè)面。注意,我們的目的是:將景區(qū)編號(hào)為201_1的景區(qū)前一周游客的出行方式渲染成可視化圖表。 按如下步驟自定義配置參數(shù): 步驟一:選擇圖表類(lèi)型為餅圖
步驟二:篩選前一周數(shù)據(jù)
步驟三:篩選景區(qū)編號(hào)為201_1的數(shù)據(jù)
步驟四:設(shè)置分組條件,此處根據(jù)出行方式進(jìn)行分組
步驟五:配置分析的指標(biāo),此處為游客人數(shù)。(sum表示對(duì)每個(gè)分組的人數(shù)求和)
步驟六:設(shè)置行限制,此處可留空,如果說(shuō)僅需顯示出行方式排行前10的數(shù)據(jù)則可將行限制設(shè)置為10
步驟7:點(diǎn)擊左上角運(yùn)行查詢(xún)按鈕,查看數(shù)據(jù)渲染結(jié)果
保存可視化圖表
通過(guò)上述步驟現(xiàn)在已經(jīng)配置好了一個(gè)可視化圖表。我們可以將其持久化保存。如圖:將圖表配置保存并將生成的可視化圖表保存到第一步配置的“景區(qū)指標(biāo)”看板中。
查看生成的可視化圖表
點(diǎn)擊這兩個(gè)條目可查看剛剛保存的圖表配置和生成的可視化圖表。
常見(jiàn)問(wèn)題
通過(guò)上述的幾節(jié)已經(jīng)完整的介紹了Superset配置可視化圖表的操作步驟,本節(jié)列出一些困擾使用者的常見(jiàn)問(wèn)題:
Q1:指標(biāo)可以是某個(gè)字段名而非聚集函數(shù)嗎?
A:這個(gè)具體由不同的圖表類(lèi)型決定,一般來(lái)說(shuō)都是聚集函數(shù)。
Q2:允許多個(gè)表的聯(lián)合查詢(xún)嗎?
A:Superset不能直接使用聯(lián)合查詢(xún),只能從單個(gè)表查找數(shù)據(jù)。但是它提供的視圖的概念,可以編寫(xiě)視圖SQL,最終在視圖上執(zhí)行單表查詢(xún)操作。視圖的配置見(jiàn)下圖:
1、點(diǎn)擊編輯表
2、編寫(xiě)SQL語(yǔ)句,以SQL的結(jié)果集作為視圖。
Q3:如何校驗(yàn)數(shù)據(jù)的正誤?
A:Superset提供的數(shù)據(jù)分析是建立在SQL基礎(chǔ)上的,在配置可視化圖表階段,點(diǎn)擊右上方的列表按鈕,可以查看到查詢(xún)執(zhí)行的實(shí)際SQL以及返回的原始數(shù)據(jù)結(jié)果。通過(guò)查看SQL和結(jié)果集來(lái)校驗(yàn)正誤。
Q4:為何配置圖表后點(diǎn)擊運(yùn)行查詢(xún)無(wú)反應(yīng)"); 此種情況說(shuō)明系統(tǒng)根據(jù)你的配置生成的查詢(xún)SQL有問(wèn)題。可根據(jù)Q3來(lái)排查問(wèn)題所在,并且系統(tǒng)為用戶(hù)提供Web版的SQL查詢(xún)工具來(lái)操作數(shù)據(jù)庫(kù)。
常見(jiàn)圖表類(lèi)型配置上文中以餅圖為例展示了可視化圖表的配置,本節(jié)給出常見(jiàn)的柱狀圖以及時(shí)間折線圖的配置方法。Superset允許眾多的圖表類(lèi)型,其余類(lèi)型需要用戶(hù)自己去嘗試。 由于篇幅問(wèn)題,僅給出配置,詳細(xì)步驟略去。
柱狀圖目的:渲染201_1景區(qū)前一天的游客出行方式
時(shí)間折線圖
目的:渲染201_1景區(qū)游客每種出行方式不同日期的對(duì)比
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/7388.html
摘要:概述我非常認(rèn)同前百度數(shù)據(jù)工程師現(xiàn)神策分析創(chuàng)始人桑老師最近談到的數(shù)據(jù)分析三重境界統(tǒng)計(jì)計(jì)數(shù)多維分析機(jī)器學(xué)習(xí)數(shù)據(jù)分析的統(tǒng)計(jì)計(jì)數(shù)和多維分析,我們通常稱(chēng)之為數(shù)據(jù)探索式分析,這個(gè)步驟旨在了解數(shù)據(jù)的特性,有助于我們進(jìn)一步挖掘數(shù)據(jù)的價(jià)值。 showImg(https://camo.githubusercontent.com/f98421e503a81176b003ddd310d97e1e1214625...
摘要:安裝遠(yuǎn)程主機(jī)強(qiáng)迫關(guān)閉了一個(gè)現(xiàn)有的連接。安裝包測(cè)試連接參考數(shù)據(jù)可視化平臺(tái)使用心得一小時(shí)建立數(shù)據(jù)分析平臺(tái) 安裝 pip superset curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py python get-pip.py λ pip install superset Collecting superset Download...
閱讀 1460·2021-09-22 16:04
閱讀 2813·2019-08-30 15:44
閱讀 899·2019-08-30 15:43
閱讀 779·2019-08-29 15:24
閱讀 1860·2019-08-29 14:07
閱讀 1150·2019-08-29 12:30
閱讀 1744·2019-08-29 11:15
閱讀 2753·2019-08-28 18:08