成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

精讀《Tableau 探索式模型》

curried / 3630人閱讀

摘要:比如我們對(duì)調(diào)與會(huì)怎樣我們得到了三個(gè)不同類(lèi)目近個(gè)月的趨勢(shì),之所以是折線(xiàn)圖,因?yàn)閳D表的維度軸列是連續(xù)的。在正式介紹標(biāo)記區(qū)域前,先理解一下為何會(huì)發(fā)生這種轉(zhuǎn)變表格類(lèi)組件是雙維度組件,折線(xiàn)圖是單維度組件。

1. 引言

Tableau 探索式分析功能非常強(qiáng)大,各種功能組合似乎有著無(wú)限的可能性。

今天筆者會(huì)分析這種探索式模型解題思路,一起看看這種探索式分析功能是如何做到的。

2. 精讀

要掌握探索式分析,先要掌握探索式分析背后的思維模型。

理解數(shù)據(jù)

有分析意義的數(shù)據(jù)一般是表結(jié)構(gòu),即分為行與列,列定義了數(shù)據(jù)含義,行則構(gòu)成了數(shù)據(jù)明細(xì)。

當(dāng)我們將數(shù)據(jù)作為 “原材料” 使用時(shí),需要將這些明細(xì)數(shù)據(jù)封裝為 “數(shù)據(jù)集” 的概念來(lái)理解,數(shù)據(jù)集概念中,數(shù)據(jù)就是一個(gè)個(gè)字段,對(duì)于字段,要理解 “維度” 與 “度量” 這兩個(gè)概念。

維度

維度是不能被計(jì)數(shù)的字段,一般為字符串或離散的值,用來(lái)描述數(shù)據(jù)的維度。

度量

度量是可以被計(jì)數(shù)的字段,一般為數(shù)字、日期等連續(xù)的值,用來(lái)描述數(shù)據(jù)的量。

我們首先要將數(shù)據(jù)集字段歸類(lèi)到維度與度量,才能提高數(shù)據(jù)分析的效率。數(shù)據(jù)分析就是從不同維度下看度量值,先想清楚要看的是什么數(shù)據(jù),比如銷(xiāo)量還是利潤(rùn)?這些字段都屬于度量,然后想一想要怎么看這些度量,是看總數(shù)、拆解到年看、還是按地區(qū)看呢?這些字段都屬于維度。

維度和度量是可以多帶帶看的,如果單看維度,那只能看這個(gè)維度的明細(xì),比如看 訂單日期 這個(gè)字段

需要注意的時(shí),維度與度量字段還可以分為 連續(xù)?與 離散?。

連續(xù)?

值是連續(xù)關(guān)系,即任意兩個(gè)值之間可以計(jì)算差值。

離散?

值是離散關(guān)系,即任意兩個(gè)值之間無(wú)法計(jì)算差值,無(wú)法以連續(xù)的方式去理解。

一般來(lái)說(shuō),維度字段都是離散的,度量字段都是連續(xù)的。從字段類(lèi)型意義上也能得出相同的結(jié)論:維度字段一般為字符串或日期類(lèi)型,字符串類(lèi)型都是離散的,度量字段一般為數(shù)字類(lèi)型,數(shù)字天生就可以連續(xù)。

值得注意的是,連續(xù)與離散其實(shí)與字段類(lèi)型、維度度量并無(wú)關(guān)系,比如維度的日期字段就是可連續(xù)的,而就算是字符串類(lèi)型,也可以以字符串長(zhǎng)度等方式 “定義” 一種連續(xù)的計(jì)算方式。對(duì)數(shù)字類(lèi)型的度量字段來(lái)說(shuō),我們也可以忽略數(shù)字之間的聯(lián)系,將數(shù)字看待為字符串,這樣數(shù)字之間就是離散的。

上圖的 “離散方式看日期” 就是看維度的直觀方式,但仍可以用 “連續(xù)方式看日期”:

離散方式下單看維度只有一條條數(shù)據(jù),數(shù)據(jù)間并無(wú)排序規(guī)則,而以連續(xù)方式看維度,維度就會(huì)以某種方式排序:比如上圖以時(shí)間類(lèi)型進(jìn)行排序。此時(shí)展示方式也從表格切換為了柱狀圖,因?yàn)楸砀襁m合展示離散數(shù)據(jù),柱狀圖的一根柱子就可以展示連續(xù)數(shù)據(jù)。

單看度量時(shí),由于 度量要依附于維度展示,因此僅有度量時(shí),只能看這個(gè)度量的 聚合 概念:

如上圖所示,單看銷(xiāo)量這個(gè)度量字段時(shí),我們只能將數(shù)據(jù)集中所有銷(xiāo)量字段聚合在一起來(lái)看,但這種聚合方式也可以分成若干種計(jì)算類(lèi)型 - 求和、平均值、中位數(shù)、計(jì)數(shù)、計(jì)數(shù)去重、最小值、最大值、方差等等:

這些能力之間都是 “正交” 的,即單看度量這一個(gè)字段,可以以這么多種類(lèi)型進(jìn)行計(jì)算,那么按維度拆分后,度量依然可以享受如上不同的計(jì)算方式。

也可以用連續(xù)方式看度量:

與連續(xù)-維度不同,連續(xù)-度量圖形中除了最后一個(gè)值,其他過(guò)渡數(shù)值都是無(wú)效的,因?yàn)檫B續(xù)-度量只有一個(gè)值。連續(xù)-維度也要注意,由于以連續(xù)的方式畫(huà)出圖形,中間不存在的點(diǎn)也被 “無(wú)縫連接” 了。

數(shù)據(jù)之間也可以存在父子級(jí)關(guān)系,有父子級(jí)關(guān)系就可以進(jìn)行上卷下鉆了,這種父子級(jí)關(guān)系被稱(chēng)為 “層系字段”:

上圖的 Orders 就是一個(gè)層系字段。層系字段是幾個(gè)字段的排序組合,由上到下依次構(gòu)成下鉆關(guān)系,從下到上則是上卷的關(guān)系。

層系

只有維度字段才能有層系,因?yàn)槎攘渴遣荒鼙徊鸱值模挥芯S度才可以被拆分。

維度的拆分可以是有邏輯含義的,也可以是任意的。

有邏輯含義的層系?

最典型有邏輯含義的層系字段就是時(shí)間了。一個(gè)好的 BI 系統(tǒng)識(shí)別到日期字段后,應(yīng)該將拿到的日期字段進(jìn)行歸類(lèi),比如判斷日期字段粒度到天,則自動(dòng)生成一個(gè)日期層系字段,自動(dòng)聚合到年,并允許用戶(hù)隨意切換:

如果數(shù)據(jù)集字段值精確到月,則層系只能最多展開(kāi)到月。

日期層系的邏輯含義在于,年、季度、月、天這種下鉆關(guān)系是天然從大到小的關(guān)系,符合自然理解。

任意層系?

如果層系字段不代表日期,就只能以業(yè)務(wù)含義組合層系字段了。比如可以將層系按照 訂單日期 -> 商品 ID -> 運(yùn)貨日期的方式組合:

這種下鉆方式,可以看到每個(gè)訂單日期下有哪些商品,每個(gè)商品分別運(yùn)貨日期是什么。

也可以按照商品 ID 拆分出不同的訂單日期與運(yùn)貨日期,這種層系組合方式就是以商品 ID 為主要視角:

可以看到,不同思維角度會(huì)按照不同的方式組合層系。比如一家大公司要查看財(cái)務(wù)問(wèn)題,維度有:BU、日期,度量有:銷(xiāo)量。

那么有兩種下鉆方式:BU -> 日期、日期 -> BU。無(wú)論哪種下鉆方式,都能看到每個(gè) BU 按日期銷(xiāo)量的明細(xì),但?BU -> 日期 能看到每個(gè) BU 按日期聚合的總銷(xiāo)量,而?日期 -> BU 能看到不同日期按 BU 聚合的總銷(xiāo)量,前者更易對(duì)比出 BU 之間差異,后者更易對(duì)比出日期之間的差異。

理解配置

配置是探索式分析的入口,要理解分析模型首先得理解配置模型。

Table 主要配置分為行、列、標(biāo)記與篩選。通過(guò)這四個(gè)配置區(qū)域可以組合成千變?nèi)f化的數(shù)據(jù)洞察模型。既然如此,讓我們看看這種配置思路是什么,以及為何這四種配置相互組合就能覆蓋整個(gè)探索式分析場(chǎng)景?

我們不需要考慮三維數(shù)據(jù)分析場(chǎng)景,因?yàn)槿S透視的關(guān)系,圖形丟失了精確大小關(guān)系,沒(méi)有精度的數(shù)據(jù)是沒(méi)有分析價(jià)值的。由于在二位平面中分析數(shù)據(jù),大部分圖表都可以用 “行、列” 方式進(jìn)行配置。

也許有人會(huì)問(wèn),為什么不用維度與度量替代行列呢?這是一個(gè)很好的問(wèn)題,有數(shù)據(jù)分析經(jīng)驗(yàn)的人會(huì)站在維度與度量角度思考問(wèn)題,因此對(duì)于任意圖表,只要配置維度、度量即可呀?筆者從三個(gè)方面說(shuō)說(shuō)自己的理解:

探索式分析思路中,不關(guān)心圖表是什么,也不關(guān)心圖表如何展示,因此圖表是千變?nèi)f化的,比如折線(xiàn)圖可以橫過(guò)來(lái),條形圖也可以變成柱狀圖,因此 你將維度放到列,就是一個(gè)柱狀圖,你將維度放到行,就是一個(gè)條形圖?。

將精力真正放到你要拖拽的字段上。由于字段已經(jīng)有維度、度量的區(qū)別,配置區(qū)域就不要再限定維度與度量了,減少理解成本。

維度與度量可以同時(shí)放在行或列上,這是探索式分析的另一個(gè)精髓能力,看下圖:

做探索式分析功能時(shí),要跳出思維定式:為什么條形圖的縱軸不能放維度呢?如上圖所示,如果行拖拽了兩個(gè)不同的度量,那么可以出現(xiàn)兩條線(xiàn)或者雙軸圖,但當(dāng)拖拽一個(gè)維度一個(gè)度量時(shí),可以對(duì)圖表進(jìn)行 分面?,比如觀察 2013 ~ 2016 年不同顧客對(duì)銷(xiāo)量的貢獻(xiàn)。

表格類(lèi)的行、圖表類(lèi)的縱軸。一般建議放置度量字段。

表格類(lèi)的列、圖表類(lèi)的橫軸。一般建議放置維度字段。

如上所示,無(wú)論行還是列,都可以進(jìn)行任意維度度量組合,且字段數(shù)量不限,而且可以在任何層級(jí)進(jìn)行下鉆。對(duì)圖表來(lái)說(shuō),多個(gè)維度時(shí)需要進(jìn)行分面處理:

如上圖所示,將列放置兩個(gè)維度字段成為柱狀圖,那么橫軸就要同時(shí)表示兩個(gè)維度,如上圖所示。如果橫軸還有更多的維度,可以再不斷對(duì)橫軸進(jìn)行拆分。

橫軸(列)多維度字段的順序也會(huì)影響圖表的展現(xiàn)。上圖最后一個(gè)字段是 Category?默認(rèn)是離散的,所以這個(gè)離值就決定了圖表使用柱狀圖,圖表類(lèi)型由維度周最后一個(gè)字段連續(xù)或離散決定。

比如我們對(duì)調(diào) Order Date 與 Category 會(huì)怎樣?

我們得到了三個(gè)不同類(lèi)目近 12 個(gè)月的趨勢(shì),之所以是折線(xiàn)圖,因?yàn)閳D表的維度軸(列)是連續(xù)的。如果我們對(duì) Order Date 進(jìn)行天級(jí)別的下鉆:

可以看到,下鉆功能本質(zhì)上就是維度軸支持對(duì)多個(gè)維度字段拆分處理。只要圖表支持了維度軸任意維度字段的分面展示,那么配置端就可以將下鉆按照拖了多個(gè)字段的方式去理解了。

如果我們將折線(xiàn)圖切換為表格,會(huì)發(fā)生什么?

我們會(huì)發(fā)現(xiàn),原本存在于列的 Category 被自動(dòng)挪到了行,原本存在于行的 Sales 被挪到了 “標(biāo)記” 區(qū)域。在正式介紹 “標(biāo)記” 區(qū)域前,先理解一下為何會(huì)發(fā)生這種轉(zhuǎn)變:

表格類(lèi)組件是雙維度組件,折線(xiàn)圖是單維度組件。也就是表格的行與列都是維度,而折線(xiàn)圖橫軸作為維度后,縱軸就要作為度量。上面的例子中,折線(xiàn)圖維度有兩個(gè)字段,雖然通過(guò)分面方式渲染出來(lái)了,但當(dāng)切換為支持雙維度的表格后, 可以將多余的一個(gè)維度挪到表格組件另一個(gè)維度區(qū)域中。

而表格行與列都是維度的情況下,單元格的值就需要用 “標(biāo)記” 中文本來(lái)表示,因此原折線(xiàn)圖的度量字段自動(dòng)轉(zhuǎn)移到了 “標(biāo)記” 區(qū)域。

標(biāo)記

標(biāo)記區(qū)域也采取字段拖拽的方式,即對(duì)字段進(jìn)行標(biāo)記。

標(biāo)記區(qū)域分為 顏色、大小、標(biāo)簽、詳細(xì)信息、工具提示、路徑。標(biāo)記正如其名,是作用于圖表上的標(biāo)記,即不會(huì)對(duì)圖表框架有實(shí)質(zhì)性影響的輔助標(biāo)記信息。

對(duì)不同圖表來(lái)說(shuō),影響最大的是行與列,它能決定用什么圖表,如何拆分?jǐn)?shù)據(jù)。而標(biāo)記往往是改變圖表中輔助性元素,比如文字或者顏色等等。

工具提示

不影響任何圖像顯示,僅僅在提示信息中新增字段信息。

對(duì)圖表來(lái)說(shuō),指的是 Tooltip 提示信息增加對(duì)應(yīng)的字段:

從上圖可以看到,利潤(rùn)字段放在工具提示區(qū)域,則圖表的 Tooltip 會(huì)新增利潤(rùn)這個(gè)字段的信息。值得關(guān)注的是,Tableau 所有圖表都支持 Tooltip 包括表格:

這保證了配置統(tǒng)一,行為統(tǒng)一。

大小

控制圖表大小。

對(duì)于線(xiàn)圖,控制線(xiàn)的粗細(xì);對(duì)于氣泡圖控制氣泡大小;對(duì)于柱狀圖控制柱子粗細(xì);但是對(duì)面積圖與表格沒(méi)有明顯作用。這得益于 Tableau 將每個(gè)圖表大小屬性盡可能抽象出來(lái)。

文本

即直接展示在圖表上的文本。

對(duì)普通圖表來(lái)說(shuō),文本體現(xiàn)為 Label,即直接展示在圖表上的文字。比如柱狀圖默認(rèn)是沒(méi)有 Label 文字的,要將對(duì)應(yīng)字段拖拽到文本標(biāo)記上才會(huì)出現(xiàn)。

這體現(xiàn)出與普通報(bào)表構(gòu)思的不同。對(duì)普通報(bào)表來(lái)說(shuō),Label 是通過(guò)一個(gè)勾選項(xiàng)開(kāi)啟的,Label 對(duì)應(yīng)的值就是圖表度量這個(gè)字段的值。而 Tableau 將標(biāo)簽值以字段方式開(kāi)放拖拽,就有了展示與值分開(kāi)的可能性,可適用范圍更廣。

有人覺(jué)得長(zhǎng)度和數(shù)字一定要對(duì)應(yīng)上,這也是對(duì)數(shù)據(jù)理解不同導(dǎo)致的。Tableau 將文本(標(biāo)簽)列在標(biāo)記里,說(shuō)明文本和顏色、大小一樣,都是一種附加的信息展示維度,很多時(shí)候不需要兩種方式展示同一種信息,反而需要圖形以更多方式以不同維度展示信息。
顏色

控制圖表的顏色。

比如在度量為銷(xiāo)量時(shí),可以將利潤(rùn)作為顏色,甚至再將折扣作為文本,通過(guò)一個(gè)折線(xiàn)圖同時(shí)看多種度量信息:

與之對(duì)比,我們可以將利潤(rùn)放在右 Y 軸作為雙軸圖達(dá)到相同的效果:

標(biāo)記就是為了在不增加行、列字段數(shù)量基礎(chǔ)上,通過(guò)顏色、大小、標(biāo)簽、工具提示等維度展示出額外信息。

詳細(xì)信息

如果將度量拖拽到詳細(xì)信息,會(huì)發(fā)現(xiàn)完全沒(méi)有作用。因?yàn)?“詳細(xì)信息” 只有拖拽維度字段才生效?!霸敿?xì)信息” 其實(shí)是用作下鉆的,拖拽一個(gè)維度字段后,可以按照這個(gè)維度進(jìn)行下鉆。

如上圖所示,將銷(xiāo)售按照產(chǎn)品線(xiàn)拆解成三條線(xiàn)。但這三條線(xiàn)無(wú)法分辨,因此可以使用顏色來(lái)拆分維度:

這樣就能將拆解的內(nèi)容按不同顏色展示。因此, 對(duì)標(biāo)記作用的字段如果是維度字段,且作用于顏色、大小、標(biāo)簽、詳細(xì)信息時(shí),會(huì)額外進(jìn)行維度進(jìn)行拆解,并對(duì)拆解后的內(nèi)容進(jìn)行顏色或大小區(qū)分。?

相信讀到這里會(huì)有個(gè)疑問(wèn):按照維度進(jìn)行拆解與維度拖拽多個(gè)字段進(jìn)行字段有什么區(qū)別?我們?cè)囈幌驴纯葱Ч瑢a(chǎn)品類(lèi)目維度拖拽到銷(xiāo)量所在的行,對(duì)銷(xiāo)量進(jìn)行銷(xiāo)量維度的拆分:

可以看到,在行、列進(jìn)行的多維度拆分使用的是分面策略,而在標(biāo)記中對(duì)維度進(jìn)行拆分使用的是單圖表多軸方式來(lái)實(shí)現(xiàn)。

除此之外的區(qū)別在于,在標(biāo)記進(jìn)行的維度拆分默認(rèn)作用于度量,而行列上的多維度拆分可以任意作用于維度或度量。

同時(shí)配置端要限制 能拆分的只有維度或離散狀態(tài)的度量?,也就是只有離散狀態(tài)的字段可以被拆分。如上圖所示,我們不能將 Category 拖拽到 Sales 右側(cè),除非將 Sales 設(shè)置為離散類(lèi)型。
Tips:Tables 對(duì)維度與度量分別分配了藍(lán)色、綠色,當(dāng)我們將綠色度量字段設(shè)置為離散類(lèi)型時(shí),這個(gè)度量字段會(huì)變成藍(lán)色,也就是當(dāng)作了維度字段進(jìn)行處理。

最后,標(biāo)記區(qū)域不僅能拖拽字段,還可以單擊后修改詳細(xì)配置,比如修改顏色詳細(xì)配置:

或者對(duì)工具提示的 Tooltip 內(nèi)容進(jìn)行定制:

篩選器

Tableau 將所有篩選條件都收斂到篩選器中,我們可以通過(guò)拖拽字段的方式對(duì)某個(gè)字段進(jìn)行篩選:

如上圖所示,比如只看辦公用品與科技產(chǎn)品。但其實(shí)除了這個(gè)通用功能之外,Tableau 還支持更強(qiáng)大的圖表交互功能,即點(diǎn)擊或圈選圖表后,可以對(duì)選中的點(diǎn)(字段值)進(jìn)行保留或排除:

當(dāng)我們選擇排除這幾個(gè)點(diǎn)時(shí),會(huì)自動(dòng)生成一份對(duì)維度字段的篩選條件排除掉選中日期,所以圖表是完全數(shù)據(jù)驅(qū)動(dòng)的: 一般來(lái)說(shuō)

如果屬性存在下鉆關(guān)系會(huì)如何呢?無(wú)論是行列中對(duì)維度的下鉆,還是通過(guò)標(biāo)記對(duì)維度進(jìn)行了拆解,篩選都是對(duì) 字段層系?生效的:

如上圖所示,對(duì)下鉆后的字段進(jìn)行篩選,那么篩選條件也會(huì)自動(dòng)構(gòu)造出臨時(shí)的字段層系,并對(duì)這個(gè)臨時(shí)層系進(jìn)行篩選。 可以看到,我們不僅能在字段配置區(qū)動(dòng)態(tài)組成層系字段,在篩選器中也可以生成臨時(shí)層系進(jìn)行篩選,我們需要支持任意層系組合的字段,并作用于篩選器、行列,甚至是標(biāo)記上。

順帶一提,我們還可以對(duì)設(shè)置了篩選的字段層系組合拖拽到任意地方使用:

要處理這種場(chǎng)景,我們需要讓所有字段都擁有篩選能力,普通字段等于沒(méi)有篩選條件,我們也可以對(duì)一個(gè)包含了篩選條件的字段拖拽到任何位置作用。

剛才是對(duì)維度進(jìn)行的篩選,有沒(méi)有對(duì)度量進(jìn)行篩選的場(chǎng)景呢?有,但我們只能手動(dòng)將度量字段拖拽到篩選器位置進(jìn)行手動(dòng)篩選:

如果我們進(jìn)行圖表內(nèi)的圈選操作,增加的篩選條件一定是按維度來(lái)的:

這么理解這一行為:維度是離散的,勾選操作能表達(dá)的含義有限,比如勾選折線(xiàn)圖的某些點(diǎn),如何知道我們要勾選的是維度的那幾個(gè)月,還是度量的利潤(rùn)范圍呢?

由于最終勾選操作落地在點(diǎn)上,而不是區(qū)間上(連續(xù)值也不適合進(jìn)行圈選),所以默認(rèn)按對(duì)維度進(jìn)行篩選是最準(zhǔn)確的理解。如果上圖的操作意圖中,你想勾選的不是 6~12 月的區(qū)間,而是銷(xiāo)量在 13k ~ 45.5k,則需要手動(dòng)拖拽利潤(rùn)字段,并精確輸入篩選范圍:

值得注意的是,對(duì)連續(xù)型度量進(jìn)行篩選前,還可選擇聚合方式:比如對(duì)求和的值進(jìn)行范圍篩選,或者對(duì)最大值進(jìn)行范圍篩選,功能十分強(qiáng)大。

理解圖表

圖表是數(shù)據(jù)可視化的載體,只有數(shù)據(jù)與配置,沒(méi)有各式各樣的圖表,很難產(chǎn)生直觀的數(shù)據(jù)洞察。

可以說(shuō), 按照探索式分析的思路,當(dāng)配置好數(shù)據(jù)與配置后,可以有多種可視化載體去展示這種配置信息。?比如行、列分別拖拽了日期與銷(xiāo)量,那么折線(xiàn)圖、表格、散點(diǎn)圖、柱狀圖都可以滿(mǎn)足需求,但如果行所在的字段是離散的,那么折線(xiàn)圖、散點(diǎn)圖就不適合了,這就需要圖表推薦功能根據(jù)配置推薦合適的圖形展示。

Tableau 內(nèi)置的圖表分為 N 大類(lèi) - 表格、地圖、柱折面餅、散點(diǎn)/象限圖 、以及直方圖、盒須圖、甘特圖、靶心圖等。可見(jiàn)分析數(shù)據(jù),不需要太多種類(lèi)可視化展現(xiàn)方式,但對(duì)于每個(gè)圖表組件來(lái)說(shuō),都需要修煉深厚的內(nèi)功,做好一個(gè)表格、折線(xiàn)圖并不簡(jiǎn)單。

行與列

表格、地圖、柱折面餅、散點(diǎn)/象限圖等都可以用行與列描述基本架構(gòu):

表格天然擁有行與列,對(duì)調(diào)后則代表轉(zhuǎn)置。表格的行與列必須是維度字段,如果拖拽度量字段上去會(huì)自動(dòng)切換為其他圖表,再切回來(lái)則會(huì)把度量字段挪動(dòng)到 “文本” 標(biāo)記區(qū)域中。

地圖行與列就是經(jīng)緯度,當(dāng)維度字段放到 “詳細(xì)信息” 時(shí),根據(jù)地理映射表轉(zhuǎn)化為經(jīng)緯度自動(dòng)生成經(jīng)緯度放在行與列。

柱折面餅、散點(diǎn)/象限圖都是直角坐標(biāo)系的圖形,以維度字段作為維度軸,以度量字段作為度量軸。

行列的下鉆?

在行或列存在多個(gè)維度字段時(shí),圖表要進(jìn)行相應(yīng)下鉆。表格對(duì)于行下鉆如下圖所示:

上圖也可以理解為展示出 Order Date 與 Order ID 的明細(xì)數(shù)據(jù),按照 Order Date 分組且列合并。下鉆就是一步步接近明細(xì)數(shù)據(jù)的過(guò)程,但目的不是為了看明細(xì)表,而是看某些維度下按其他維度拆分的詳細(xì)信息。

圖表下鉆和表格思路是一致的:

對(duì)于維度軸多維度下鉆,將每個(gè)維度軸下鉆到更細(xì)粒度。圖表在行與列同時(shí)下鉆時(shí),與表格的表現(xiàn)稍有不同。僅從軸來(lái)看拆解方式是相同的,內(nèi)部展示了多套軸:

可以認(rèn)為,當(dāng)行或列上最后一個(gè)字段為度量時(shí),就會(huì)切換為圖表展示,因?yàn)閳D表適合展示連續(xù)狀態(tài)。如果排除上圖藍(lán)色區(qū)域,剩下的區(qū)域就是個(gè)交叉表,交叉表只是行與列同時(shí)存在維度字段的場(chǎng)景,僅有行或列時(shí)就變成了普通表格;而圖形的下鉆和表格下鉆機(jī)理相同,只是把 “單元格” 的文本換成了柱子或線(xiàn)。

所以對(duì)任何圖表的下鉆,都是對(duì)軸的下鉆,相同的是單元格屬性永遠(yuǎn)不會(huì)改變,表格的單元格是文本,圖形單元格是圖形,一個(gè)簡(jiǎn)單折線(xiàn)圖可以理解為對(duì)整體行與列單元格進(jìn)行 “連續(xù)打通”:

如果繼續(xù)對(duì)行列添加維度進(jìn)行下鉆,其實(shí)是對(duì)軸進(jìn)行下鉆。排除度量字段不看,就是一個(gè)交叉表的下鉆過(guò)程,如下圖所示藍(lán)色框圈住的部分就是一組大的單元格

由于最后一個(gè)字段是度量,因此在葉子結(jié)點(diǎn)的展開(kāi)就不是表格模式的單元格,而是連續(xù)的線(xiàn)條了。

經(jīng)過(guò)上面的總結(jié),我們要意識(shí)到,在探索式分析場(chǎng)景對(duì)行列的下鉆,表格與圖表的邏輯是通用的,實(shí)現(xiàn)時(shí)也要整體考慮。將軸功能抽離成通用部分來(lái)做,表格與圖表的區(qū)別只是對(duì)最后一個(gè)字段單元格是離散處理還是連續(xù)處理。

層系的下鉆?

層系字段下鉆與拖多個(gè)字段表現(xiàn)一致,但由于存在父子關(guān)系,因此在圖表上可以展現(xiàn)出 “展開(kāi)” “收起” 按鈕,點(diǎn)擊后并不是對(duì)圖表本身進(jìn)行操作,而是發(fā)送一個(gè)事件對(duì) “行” 進(jìn)行操作,最后通過(guò)數(shù)據(jù)驅(qū)動(dòng)完成展開(kāi)或收起動(dòng)作。

不適合行列的圖表

餅圖就不適合行列,因?yàn)轱瀳D是根據(jù)離散維度進(jìn)行拆分,扇葉大小可以由一個(gè)度量字段決定,因此對(duì)餅圖來(lái)說(shuō),行就對(duì)應(yīng)到 “顏色”、列就對(duì)應(yīng)到新增的 “角度” 這個(gè)標(biāo)記:

沒(méi)有維度軸的圖表

只有行配置的圖形推薦用表格,但柱狀圖、折線(xiàn)圖也可以支持這種情況,只要把橫軸忽略即可:

從樣式上來(lái)看沒(méi)有橫軸,其實(shí)這種情況是把所有維度的橫軸都聚合后的表現(xiàn)。

連續(xù)與離散值

我們分別看看連續(xù)與離散作用于維度和度量時(shí)的區(qū)別。

作用于度量

圖表要能適配對(duì)連續(xù)或離散值的處理。比如對(duì)銷(xiāo)量來(lái)說(shuō),如果切換為離散值,則當(dāng)成字符串展示:

如果將銷(xiāo)量切換為連續(xù)值,則單元格就要使用線(xiàn)條長(zhǎng)度代表值的大小,即連續(xù)性的值要能夠產(chǎn)生 “對(duì)比感”:

上圖組件是表格,本身適合展示離散值,但可以看到對(duì)連續(xù)值展示做了適配。對(duì)于適合展示連續(xù)值的圖形,則無(wú)法做離散適配:

比如這個(gè)柱狀圖,如果將銷(xiāo)量切換為離散,則會(huì)自動(dòng)切換到表格,因?yàn)閷?duì)于雙離散值用柱折面餅展示是無(wú)意義的。

作用于維度

如上圖所示,就是維度使用了離散字段的例子,由于維度是離散的,因此使用柱狀圖展示,因?yàn)橹娱g也是隔離的。

對(duì)于連續(xù)型字段作用于維度,默認(rèn)適合散點(diǎn)圖,因?yàn)樯Ⅻc(diǎn)圖的行與列都是度量,適合作為默認(rèn)推薦:

但能用散點(diǎn)圖的就也能用線(xiàn)圖, 當(dāng)維度是連續(xù)日期字段時(shí),適合用折線(xiàn)圖而不是散點(diǎn)圖。因?yàn)槿掌陔m然連續(xù),但 本身不適合做比較?,因此作為一種連續(xù)型維度展示比較合適;而散點(diǎn)圖兩個(gè)軸都適合連續(xù)型度量,因此不適合方日期這種連續(xù)型維度字段。

當(dāng)然也具備將折線(xiàn)圖隨時(shí)切換為散點(diǎn)圖的能力,但這種圖形沒(méi)有什么業(yè)務(wù)價(jià)值:

因此我們對(duì)折線(xiàn)圖進(jìn)行標(biāo)記:行適合連續(xù)型維度字段,對(duì)散點(diǎn)圖進(jìn)行標(biāo)記:行列都適合連續(xù)型度量字段,就可以根據(jù)配置?實(shí)現(xiàn)推薦圖表的功能

標(biāo)記

除了餅圖支持 “角度”、線(xiàn)圖支持 “路徑” 這些特殊標(biāo)記外,所有圖表都支持下面五種通用標(biāo)記:“工具提示”、“大小”、“文本”、“顏色”、“詳細(xì)信息”。

工具提示 比較簡(jiǎn)單,所有圖表都支持鼠標(biāo) Hover 后彈出 Tooltip 即可,并且這個(gè) Tooltip 允許自定義和拓展工具提示字段。

大小 則只有折、柱、散三種圖支持,因?yàn)檫@三種圖分別有可以描述的大小的線(xiàn)條粗細(xì)、柱子寬度、圓圈半徑。

文本 對(duì)應(yīng)柱折面餅的 Label、對(duì)應(yīng)表格,矩形樹(shù)狀圖,地圖的 單元格內(nèi)容。

顏色、詳細(xì)信息?則比較特殊,下面詳細(xì)說(shuō)明:

拖拽已有字段到詳細(xì)信息 - 沒(méi)有任何效果:?

因?yàn)楸旧砭驮诳催@個(gè)字段的詳細(xì)信息,因此沒(méi)有效果。

但如果拖拽已有字段到顏色,則可以根據(jù)數(shù)值大小或分類(lèi)進(jìn)行按顏色區(qū)分:

等于開(kāi)啟了圖表篩選功能,當(dāng)顏色篩選條件字段是連續(xù)型時(shí),出現(xiàn)篩選滑塊,是離散型時(shí),出現(xiàn)圖例:

如果拖拽字段不存在于行和列上,對(duì)于度量字段,會(huì)根據(jù)值進(jìn)行顏色排序(度量拖拽到詳細(xì)信息依然沒(méi)有效果):

如上圖所示,我們可以從長(zhǎng)度看利潤(rùn),從顏色深度看銷(xiāo)量。

如果拖拽字段不存在于行和列上,且是維度字段,則會(huì)先進(jìn)行維度拆分,之后如果選擇的是 “顏色” 標(biāo)記區(qū)域,還會(huì)對(duì)同一組的拆分標(biāo)記顏色區(qū)分。

由于標(biāo)記區(qū)域?qū)S度的拆分是不分行于列的,因此每個(gè)圖表會(huì)根據(jù)自身情況進(jìn)行合適的拆分。

比如條形圖如果按某個(gè)新維度拆分,則會(huì)采取 “堆積柱狀圖” 的策略:

如果是折線(xiàn)圖,則會(huì)采取 “多條線(xiàn)” 的策略:

如果是散點(diǎn)圖,只要將拆分后多出來(lái)的點(diǎn)打散出來(lái)即可。由于散點(diǎn)圖的維度拆分不像折線(xiàn)圖和柱狀圖可以分段,因此如果不采用按顏色打散,是無(wú)法分辨分組的:

之所以說(shuō)探索式分析的復(fù)雜度很高,是因?yàn)槠淇赡苄怨綖椋?/p>

字段 x 離散連續(xù) x 行列 x 行列下鉆 x 標(biāo)記種類(lèi) x 篩選 x 圖表

這種組合的笛卡爾積幾乎是無(wú)窮無(wú)盡的。

軸交互

圖表一些特定功能是隱藏在軸交互里的。拿折線(xiàn)圖來(lái)說(shuō),一共有 5 個(gè)拖拽交互位置,如下圖所示:

一般這些區(qū)域是用來(lái)拖拽度量字段的,所以如果拖拽了維度字段過(guò)來(lái),最終會(huì)被歸類(lèi)到行列或標(biāo)記上。

拖拽維度

維度拖拽到底部 1 區(qū)域等于替換列字段?:

維度拖拽到圖表中 4 區(qū)域等于拖到了顏色標(biāo)記?:

維度拖拽到左側(cè) 3 區(qū)域等于對(duì)行進(jìn)行下鉆:?

同理拖拽到最上面區(qū)域等于對(duì)列進(jìn)行下鉆。

拖拽度量

讓我們看看拖拽度量時(shí)的情況。度量能拖拽的范圍更多。比如拖拽到右軸 5 區(qū)域,則形成了雙軸圖:

拖拽到左側(cè) 2 區(qū)域則表示在圖中額外增加一個(gè)軸:

要注意的是,上圖的行顯示 “度量值”,這是個(gè)特殊的字段,并通過(guò)篩選器篩選出拖拽的兩個(gè)字段 Profit 和 Sales。除了拖拽以外,還可以通過(guò)將左側(cè) “度量值” 字段直接拖入行實(shí)現(xiàn):

如上圖所示,將度量值放到行,并按度量名稱(chēng)進(jìn)行顏色標(biāo)記,就得到了拖拽度量到左側(cè) 2 區(qū)域的效果。 這也說(shuō)明了所有圖表交互最終都是通過(guò)映射到配置完成,所有能拖拽的操作都可以通過(guò)配置配出來(lái)?。

對(duì)表格來(lái)說(shuō),能拖拽的區(qū)域是行、列、單元格:

拖拽到行或列于拖拽到字段配置區(qū)域的行或列沒(méi)有區(qū)別,拖拽到單元格等于拖拽到文本標(biāo)記區(qū)域。通過(guò)圖表于配置區(qū)域結(jié)合的方式,即便不完全理解配置的人也可以通過(guò)將字段拖拽到圖表上得到直觀的操作感。

點(diǎn)擊、圈選交互

所有圖表都支持點(diǎn)擊、圈選的方式選中 “點(diǎn)”。對(duì)表格來(lái)說(shuō),點(diǎn)就是單元格:

對(duì)柱狀圖來(lái)說(shuō),點(diǎn)就是柱子:

對(duì)折線(xiàn)圖來(lái)說(shuō),點(diǎn)就是節(jié)點(diǎn):

對(duì)餅圖來(lái)說(shuō),點(diǎn)就是扇葉:

所有的點(diǎn)被選中后都有基本高亮功能,最重要的是能對(duì)選中的點(diǎn)進(jìn)行保留、排除、局部排序等等。

比如我們可以對(duì)上圖餅圖選中的幾個(gè)扇形區(qū)域進(jìn)行從小到大排序:

我們也可以排除某些點(diǎn),這個(gè)在配置章節(jié)有提到過(guò),這個(gè)操作最終將轉(zhuǎn)化為新增篩選條件:

最后,選中狀態(tài)在單圖表中看似只有高亮效果,但是在多圖表聯(lián)動(dòng)時(shí),高亮的選中區(qū)域會(huì)組成一個(gè)臨時(shí)的篩選條件,作用于所有相同數(shù)據(jù)集的圖表,并對(duì)這些圖表的篩選結(jié)果做高亮處理。

3. 總結(jié)

理解了探索模型對(duì)數(shù)據(jù)、配置、圖表的理解,就能學(xué)會(huì)探索式思維分析數(shù)據(jù),對(duì)制作探索式 BI 也有借鑒意義。

討論地址是:精讀《Tableau 探索式模型》 · Issue #199 · dt-fe/weekly

如果你想?yún)⑴c討論,請(qǐng) 點(diǎn)擊這里,每周都有新的主題,周末或周一發(fā)布。前端精讀 - 幫你篩選靠譜的內(nèi)容。

關(guān)注 前端精讀微信公眾號(hào)

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/106982.html

相關(guān)文章

  • 精讀《前端未來(lái)展望》

    摘要:精讀前端可以從多個(gè)角度理解,比如規(guī)范框架語(yǔ)言社區(qū)場(chǎng)景以及整條研發(fā)鏈路。同是前端未來(lái)展望,不同的文章側(cè)重的格局不同,兩個(gè)標(biāo)題相同的文章內(nèi)容可能大相徑庭。作為使用者,現(xiàn)在和未來(lái)的主流可能都是微軟系,畢竟微軟在操作系統(tǒng)方面人才儲(chǔ)備和經(jīng)驗(yàn)積累很多。 1. 引言 前端展望的文章越來(lái)越不好寫(xiě)了,隨著前端發(fā)展的深入,需要擁有非常寬廣的視野與格局才能看清前端的未來(lái)。 筆者根據(jù)自身經(jīng)驗(yàn),結(jié)合下面幾篇文章...

    MadPecker 評(píng)論0 收藏0
  • 精讀Tableau 入門(mén)》

    摘要:可以看到,遙遙領(lǐng)先的城市有三個(gè),加州是銷(xiāo)售之王。將再拖拽到,并右鍵將其粒度改為月。從上圖可以看到,指定了個(gè)分類(lèi),最右上角加州就是最突出的一組,整個(gè)聚類(lèi)只有它一個(gè)元素,而畫(huà)面偏左下角的也是一類(lèi),這些是業(yè)績(jī)較差的一組數(shù)據(jù)。 1. 引言 引用著名瑞典統(tǒng)計(jì)學(xué)家 Hans Rosling 的一句話(huà):想法來(lái)源于數(shù)字、信息,再到理解。 分析數(shù)據(jù)的最好方式是可視化,因?yàn)榭梢暬休d的信息密度更高,甚至可...

    svtter 評(píng)論0 收藏0
  • [原]解密Airbnb 自助BI神器:Superset 顛覆 Tableau

    摘要:概述我非常認(rèn)同前百度數(shù)據(jù)工程師現(xiàn)神策分析創(chuàng)始人桑老師最近談到的數(shù)據(jù)分析三重境界統(tǒng)計(jì)計(jì)數(shù)多維分析機(jī)器學(xué)習(xí)數(shù)據(jù)分析的統(tǒng)計(jì)計(jì)數(shù)和多維分析,我們通常稱(chēng)之為數(shù)據(jù)探索式分析,這個(gè)步驟旨在了解數(shù)據(jù)的特性,有助于我們進(jìn)一步挖掘數(shù)據(jù)的價(jià)值。 showImg(https://camo.githubusercontent.com/f98421e503a81176b003ddd310d97e1e1214625...

    Keagan 評(píng)論0 收藏0
  • 基于Tableau探索分析世界銀行提供的關(guān)于科學(xué)技術(shù)的數(shù)據(jù)

    摘要:并且在年中國(guó)第一次在專(zhuān)利總量超過(guò)美國(guó),躍升至第一位,成為提交國(guó)際專(zhuān)利申請(qǐng)量最多的國(guó)家,從而打破了美國(guó)長(zhǎng)達(dá)年的專(zhuān)利申請(qǐng)霸主地位。中國(guó)的技術(shù)創(chuàng)新仍處于大部分技術(shù)靠從外國(guó)購(gòu)買(mǎi)技術(shù)專(zhuān)利的階段。 要求 ????????????????對(duì) CSE512: Data Visualization 完成探索性...

    alighters 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<