摘要:可以看到,遙遙領(lǐng)先的城市有三個,加州是銷售之王。將再拖拽到,并右鍵將其粒度改為月。從上圖可以看到,指定了個分類,最右上角加州就是最突出的一組,整個聚類只有它一個元素,而畫面偏左下角的也是一類,這些是業(yè)績較差的一組數(shù)據(jù)。
1. 引言
引用著名瑞典統(tǒng)計學(xué)家 Hans Rosling 的一句話:想法來源于數(shù)字、信息,再到理解。
分析數(shù)據(jù)的最好方式是可視化,因為可視化承載的信息密度更高,甚至可以從不同維護對數(shù)據(jù)進行交互式分析。今天要精讀的文章就分析了經(jīng)典可視化分析工具 Tableau:data-visualisation-made-easy。
2. 精讀Tableau 是一款廣泛用于智能商業(yè)的強大數(shù)據(jù)分析工具,通過不同可交互的圖表和儀表盤幫助你獲得業(yè)務(wù)洞見。
安裝Tableau 提供了三種使用方式:
Tableau Desktop
擁有 14 天免費試用的桌面版,可以將工作數(shù)據(jù)存儲在計算機本地,如果你是學(xué)生或老師可以獲得一年的免費使用權(quán)。
Tableau Public
公開版完全免費,和桌面版的唯一區(qū)別是,所有數(shù)據(jù)都無法保存在本地,只能保存在 Tableau 服務(wù)器的云端,而且是公開的。
Tableau Online
網(wǎng)頁版也完全免費,是 Tableau Public 的網(wǎng)頁版。
連接數(shù)據(jù)源安裝好 Tableau 后,第一步就是連接數(shù)據(jù)源。它支持連接本地或云端的數(shù)據(jù)源,本地最常用的數(shù)據(jù)源可以從 Excel 轉(zhuǎn)換。這里是一份 樣例數(shù)據(jù),包含了一個超市幾年內(nèi)的銷售情況,我們可以用這份數(shù)據(jù)練手。
下載好這份數(shù)據(jù)后,選擇從 Excel 導(dǎo)入,確認后將 Orders 表拖拽到右側(cè)區(qū)域,如下圖所示:
可以看到表結(jié)構(gòu)已經(jīng)正常了,在數(shù)據(jù)清洗的過程中,Tableau 強大的數(shù)據(jù)分析功能已經(jīng)初見端倪。你甚至可以點擊 Review ths results 看看它是如何清洗數(shù)據(jù)的:點擊后會下載一份分析 Excel,其中過濾掉的數(shù)據(jù)會被標記,自動分析出的表結(jié)構(gòu)會被高亮。
數(shù)據(jù)可視化在頁面最底部有幾個切換項,依次是 Data Source:數(shù)據(jù)源、Sheet:工作簿,后面跟隨的三個按鈕可以繼續(xù)創(chuàng)建多個 Sheet、Dashboard、Story,這些后面都會講到。首先點擊 Sheet 進入可視化分析的工作簿:
可以看到,總利潤大概是總銷量的 10%。如果想展示橫向表格,將 Measure Names 從 Rows 拖拽到 Columns 即可。
Tips: 為了方便區(qū)分,Tableau 貼心的將維度標記為藍色,度量標記為綠色。
同時可以看到,Tableau 對于單指標拖拽,默認采取表格方式渲染。
接下來我們要看每一年的詳細銷量與利潤:
將 Order Date 與 Sales 拖拽到 Rows。
右鍵 Sales,將類型從連續(xù)改成非連續(xù),這樣就會自動變成表格展示。
為了展示利潤,將 Profit 字段拖拽到 Marks 的 Text 字段上。
我們可以看到,銷量較高的月份分布在:3、9、11、12 月。注意由于沒有對年份做篩選,這里的每月統(tǒng)計數(shù)據(jù)是整合了 2013~2016 四年份的。也就是 1 月的數(shù)據(jù)其實代表了 2013.1 + 2014.1 + 2015.1 + 2016.1 共四個 1 月份數(shù)據(jù)的總和。
接下來我們想了解銷量與利潤增長的趨勢:
將 Order Date 拖拽到 Columns。
將 Sales 拖拽到 Rows,此時會出現(xiàn)一條線。接下來將 Profit 拖拽到 左 Y 軸。
上圖可以明顯看到三個峰值出現(xiàn)在 3、9、11 月份,然而這段期間利潤增長幅度卻不大,可以看出這段期間采取了薄利多銷的手段。
再從地區(qū)維度分析數(shù)據(jù):
將 Regions 和 Sales 拖拽到 Columns。
切換到餅圖。
將 Sales 拖拽到 Marks Pane 的 Label 上。
可以看到數(shù)值越大的區(qū)域一般顏色也越深,但這不是分析利潤/銷量性價比的最佳方式,我們先只看到加州和紐約是銷售業(yè)績最好的區(qū)域,而科羅拉多州雖然銷量不錯,但利潤卻是負的。
上面的地圖對地形比較直觀,但要分析銷售健康度,還是用散點圖更合適。我們想看看城市銷量/利潤的健康度分布:
Profit 拖拽到 Columns,Sales 拖拽到 Rows,此時散點圖出現(xiàn),但只有一個點(之所以出現(xiàn)散點圖,是因為橫縱軸拖拽的都是度量)。
我們想按城市下鉆,只要把 State 拖拽到 Detail 即可。
可以看到,辦公套件和科技產(chǎn)品業(yè)績最好,其中辦公套件在 2015 年 12 月銷量利潤雙豐收,科技產(chǎn)品在 2015 年 10 月與 2016 年 3 月銷量利潤雙豐收。整體來看前半年是淡季。
但這張圖無法看到銷量與利潤性價比關(guān)系,我們要找出利潤率最高的商品和利潤率最低的商品:
將 Proft 拖拽到 Columns。
將 Sub-Category 拖拽到 Rows。
切換到 Horizontal Bars。
將銷量 Sales 拖拽到 Color。
Tablueau 這種交互等價于 Sql 中 in 語句,當然 Tablueau 還支持更復(fù)雜的條件或代碼表達式,這里只是將更友好的篩選方式優(yōu)先展示區(qū)來。
上卷下鉆Tableau 支持任意維度之間的上卷下鉆,只要你將他們分好組。
比如將 Order Date、Order ID、Ship Date、Ship Mode 拖拽到一起,成為 Orders 組;將 Category、Sub-Category、Product ID Product Name 形成 Product 組:
上卷下鉆是順序相關(guān)的,比如 Product - Order Date 表示在產(chǎn)品類目基礎(chǔ)上,對每個類目按日期下鉆。而 Order Date - Product 這個順序,表示在日期分布的基礎(chǔ)上,對日期按產(chǎn)品類目下鉆,了解不同日期下每個產(chǎn)品的分布情況。
趨勢線為使用趨勢線,先制作一個雙軸圖:
將 Sales 與 Profit 拖拽到 Rows。
將 Order Date 拖拽到 Columns 并切換到月維度。
選擇 Show Me 的 Dual Combination 即混合圖。
趨勢圖有幾種算法,比如線性,Log 或指數(shù),因此在做趨勢分析前,首先要判斷自己的業(yè)務(wù)屬于哪種增長階段,如果是爆發(fā)期可以選擇指數(shù),平穩(wěn)期可以選擇線性等等。
預(yù)測回到按月分布的圖表,如果我們想預(yù)測未來銷量和利潤的走勢,可以使用預(yù)測功能:
切換到 Analytics Tab,并將 Forecast 拖拽到圖表中。
可以點擊右鍵配置預(yù)測參數(shù)。
從上圖可以看到,指定了 4 個分類,最右上角加州就是最突出的一組,整個聚類只有它一個元素,而畫面偏左下角的也是一類,這些是業(yè)績較差的一組數(shù)據(jù)。使用了 K 均值聚類算法,并且當你點擊右鍵查看詳細星系時,還能把組間、組內(nèi)方差展示出來:
Tableau 的所有圖表都支持點選,排除等操作,那么點選這類操作本質(zhì)上其實是個篩選的過程,比如柱狀圖點擊了某根柱子,可以認為是選擇了這根柱子當前的維度值作為篩選條件。
當一個 Sheet 作為篩選條件后,類似點選這種操作產(chǎn)生的篩選就會作用于其他同數(shù)據(jù)集的圖表,因此如上圖所示,當點擊了條形圖的某一根柱子時,上面的銷量地圖也自動做了篩選,僅展示當前選中的產(chǎn)品的銷量分布。
故事Story 更像是 PPT,將分析后有價值或有意義的圖表組合在一起,再配合上說明,得出一些結(jié)論:
版權(quán)聲明:自由轉(zhuǎn)載-非商用-非衍生-保持署名(創(chuàng)意共享 3.0 許可證)
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/106665.html
摘要:比如我們對調(diào)與會怎樣我們得到了三個不同類目近個月的趨勢,之所以是折線圖,因為圖表的維度軸列是連續(xù)的。在正式介紹標記區(qū)域前,先理解一下為何會發(fā)生這種轉(zhuǎn)變表格類組件是雙維度組件,折線圖是單維度組件。 1. 引言 Tableau 探索式分析功能非常強大,各種功能組合似乎有著無限的可能性。 今天筆者會分析這種探索式模型解題思路,一起看看這種探索式分析功能是如何做到的。 2. 精讀 要掌握探索式...
摘要:精讀前端可以從多個角度理解,比如規(guī)范框架語言社區(qū)場景以及整條研發(fā)鏈路。同是前端未來展望,不同的文章側(cè)重的格局不同,兩個標題相同的文章內(nèi)容可能大相徑庭。作為使用者,現(xiàn)在和未來的主流可能都是微軟系,畢竟微軟在操作系統(tǒng)方面人才儲備和經(jīng)驗積累很多。 1. 引言 前端展望的文章越來越不好寫了,隨著前端發(fā)展的深入,需要擁有非常寬廣的視野與格局才能看清前端的未來。 筆者根據(jù)自身經(jīng)驗,結(jié)合下面幾篇文章...
摘要:雖然正則中可以匹配任何字符,但卻無法匹配換行符。精讀文中列舉的四個新特性是加入到正則中的。討論地址是精讀正則如果你想?yún)⑴c討論,請點擊這里,每周都有新的主題,周末或周一發(fā)布。 1. 引言 本周精讀的文章是 regexp-features-regular-expressions。 這篇文章介紹了 ES2018 正則支持的幾個重要特性: Lookbehind assertions - 后行...
摘要:可以將耗時任務(wù)拆解出去,降低主線程的壓力,避免主線程無響應(yīng)。主線程接收發(fā)消息每個實例通過接收消息,通過發(fā)送消息。收發(fā)主線程消息和主線程代碼類似,在代碼中,也是接收消息,這個消息來自主線程或者其它。 1 引言 本周精讀的文章是 speedy-introduction-to-web-workers,是一篇 Web Workers 快速入門的文章,借精讀這篇文章的機會,談?wù)剬?Web Wor...
閱讀 3706·2021-11-11 10:58
閱讀 2490·2021-09-22 15:43
閱讀 2877·2019-08-30 15:44
閱讀 2200·2019-08-30 13:08
閱讀 1830·2019-08-29 17:28
閱讀 893·2019-08-29 10:54
閱讀 685·2019-08-26 11:46
閱讀 3514·2019-08-26 11:43