{eval=Array;=+count(Array);}
謝邀~
本君自薦一下。我們的產(chǎn)品諸葛io(www.zhugeio.com)可能更偏向于非技術(shù)人員的業(yè)務(wù)分析,比如產(chǎn)品經(jīng)理、市場(chǎng)、運(yùn)營(yíng)人員。
從某種意義上也具有可視化分析的特性,但區(qū)別于其他工具的是我們面向互聯(lián)網(wǎng)產(chǎn)品推廣運(yùn)營(yíng)過程中的分析需求定義了一些分析模型,比如事件、漏斗、自定義留存、粘性、用戶分群等,很多工具可以任意拖拽去做分析,但很多時(shí)候客戶也會(huì)因?yàn)樘`活反而有一定門檻,所以,當(dāng)一些模型被標(biāo)準(zhǔn)化以后,基本可以解決互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)、推廣、運(yùn)營(yíng)、營(yíng)銷過程中的絕大多數(shù)分析需求,這也大大提供了業(yè)務(wù)人員的工作效率。
附圖幾張:
用戶模型
全行為路徑分析模型
粘性分析模型自定義留存分析模型
關(guān)于一些分析模型,我們整理出了常用的八大數(shù)據(jù)分析模型,過去兩個(gè)月,每周二都會(huì)更新一個(gè)模型,很多模型大家都比較了解,但可能他又增加了一些新特性,感興趣可戳鏈接:
八大數(shù)據(jù)分析模型之——用戶模型(一)
八大數(shù)據(jù)分析模型之——事件模型(二)
八大數(shù)據(jù)分析模型之——漏斗模型(三)
八大數(shù)據(jù)分析模型之——熱圖模型(四)
八大數(shù)據(jù)分析模型之——自定義留存分析模型(五)
八大數(shù)據(jù)分析模型之——粘性分析模型(六)
八大數(shù)據(jù)分析模型之——全行為路徑模型(七)
......
當(dāng)然,我們也面向有高級(jí)使用需求的用戶,比如數(shù)據(jù)分析師或是有一定數(shù)據(jù)查詢能力的人員提供了SQL查詢功能,因?yàn)檫€有20%的分析需求無法通過標(biāo)準(zhǔn)的模型解決,需要自己去定義。
數(shù)據(jù)都是開放的,原始數(shù)據(jù)的導(dǎo)出,實(shí)時(shí)數(shù)據(jù)的調(diào)用在諸葛都是支持的。數(shù)據(jù)來源于客戶,數(shù)據(jù)屬于客戶。
1、前端表格導(dǎo)出
2、SQL查詢平臺(tái)支持
3、查詢API按需調(diào)用
4、直連數(shù)據(jù)倉(cāng)庫
5、Kafka實(shí)時(shí)訂閱
6、原始數(shù)據(jù)全量導(dǎo)出
以上~
有很多開源的產(chǎn)品,如果有研發(fā)能力的,可以直接使用開源產(chǎn)品來自己搭建數(shù)據(jù)分析平臺(tái),開發(fā)自己的數(shù)據(jù)分析軟件,不過這樣需要較強(qiáng)的技術(shù)能力,付出較大的成本。
也可以使用東軟平臺(tái)云(https://cloud.neusoft.com/)的DataViz可視化數(shù)據(jù)分析軟件,這樣的專業(yè)的尅時(shí)候數(shù)據(jù)分析軟件,不需要專業(yè)的分析師和技術(shù)人員,業(yè)務(wù)人員通過簡(jiǎn)單的拖拽就可以實(shí)現(xiàn)數(shù)據(jù)分析,還支持多種數(shù)據(jù)源,支持動(dòng)態(tài)傳統(tǒng)圖表和高級(jí)可視化圖表,多種科技、商務(wù)主題自由切換,支持拖拽圖表組合布局,設(shè)置圖表聯(lián)動(dòng)交互,分析結(jié)果支持適應(yīng)各種分辨率的大屏展示。
MongoDB—— 一種流行的,跨平臺(tái)的面向文檔的數(shù)據(jù)庫。
Elasticsearch——專為云而構(gòu)建的分布式REST風(fēng)格搜索引擎。
Cassandra——一個(gè)開源的分布式數(shù)據(jù)庫管理系統(tǒng),最初由Facebook開發(fā),被設(shè)計(jì)用來處理橫跨多個(gè)商用服務(wù)器的大量數(shù)據(jù),提供了無單點(diǎn)故障的高度可用性。
Redis—— 一個(gè)開源的(BSD許可),內(nèi)存數(shù)據(jù)結(jié)構(gòu)存儲(chǔ),作為數(shù)據(jù)庫、緩存和消息代理使用。
Hazelcast——基于Java的開源內(nèi)存數(shù)據(jù)網(wǎng)格。
EHCache——一種被廣泛使用的開源Java分布式緩存,用于通用緩存、Java EE和輕量級(jí)容器。Ehcache相關(guān)介紹
Hadoop——用Java編寫的一個(gè)開源軟件框架,用于分布式存儲(chǔ)和對(duì)在計(jì)算機(jī)集群上的超大型數(shù)據(jù)集的分布式處理。
Solr——一個(gè)開源的企業(yè)搜索平臺(tái),用Java編寫的,來自于ApacheLucene項(xiàng)目。
Spark——Apache Software Foundation中最活躍的項(xiàng)目,一個(gè)開源的集群計(jì)算框架。
Memcached—— 一個(gè)通用的分布式內(nèi)存緩存系統(tǒng)。
Apache Hive——提供了Hadoop之上類似于SQL的層。
Apache Kafka—— 一個(gè)高通量、分布式的發(fā)布-訂閱式消息系統(tǒng),最初開發(fā)在LinkedIn上。Windows上脫離Cygwin運(yùn)行Apache Kafka
Akka—— 一個(gè)工具包和運(yùn)行時(shí),用于在JVM上構(gòu)建高度并行的、分布式的、有彈性的消息驅(qū)動(dòng)的應(yīng)用程序。
HBase—— 一個(gè)開源的,非關(guān)系型的,分布式數(shù)據(jù)庫,在谷歌的BigTable后建模,用Java編寫,并運(yùn)行在HDFS上。
Neo4j——用Java實(shí)現(xiàn)的開源圖形數(shù)據(jù)庫。
CouchBase——一個(gè)開源的、面向文檔的分布式NoSQL數(shù)據(jù)庫,特別為了交互式應(yīng)用而優(yōu)化。
Apache Storm——開源的分布式實(shí)時(shí)計(jì)算系統(tǒng)。
CouchDB——使用JSON來存儲(chǔ)數(shù)據(jù)的面向文檔的開源NoSQL數(shù)據(jù)庫。
Oracle Coherence—— 一個(gè)內(nèi)存的數(shù)據(jù)網(wǎng)格解決方案,通過提供快速訪問常用數(shù)據(jù)的渠道,使得企業(yè)可預(yù)測(cè)地?cái)U(kuò)展關(guān)鍵任務(wù)應(yīng)用程序。
Titan—— 一個(gè)可擴(kuò)展的圖形數(shù)據(jù)庫,優(yōu)化的目的在于存儲(chǔ)和查詢包含數(shù)千億頂點(diǎn)和邊的圖形,分布在多機(jī)集群。
Amazon DynamoDB——一個(gè)快速、靈活、完全管理的NoSQL數(shù)據(jù)庫服務(wù),用于在任何規(guī)模需要一致的、個(gè)位數(shù)毫秒延遲的所有應(yīng)用程序。
Amazon Kinesis—— 用于在AWS上的流數(shù)據(jù)的實(shí)時(shí)平臺(tái)。
Datomic—— 一個(gè)用Clojure寫的完全事務(wù)式的,支持云的,分布式數(shù)據(jù)庫。
原文鏈接:https://blog.csdn.net/zhinengxuexi/article/details/90056986
按需求選擇吧:
19個(gè)超贊的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)工具:https://www.toutiao.com/i6585379544813797901/
3大開源Python數(shù)據(jù)分析工具
https://www.toutiao.com/i6589410805932884493/
看你問的是可視化工具類還是說數(shù)據(jù)處理框架。具體指的是哪方面的數(shù)據(jù),可以評(píng)論我說明。
在推薦工具之前,我們要先把數(shù)據(jù)可視化和 信息可視化分清楚,狹義上的數(shù)據(jù)可視化指的是將數(shù)據(jù)用統(tǒng)計(jì)圖表方式呈現(xiàn),而信息可視化則是將非數(shù)字的信息進(jìn)行可視化。
我們常常聽說的數(shù)據(jù)可視化大多指狹義的數(shù)據(jù)可視化以及部分信息可視化。根據(jù)數(shù)據(jù)類型和性質(zhì)的差異,經(jīng)常分為以下幾種類型:
然后下面我再來盤點(diǎn)幾個(gè)大數(shù)據(jù)可視化常用的工具:
一、D3D3.js 是一個(gè)基于數(shù)據(jù)操作文檔的 JavaScript 庫。 D3 可以將強(qiáng)大的可視化組件和數(shù)據(jù)驅(qū)動(dòng)的 DOM 操作方法完美結(jié)合。
D3 的優(yōu)劣:
D3 沒有提供封裝好的組件,在復(fù)用性、易用性方面不佳,社區(qū)里有很多基于 D3 的可視化組件庫:
D3 有著 Stanford 的血脈淵源,在學(xué)術(shù)界享有很高聲譽(yù),靈活強(qiáng)大使得它成為目前領(lǐng)域內(nèi)使用最廣泛的可視化類庫,但偏底層的 API 和數(shù)據(jù)驅(qū)動(dòng)模式,使得上手 D3 存在一定門檻,基于 D3 的工程實(shí)現(xiàn)上需要自己考慮和處理更多內(nèi)容,如動(dòng)畫、交互、統(tǒng)一樣式等,研發(fā)成本較高。
二、FineBI簡(jiǎn)潔明了的數(shù)據(jù)分析工具,優(yōu)點(diǎn)是零代碼可視化、可視化圖表豐富,只需要拖拖拽拽就可以完成十分炫酷的可視化效果,擁有數(shù)據(jù)整合、可視化數(shù)據(jù)處理、探索性分析、數(shù)據(jù)挖掘、可視化分析報(bào)告等功能,更重要的是個(gè)人版免費(fèi)。
評(píng)價(jià):
FineBI做到了自助式分析,圖表類型豐富,數(shù)據(jù)分析功能較強(qiáng)大,鉆取,篩選,分組等功能都有。但是對(duì)于普通沒有IT基礎(chǔ)的人來說,要想真正熟練地掌握finebi,還是有一定的難度的,需要花上幾天,但是這個(gè)難度相比Excel的VBA學(xué)習(xí)還是低不少的。
三、HighChartsHighCharts 是一個(gè)用純 JavaScript 編寫的圖表庫, 能夠簡(jiǎn)單便捷的在 Web 應(yīng)用上添加交互性圖表。這是在 Web 上使用最廣泛的圖表,企業(yè)使用需要購(gòu)買商業(yè)授權(quán)。
HighCharts 的優(yōu)劣:
這是圖表界的 jQuery,在世界范圍內(nèi)是使用最多最廣的一個(gè)可視化類庫,但整體圖表設(shè)計(jì)比較陳舊難以擴(kuò)展,同時(shí)商業(yè)公司使用需要按照使用人數(shù)購(gòu)買版權(quán),比較昂貴,ucloud有購(gòu)買過,目前已不推薦使用。
四、EChartsECharts 縮寫自 Enterprise Charts,企業(yè)級(jí)圖表,開源來自百度數(shù)據(jù)可視化團(tuán)隊(duì),是一個(gè)純 Javascript 的圖表庫,可以流暢的運(yùn)行在 PC 和移動(dòng)設(shè)備上,兼容當(dāng)前絕大部分瀏覽器,底層依賴另一個(gè)也是該團(tuán)隊(duì)自主研發(fā)的輕量級(jí)的 Canvas 類庫 ZRender,提供直觀,生動(dòng),可交互,可高度個(gè)性化定制的數(shù)據(jù)可視化圖表。ECharts 是目前國(guó)內(nèi)唯一一個(gè)入選 GitHub 全球可視化榜單的開源項(xiàng)目,2w+ star 全球排名第三,社區(qū)活躍,覆蓋主流前端框架和 8 種編程語言的擴(kuò)展,目前國(guó)內(nèi)市場(chǎng)占有率處于絕對(duì)領(lǐng)先地位。
ECharts 的優(yōu)劣:
ECharts 能很好滿足傳統(tǒng)圖表需求,但在高度靈活多樣化的可視需求面前,需要另尋出路。
五、LeafletLeaflet 是面向移動(dòng)設(shè)備的交互式地圖的 JavaScript 庫。 測(cè)量的 JS 只有大約 38 KB,它具有大多數(shù)開發(fā)人員需要的所有映射功能。
Leaflet 的優(yōu)劣:
地圖專用,其他領(lǐng)域使用不上。目前 Google 地圖、高德地圖、百度地圖都擁有自研的 JS 庫。
六、VegaVega 是華盛頓大學(xué)計(jì)算機(jī)學(xué)院數(shù)據(jù)交互實(shí)驗(yàn)室(IDL)開發(fā)的一套交互圖形語法,定義了數(shù)據(jù)到圖形的映射規(guī)則、常見的交互語法和常見的圖形元素,用戶可以自由使用 Vega 語法進(jìn)行組合構(gòu)建出各種各樣的圖表。
Vega 的優(yōu)劣:
Vega 在學(xué)術(shù)上有著比較完美的語法設(shè)計(jì),但在工程易用性上比較欠缺。
七、deck.gldeck.gl 是 Uber 可視化團(tuán)隊(duì)基于 WebGL 開發(fā)的面向大數(shù)據(jù)分析的可視化類庫。
deck.gl 的優(yōu)劣:
deck.gl 在 3D 地圖領(lǐng)域效果很贊,在其他領(lǐng)域不適用。
基于 Web 的可視化工具還有很多,上面是幾個(gè)一直以來使用比較多的類庫工具,以及最近涌現(xiàn)的一些新秀。各個(gè)類庫工具特性不同,定位不同,關(guān)鍵要看應(yīng)用場(chǎng)景的適用性。
八、AntVAntV 是螞蟻金服全新一代數(shù)據(jù)可視化解決方案,主要面向從事數(shù)據(jù)可視化應(yīng)用相關(guān)的工程師和設(shè)計(jì)師,目前包括:
G2 (The Grammar Of Graphics) 是一個(gè)由純 JavaScript 編寫、強(qiáng)大的語義化圖表語法類庫,提供了一整套圖形語法,可以讓用戶通過簡(jiǎn)單的語法搭建出無數(shù)種圖表,并集成了大量的統(tǒng)計(jì)工具,支持多種坐標(biāo)系繪制,可以讓用戶自由地定制各種圖表。
G2 的優(yōu)劣:
G6 是一個(gè)由純 JavaScript 編寫的關(guān)系數(shù)據(jù)可視化類庫,提供了基本的網(wǎng)圖和樹圖功能,并支持多種內(nèi)置布局。G6 提供了查看和編輯兩種視圖,開發(fā)者可基于 G6 對(duì)關(guān)系圖快速進(jìn)行二次開發(fā)。
G6 的優(yōu)劣:
1、奧威BI工具
多用于億級(jí)數(shù)據(jù)量的大數(shù)據(jù)智能可視化分析,如大中型企業(yè)、集團(tuán)項(xiàng)目等。
有標(biāo)準(zhǔn)化的數(shù)據(jù)分析解決方案,預(yù)設(shè)數(shù)據(jù)分析模板;無縫對(duì)接金蝶、用友等主流ERP;可做必要的個(gè)性化設(shè)計(jì)。
說白了就是給你一個(gè)標(biāo)準(zhǔn)化的、系統(tǒng)化的解決方案,你拿過來稍微改改就能得到一個(gè)適合自己的大數(shù)據(jù)可視分析平臺(tái)。這可比自己從零開始做藍(lán)圖設(shè)計(jì)、搭建分析模型、測(cè)試要省事多了。
2、SpeedBI數(shù)據(jù)分析云
多用于小微企業(yè)、個(gè)人用戶。免下載安裝,在線使用。
從瀏覽器中登錄即可免費(fèi)用。拖拉拽+點(diǎn)擊即可應(yīng)用智能分析功能、可視化圖表等,完成智能數(shù)據(jù)可視化分析報(bào)表。
大數(shù)據(jù)分析的前瞻性使得很多公司以及企業(yè)都開始使用大數(shù)據(jù)分析對(duì)公司的決策做出幫助,而大數(shù)據(jù)分析是去分析海量的數(shù)據(jù),所以就不得不借助一些工具去分析大數(shù)據(jù),。一般來說,數(shù)據(jù)分析工作中都是有很多層次的,這些層次分別是數(shù)據(jù)存儲(chǔ)層、數(shù)據(jù)報(bào)表層、數(shù)據(jù)分析層、數(shù)據(jù)展現(xiàn)層。對(duì)于不同的層次是有不同的工具進(jìn)行工作的。下面小編就對(duì)大數(shù)據(jù)分析工具給大家好好介紹一下。
首先我們從數(shù)據(jù)存儲(chǔ)來講數(shù)據(jù)分析的工具。我們?cè)诜治鰯?shù)據(jù)的時(shí)候首先需要存儲(chǔ)數(shù)據(jù),數(shù)據(jù)的存儲(chǔ)是一個(gè)非常重要的事情,如果懂得數(shù)據(jù)庫技術(shù),并且能夠操作好數(shù)據(jù)庫技術(shù),這就能夠提高數(shù)據(jù)分析的效率。而數(shù)據(jù)存儲(chǔ)的工具主要是以下的工具。
1、MySQL數(shù)據(jù)庫,這個(gè)對(duì)于部門級(jí)或者互聯(lián)網(wǎng)的數(shù)據(jù)庫應(yīng)用是必要的,這個(gè)時(shí)候關(guān)鍵掌握數(shù)據(jù)庫的庫結(jié)構(gòu)和SQL語言的數(shù)據(jù)查詢能力。
2、SQL Server的最新版本,對(duì)中小企業(yè),一些大型企業(yè)也可以采用SQL Server數(shù)據(jù)庫,其實(shí)這個(gè)時(shí)候本身除了數(shù)據(jù)存儲(chǔ),也包括了數(shù)據(jù)報(bào)表和數(shù)據(jù)分析了,甚至數(shù)據(jù)挖掘工具都在其中了。
3、DB2,Oracle數(shù)據(jù)庫都是大型數(shù)據(jù)庫了,主要是企業(yè)級(jí),特別是大型企業(yè)或者對(duì)數(shù)據(jù)海量存儲(chǔ)需求的就是必須的了,一般大型數(shù)據(jù)庫公司都提供非常好的數(shù)據(jù)整合應(yīng)用平臺(tái);
接著說數(shù)據(jù)報(bào)表層。一般來說,當(dāng)企業(yè)存儲(chǔ)了數(shù)據(jù)后,首先要解決報(bào)表的問題。解決報(bào)表的問題才能夠正確的分析好數(shù)據(jù)庫。關(guān)于數(shù)據(jù)報(bào)表所用到的數(shù)據(jù)分析工具就是以下的工具。
1、Crystal Report水晶報(bào)表,Bill報(bào)表,這都是全球最流行的報(bào)表工具,非常規(guī)范的報(bào)表設(shè)計(jì)思想,早期商業(yè)智能其實(shí)大部分人的理解就是報(bào)表系統(tǒng),不借助IT技術(shù)人員就可以獲取企業(yè)各種信息——報(bào)表。
2、Tableau軟件,這個(gè)軟件是近年來非常棒的一個(gè)軟件,當(dāng)然它已經(jīng)不是單純的數(shù)據(jù)報(bào)表軟件了,而是更為可視化的數(shù)據(jù)分析軟件,因?yàn)楹芏嗳私?jīng)常用它來從數(shù)據(jù)庫中進(jìn)行報(bào)表和可視化分析。
第三說的是數(shù)據(jù)分析層。這個(gè)層其實(shí)有很多分析工具,當(dāng)然我們最常用的就是Excel,我經(jīng)常用的就是統(tǒng)計(jì)分析和數(shù)據(jù)挖掘工具;
1、Excel軟件,首先版本越高越好用這是肯定的;當(dāng)然對(duì)Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強(qiáng)大,甚至可以完成所有的統(tǒng)計(jì)分析工作!但是我也常說,有能力把Excel玩成統(tǒng)計(jì)工具不如專門學(xué)會(huì)統(tǒng)計(jì)軟件;
2、SPSS軟件:當(dāng)前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環(huán)境下編程分析,到現(xiàn)在版本的變遷也可以看出SPSS社會(huì)科學(xué)統(tǒng)計(jì)軟件包的變化,從重視醫(yī)學(xué)、化學(xué)等開始越來越重視商業(yè)分析,現(xiàn)在已經(jīng)成為了預(yù)測(cè)分析軟件。
最后說表現(xiàn)層的軟件。一般來說表現(xiàn)層的軟件都是很實(shí)用的工具。表現(xiàn)層的軟件就是下面提到的內(nèi)容。
1、PowerPoint軟件:大部分人都是用PPT寫報(bào)告。
2、Visio、SmartDraw軟件:這些都是非常好用的流程圖、營(yíng)銷圖表、地圖等,而且從這里可以得到很多零件;
3、Swiff Chart軟件:制作圖表的軟件,生成的是Flash。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答