{eval=Array;=+count(Array);}
我給你一份數(shù)據(jù)分析經(jīng)典入門指南,按照這份指南,小白也能成為數(shù)據(jù)分析高手!
這是一份入門到熟練的指南,并不包含數(shù)據(jù)挖掘等高階內(nèi)容??梢沧銐蜃尞a(chǎn)品和運營們獲得進步。
所用的工具正是職場中最常用的Excel!
①重點函數(shù)學(xué)習(xí)
重點是了解各種函數(shù):Vlookup、sum,count,sumif,countif,find,if,left/right,時間日期函數(shù)、文本函數(shù)
②數(shù)據(jù)透視表學(xué)習(xí)
我曾說過,如果Excel只能學(xué)習(xí)一個功能,那唯一能入選的就是數(shù)據(jù)透視表。
掌握vlookup和數(shù)據(jù)透視表是最具性價比的兩個技巧。學(xué)會vlookup,SQL中的join,Python中的merge很容易理解。學(xué)會數(shù)據(jù)透視表,SQL中的group,Python中的pivot_table也是同理。
這兩個搞定,基本10萬條以內(nèi)的數(shù)據(jù)統(tǒng)計沒啥難度,80%的辦公室白領(lǐng)都能秒殺。
所用工具:PowerBi、Excel
數(shù)據(jù)分析界有一句經(jīng)典名言,字不如表,表不如圖。
數(shù)據(jù)可視化是數(shù)據(jù)分析的主要方向之一。首先要了解常用的圖表:
Excel的圖表可以100%完成上面的圖形要求,但這只是基礎(chǔ)。后續(xù)的進階可視化,勢必要用到編程繪制。為什么?比如常見的多元分析,你能用Excel很輕松的完成?但是在IPython只需要一行代碼。
其次掌握BI,下圖是微軟的BI。
BI(商業(yè)智能)和圖表的區(qū)別在于BI擅長交互和報表,更擅長解釋已經(jīng)發(fā)生和正在發(fā)生的數(shù)據(jù)。將要發(fā)生的數(shù)據(jù)是數(shù)據(jù)挖掘的方向。
BI的好處在于很大程度解放數(shù)據(jù)分析師的工作,推動全部門的數(shù)據(jù)意識,另外降低其他部門的數(shù)據(jù)需求(萬惡的導(dǎo)數(shù)據(jù))。
BI市面上的產(chǎn)品很多,基本都是建立儀表盤Dashboard,通過維度的聯(lián)動和鉆取,獲得可視化的分析。最后需要學(xué)習(xí)可視化和信息圖的制作。
所用工具:SQL
Excel對十萬條以內(nèi)的數(shù)據(jù)處理起來沒有問題,但是互聯(lián)網(wǎng)行業(yè)就是不缺數(shù)據(jù)。但凡產(chǎn)品有一點規(guī)模,數(shù)據(jù)都是百萬起。這時候就需要學(xué)習(xí)數(shù)據(jù)庫。
越來越多的產(chǎn)品和運營崗位,會在招聘條件中,將會SQL作為優(yōu)先的加分項。
SQL是數(shù)據(jù)分析的核心技能之一,從Excel到SQL絕對是數(shù)據(jù)處理效率的一大進步。
學(xué)習(xí)圍繞Select展開。增刪改、約束、索引、數(shù)據(jù)庫范式均可以跳過。主要了解where,group by,order by,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的邏輯,時間轉(zhuǎn)換函數(shù)等。如果想要跟進一步,可以學(xué)習(xí)row_number,substr,convert,contact等。另外不同數(shù)據(jù)平臺的函數(shù)會有差異,例如Presto和phpMyAdmin。再有點追求,就去了解Explain優(yōu)化,了解SQL的工作原理,了解數(shù)據(jù)類型,了解IO。以后就可以和技術(shù)研發(fā)們談笑風(fēng)生,畢竟將“這里有bug”的說話,換成“這塊的數(shù)據(jù)死鎖了”,逼格大大的不同。SQL的學(xué)習(xí)主要是多練,網(wǎng)上尋找相關(guān)的練習(xí)題,刷一遍就差不多了。
好了,經(jīng)過這三步之后,你已經(jīng)具備數(shù)據(jù)分析基本功力,剩下的需要訓(xùn)練的就是你的思維和實際的業(yè)務(wù)分析能力了。
節(jié)選自秦路《七周成為數(shù)據(jù)分析師》
數(shù)據(jù)分析最常用的軟件一般有Excel、mysql和Tableau。
初學(xué)者應(yīng)該先從SQL開始學(xué)起,SQL是所有數(shù)據(jù)方向的必備技能,也是比較容易學(xué)的技能。
在數(shù)據(jù)分析行業(yè)摸爬滾打好多年了,過來人給你一些忠實建議,看你的背景是會計,想來在數(shù)理統(tǒng)計、Excel使用上有一定基礎(chǔ)。
先說職業(yè)規(guī)劃吧,數(shù)據(jù)分析是一個很大的類別,籠統(tǒng)的說分算法向和業(yè)務(wù)向,會計背景轉(zhuǎn)業(yè)務(wù)向數(shù)據(jù)分析師是比較容易的,算法向難度高,不建議。
轉(zhuǎn)行初學(xué)者第一個要學(xué)的不是數(shù)據(jù)分析軟件工具,而是惡補基礎(chǔ)知識,數(shù)據(jù)分析入門先學(xué)工具是本末倒置,工具只是用來幫助你達成分析目的的,核心是你的分析思維。
第一,統(tǒng)計學(xué)基礎(chǔ)學(xué)習(xí)。這是打地基的東西,統(tǒng)計學(xué)知識是數(shù)據(jù)分析的基礎(chǔ),推薦李航的《統(tǒng)計學(xué)習(xí)方法》,適合初學(xué)者
第二,基礎(chǔ)的數(shù)據(jù)分析工具學(xué)習(xí)。相比你對Excel應(yīng)該有所了解了,Excel本身就是一個非常適合新手的數(shù)據(jù)分析工具,我入行的時候也是先學(xué)的Excel。需要掌握透視表、報表關(guān)聯(lián)等能力。不過大部分的企業(yè)現(xiàn)在不純用Excel做分析了,還有要求掌握python、或者BI工具使用,學(xué)習(xí)如何用它們做數(shù)據(jù)處理還有就是比較典型的經(jīng)營分析,這些網(wǎng)上可以搜到不少優(yōu)質(zhì)的資源,可以上手練習(xí)。
當(dāng)然,除了數(shù)據(jù)分析工具的掌握之外,你還需要掌握一些基本的數(shù)據(jù)庫知識,數(shù)據(jù)分析的工作存在著大量的取數(shù)工作,sql和數(shù)據(jù)庫知識也是你必須跨過的坎。
第三,業(yè)務(wù)知識。業(yè)務(wù)向的數(shù)據(jù)分析師,對業(yè)務(wù)知識的理解是核心競爭力,對于會計來說,最快的方法就是轉(zhuǎn)財務(wù)分析,會計工作會涉及到許多指標(biāo)的分析,涉及到企業(yè)的資產(chǎn)、負債、資金流、成長性等等,這些反饋的也是一家企業(yè)運營的核心,幾乎所有指標(biāo)都可以從財務(wù)指標(biāo)往下拆解,而很多技術(shù)背景出身的數(shù)據(jù)分析師,在早期是沒有這樣的視角和格局的,所以不要局限于自己之前是學(xué)會計或者做賬的。你可以在平時的學(xué)習(xí)或者工作中,有意識地塑造分析思維,尤其是財務(wù)分析,這會成為你的閃光點。
最后轉(zhuǎn)行有風(fēng)險,不建議裸辭轉(zhuǎn)行,做好萬無一失的準(zhǔn)備再大膽轉(zhuǎn)行
作為轉(zhuǎn)行數(shù)據(jù)分析的過來人,也來分享一下自己的看法
數(shù)據(jù)分析,各行各業(yè)都需要的技能
不同行業(yè)的數(shù)據(jù)分析,分析方向和內(nèi)容也是千差萬別
根據(jù)你的工作經(jīng)歷來看,長期從事財務(wù)方面的工作,為什么要轉(zhuǎn)行呢?
其實,不是所有做分析的人,都能和錢掛上鉤的
而做分析師,往往到最后都得與財務(wù)分析、價值變現(xiàn)、結(jié)合上才行
否則很難影響公司決策,分析也就沒有什么意義了
所以,你確實具備很多人沒有的優(yōu)勢
但我不建議你轉(zhuǎn)行做分析師
財務(wù)分析本就是商業(yè)分析領(lǐng)域大分支
建議你向財務(wù)分析職位發(fā)展,也許更好,不浪費經(jīng)驗
如果你是做商業(yè)分析,更偏向公司業(yè)務(wù)分析
建議先看一下 Gartner 關(guān)于商業(yè)分析與BI平臺魔力象限分析:
解釋一下魔力象限:
下面是包括2019和2020的分布和變化趨勢情況
基本上常見的大牌商業(yè)數(shù)據(jù)分析工具和平臺,里面都有涉及
如果你是做運營數(shù)據(jù)分析,或者偏純技術(shù)型分析
可能你需要懂一定的編程基礎(chǔ)或增長理論,以及常用的分析工具包:
第一類:傻瓜入門型
簡單易上手,也是最常用最普及的工具
比較常用的是:EXCEL、SPSS
EXCEL,我相信只要是工作人士,應(yīng)該沒有人不知道吧
就算過了這么多年,Excel 依舊是處理數(shù)據(jù)、數(shù)據(jù)可視化的經(jīng)典工具
它的用戶基數(shù)太大了,即便是在各種高級數(shù)據(jù)分析軟件大行其道的今天
絕大部分商業(yè)數(shù)據(jù)分析項目依然使用 Excel 解決,而且學(xué)起來容易入門
但是精通EXCEL很難,使用它需要一點一點積累
所以面試的時候,看到誰敢寫精通EXCEL,基本上直接KO掉
當(dāng)然,如果你認真鉆研,把它用成BI工具的也是不成問題
推薦3本書籍,入門必備:
而SPSS 全稱為「社會科學(xué)統(tǒng)計軟件包」
IBM 公司推出的,用于統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)
推薦3本書籍,入門到高級案例全了:
第二類:DIY代碼型
基本上,全靠寫代碼來解決問題
比如:SQL、Python,R
數(shù)據(jù)分析“直接”使用的數(shù)據(jù)大多數(shù)都為結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)通常都存在數(shù)據(jù)庫里(SQLServer, Mysql, Oracle, Hive等),而要提取這些數(shù)據(jù),SQL必不可少
推薦1本書,入門夠用:
Python和R是開源免費工具
來自世界各地的開發(fā)者貢獻自己開發(fā)的工具包
開發(fā)者越多,軟件的生命力就越強,發(fā)展也越快
日常數(shù)據(jù)分析(挖掘)90%以上的場景,兩個軟件都可以覆蓋到
如果你已經(jīng)在學(xué)其中一個,請繼續(xù)努力,深入學(xué)習(xí)即可
推薦2本書,關(guān)于python和R的:
第三類:混合平臺型
這種類型,既可以界面操作,又可寫代碼,相對靈活
比如:Tableau、Powerbi、SAS
先說PowrBI,個人感覺Power BI的儀表板性能更好
它可以打通數(shù)據(jù)清洗、分析處理、可視化三大難題
尤其在python可視化代碼量大的情況下,建議后期出圖考慮使用它
而且最重要的是,它有一個免費的桌面版,非常爽
而Tableau,主攻簡單、便捷的可視化工具,當(dāng)然現(xiàn)在被收購了,產(chǎn)品更加多元化了
用它做出的圖表可視化效果很贊,可惜我本人不太喜歡它的操作風(fēng)格
還有有個小缺點,就是收費版本不便宜,在線版本因為網(wǎng)絡(luò)的問題有時比較卡
而SAS,一般是醫(yī)藥、金融類應(yīng)用場景較多
比如:銀行風(fēng)控、互金行業(yè),醫(yī)藥建模檢測等等
很多國內(nèi)大型公司使用它,是業(yè)內(nèi)權(quán)威的代表,出的報告,行業(yè)公信力很強
當(dāng)然,還有很多其他工具,網(wǎng)上一搜一大把
本人就不贅述了,就只列出行業(yè)比較認可的
總之,工具選擇,因人而異,選擇適合自己的最重要
其實大家都有過這樣的經(jīng)歷
很正常,大家都是這么過來的,無須焦慮。
就本人經(jīng)驗和感受,說3個小建議:
1. 選好書籍打基礎(chǔ),資料宜精 不宜廣
選擇一本經(jīng)典教材或者課程,非常重要
市面上的資源太多了,建議多看看知識和豆瓣推薦高分書籍,一般不會錯
還有建議買紙質(zhì)書,花了錢,這個書才香,才容易讀完
看書籍是為了先打好基礎(chǔ),然后構(gòu)建個人知識框架
最后利用“碎片化”時間、從解決實際問題出發(fā)去提升自己
2. 切忌大而全,工具宜少 不宜多
本人以前很喜歡鼓搗軟件,各種工具各種玩耍
后來發(fā)現(xiàn)有些工具用過一次就再也沒碰過了
而真正提高工作效率的,都是大家常提的,公認的
比如:你做數(shù)據(jù)量少了200M的 簡單分析,Excel和SPSS一般是最佳選擇 出活兒快!
而SQL是用來提數(shù)跑數(shù)的,你必須得會,得熟練,不然時間都耗在這兒了
當(dāng)你遇到數(shù)據(jù)量較大或者需要復(fù)雜模型,就可以上PYTHON和R了
當(dāng)然如果是你公司有大數(shù)據(jù)平臺,就可能使用HIVE、SPARK、STOM等等
提示一點:切記不要為了追求高大上的模型或者效果
正所謂“屠龍之術(shù),學(xué)而無用”
脫離實際工作場景的分析,純屬扯淡
3. 邊干邊學(xué) 邊整理 記住“以用促學(xué),以教促學(xué)”
很多同學(xué)總是問我,為什么學(xué)習(xí)EXCEL
總是感覺學(xué)不會、學(xué)了就忘呢?
原因主要有2點:
一是因為沒有實戰(zhàn)的機會,用的太少了,短練!
二是用完了就結(jié)束了,從來不總結(jié)整理,太懶!
最常見的一種現(xiàn)象是,很多人常常翻著一本厚厚的EXCEL秘籍自學(xué)
可當(dāng)他想使用Excel的時候,卻又要到處搜索資料
而用完了某個函數(shù),沒過幾天就忘記了
所以,一定要帶著問題、帶著坑,去學(xué)習(xí),你的記憶才會深刻
最后記得,定期整理沉淀自己,消化知識
一種方法是,畫思維導(dǎo)圖梳理體系,知識才能內(nèi)化成你自己的東西
第二是,多多和別人交流和分享,思維的碰撞,能加深個人的理解和感悟
多注重業(yè)務(wù)理解,多實踐積累經(jīng)驗,才是王道
希望上面的文字回答,能幫到你
一般常用的工具有數(shù)據(jù)庫、EXCEL、PYTHON、POWER BI等,但是我常用的工具主要是智分析,因為其處理大數(shù)據(jù)的能力非常出色,而且入門門檻非常低,只要會EXCEL就能學(xué)會。我建議初學(xué)者還是先從EXCEL開始學(xué)起,因為EXCEL非常強大,很多事情都可以完成,等學(xué)會了EXCEL,再去結(jié)合智分析做數(shù)據(jù)分析,那將會是非常牛逼的一件事。