{eval=Array;=+count(Array);}
取數是數據工作的一個基礎內容,也是大多數“入門”級別數據工作人員(例如數據分析師)的基本職責,取數對于前期的數據概況和業(yè)務需求會是一個熟悉和漸進了解的過程,因此這個過程必不可少,特別是對于剛入職的新人。
但是,如果一個數據工作者長期從事取數工作(例如超過2年,這里的時間取決于企業(yè)的數據規(guī)模和復雜度),那么其價值確實會很小,為什么這么講呢?
這里,首先要談談取數這個工種的特點,就八個字:上不著天,下不著地。
在企業(yè)內取數的目的無外乎兩個:決策分析(比如各類統(tǒng)計等)和用戶營銷,取數人員對下銜接了平臺和數據,對上銜接了業(yè)務人員,似乎是最容易成為復合型人才的,但大多時候不是這樣。
實際情況是,取數人員號稱需要理解業(yè)務,但由于不為業(yè)務發(fā)展負責,因此其不需要鉆研業(yè)務,而通過取數獲得的直觀業(yè)務理解是非常有限的。
舉個例子,業(yè)務人員需要取某個特定口徑營銷活動的目標用戶,取數人員當然可以方便的取出來,但很少有取數人員能真正的去理解取數的背景,當然可能人家也不給這個機會,比如營銷活動的目的是什么、為什么定這個業(yè)務口徑、采用什么樣的營銷政策、準備怎么觸達這些用戶等等。
從技術的角度看,取數人員雖然要接觸平臺和數據,但由于只取不改,因此技術要求其實很低,一般掌握簡單的SQL就可以了,但這降低了取數人員技術進步的可能,現在很多取數工具可視化做得不錯,取數人員甚至連后臺的基本命令都不需要掌握。
因此,取數人員的實際技術含量是很低的。
但由于取數速度又往往影響企業(yè)的決策和營銷效率,因此取數人員在企業(yè)內非常被需要,有些取數人員自我感覺還不錯,但由于這個工種本身的特點,決定了職業(yè)天花板很低。
更不好的消息是,在一個企業(yè)內,IT部門一般就是后端部門了,數據部門則是IT部門的后端,而取數又是數據部門的末端,取數特別上不了臺面,上不了臺面意思就是取數太強調過程了,沒法體現真正的業(yè)務或技術貢獻,部門或公司不需要取數人員做匯報,其業(yè)績往往只是部門老大PPT上的一個數字,1000和10000對取數來說可能是云泥之別,但對于其它人的意義就是一個變動的數字。
如果你現在已經從事取數工作1年以上了,但被業(yè)務部門日常、瑣碎的取數需求占據大部分時間,每天忙到懷疑人生,你就要想想,自己是否已經成為了一臺取數機器。
一些取數人員覺得會不服氣,自己幸幸苦苦,加班加點取出那么多數據,業(yè)務人員EXCEL、PPT倒騰幾下就出了結論,自己則沒半點功勞,憑什么?
那你得好好想想蘋果手機的價值鏈,最有價值的是設計,從來不是富士康,前者具有稀缺性,后者換誰做都可以,這就是現實。
這是很多取數人員在一個企業(yè)內面臨的基本面。
我這么提,并不是說取數是一個沒有前途的工種,而只是表明,一些工種天然跟業(yè)務,領導聯系緊密,很容易被關注,能獲得更多的反饋,也容易獲得進步,潛力不容易被埋沒,而很多工種則相反,特別強調自省,否則一不小心就成了大叔,泯然眾人矣,類似的其實很多,比如一些維護和客服工作。
首先要說明,從來沒有人明確定義過有取數這個工種,也沒有人限定過取數的邊界,你去招聘網站上看,只能看到數據建模,數據分析,數據架構,經營分析,數據開發(fā),數據管理等這類崗位,但基本沒有取數。
取數實際是上述崗位需要掌握的一個基本功,取數本身只是手段,其內涵很難成就一個職業(yè),企業(yè)里現實情況是,一方面很多取數人員沒認真思考過職業(yè)規(guī)劃,比如取數了一年還沒點想法,另一方面企業(yè)可能也缺乏數據人才培養(yǎng)的環(huán)境,沒能力照顧到每個員工的發(fā)展,往往是走一步看一步,現在外行領導內行的情況蠻多的,外行可以搞搞無為而治,但要說培養(yǎng)專業(yè)人才,必須對于這個專業(yè)有深入的理解。
假如你已經意識到了這個困境,希望有所改變,我就給五個建議,下面是五千字長文,一定要看完:
1、理解什么叫真會取數
取數是理解數據和業(yè)務最有效的手段,如果你是個新人,先老老實實的去實踐吧,即使已經有什么數據分析師,數據建模師等的職業(yè)理想也先藏在心里,這個過程一般在半年到一年,當然各類企業(yè)由于業(yè)務和數據環(huán)境的不同有差異,等到你成為合格的取數人員了,你再繼續(xù)往下看。
(1)在你所取數的領域,業(yè)務人員一開口,你就基本知道怎么取了,完全不依賴它人,這需要反復的練習,形成自己的取數套路,如果你經常跟業(yè)務人員扯皮,或者返工很多,或者外部評價一般,就要想想是否是自己學藝不精,而不是人家跟你過不去,如果你取數到一定水平,會形成一定的取數權威,業(yè)務人員會信任你。
(2)面對業(yè)務人員能獨當一面并不意味著你已經是合格的取數人員,很多企業(yè)寬表做的很好,能夠應付大多數的取數,筆者建議你至少要知道你這條業(yè)務線的取數涉及的所有基礎表的來龍去脈,這需要自頂向下的學習,無法靠簡單的自底向上的日常實踐就能獲得,你要盡量擴充你的數據視野,千萬不要被幾張寬表困在局中,否則你完全不知道如何變通,寬表成就不了數據分析,數據建模等事業(yè),這個大家可以掂量下自己的分量。
如果你覺得夠格了,那可以繼續(xù)往下看,如果現在連取數都還疙疙瘩瘩,那就別好高騖遠,先認認真真,老老實實的做好了再說。
2、業(yè)務上要更進一步
在我看來,基于業(yè)務人員想法來取好數,最多只是"60分工作",即便你的需求來源是業(yè)務部門老總,也就值60分。何為"60分工作"?就是剛剛滿足溫飽的工作,讓你能賺這份工資,但無法凸顯你的價值。
如果你的職業(yè)規(guī)劃偏向業(yè)務,比如成為經營分析師或者數據分析師,你就需要通過取數過程主動表現出你對于業(yè)務的認識和貢獻,如果你還不知道什么叫作主動體現想法,以下是兩個場景:
(1)主動提供取數建議:有大量的取數是有一定難度的,業(yè)務部門往往事先沒想清楚,這個時候就需要當面溝通,要抓住機會主動提供一些建議,與業(yè)務人員互動也是理解業(yè)務需求和分析思路的好機會,要善于換位思考,最好將取數的主動權抓在自己手里,引導業(yè)務人員按你的想法去做,不僅讓人家覺得你這人靠譜,而且可以降低大量無效的取數,要知道,業(yè)務人員越想不清楚的需求,就越容易亂提,然后雙方就在口徑上糾纏不清,取數人員經常埋怨業(yè)務部門新人亂提需求,不懂基本的規(guī)則,就是這個原因。
在與業(yè)務部門互動的過程中,你的取數能力、業(yè)務能力、思考能力、溝通能力及表達能力都能獲得很好的鍛煉和展現,這種取數人員很容易被業(yè)務部門盯上,然后某天就去業(yè)務部門報道了,當然并不是說一定要走這條路,但這樣做的確讓自己的人生多了一種選擇,畢竟不是每個取數人員都適合去做技術。
(2)主動參與一些分析:一般認為,業(yè)務分析是業(yè)務部門的事情,數據部門很少參與,但實際情況并不是這樣,取數人員照樣有分析鍛煉的機會,比如KPI指標異動,往往需要先確保原始數據準確,然后再從業(yè)務上查找問題,這個時候業(yè)務人員和數據人員的分工界面其實不是很清楚,大家都可以做,由于取數人員最先拿到數據,因此有條件先人一步。
公司也不關注到底哪個部門應該提供分析報告,而在于哪個部門能更快更好的通過分析發(fā)現和解決問題,因此偏系統(tǒng)層面的欠費分析,稽核分析等等,數據部門做往往更有優(yōu)勢。
在做數據分析的過程中,取數人員會養(yǎng)成深度思考的習慣,掌握基本的分析和表達技巧,煉成一種通過數據講故事的能力,不僅提升了綜合能力,而且能較好的彰顯自身的價值,性價比是很高的,根據筆者的觀察,能通過取數打開一片天空的,很多有數據分析的經驗。
因此,取數人員不僅要扮演好"實現者"的角色,更要能成為"思考者",分析則是取數人員實現突破的康莊大道。
3、技術提升的空間很大
如果你還是想做技術,那技術空間可大著,關鍵在于要有改變的意識,不要總是按部就班,其實取數過程中接觸的任何現成平臺、工具與數據都有改進的機會,關鍵在于你敢不敢去優(yōu)化,甚至顛覆它們,以下是一些場景:
(1)讓模型變得更好用:數據倉庫模型本來的目的是降低取數的成本,但隨著業(yè)務發(fā)展、系統(tǒng)變更及取數復雜性的增大,可用性會越來越差,很多取數人員就沒有這個意識去改變下,比如增加幾個字段,甚至自己建個模型表,別以為現成的模型師就比你做得好。如果你以后想成為一個數據架構師,可以從做數據倉庫模型優(yōu)化開始,敢于動底層的代碼,在這個過程中能搞清楚一系列的概念,比如ETL,DW,OLAP等等,要敢于去做一些長遠的事,取數的經驗通過模型沉淀下來后可以讓取數跑得更快,你的優(yōu)化將讓全團隊受益,這就是顯性化價值,如果你想改變,這就是一個切入點。
(2)讓平臺變得更好用:在做數據倉庫的時候,為了讓數據跑得更快,你需要接觸到大量的技術,評估各類技術的優(yōu)劣,現在大數據平臺hadoop,MPP,流處理是為了滿足不同的大數據處理場景需要而產生的,你甚至可以自己來搭建平臺,從數據處理者轉變?yōu)槠脚_架構師,這又是一條成長路徑,當然你要提前做好準備,比如多找些開源工具練手,或者自己搭一個取數環(huán)境,真有機會才能抓得住。
(3)讓產品變得更好用:假如你發(fā)現很多取數能夠固化成報表,應該當仁不讓的寫腳本并實現它,假如你所在的企業(yè)提供了取數工具,你恰好對產品感興趣,就可以結合取數的實踐,思考下這個工具有什么問題,有哪些需要改進的地方,做數據產品經理不是你想做就能做得,你得首先體現出做產品的素質,敢于提出建議并給出設計,這就是一個好的開始,團隊少一個取數人員損失不大,多一個有想法的做開發(fā)和產品的人,那是可遇而不可求的事情。
(4)讓數據變得更有用:如果你對數據挖掘感興趣,那就不要僅限于只會SQL,起碼要把Python,R等語言學會,能夠端到端的完成一個數據挖掘過程,一般數據團隊總是有相關的專業(yè)課題的,機會一到,一定要主動請纓,在做這類具有挑戰(zhàn)性的課題中,你的能力會快速增長,也就實現了華麗轉身。
總之,取數人員如果要做技術,就要想清楚自己要什么,然后讓領導看到你在這方面的努力和變化。
4、從授人以魚到授人以漁
由于市場變化很快,取數總是滯后于市場,同時企業(yè)的取數流程帶來的管理開銷是巨大的,無論是溝通成本,審批成本或是反復成本,實際上取數永遠無法讓業(yè)務人員滿意,最好的方式是讓業(yè)務部門自己來取,這是最高效率的做法,但這種模式能否執(zhí)行也依賴于企業(yè)的實際情況。
假如業(yè)務部門真的愿意自己來?。ㄒ话愀偁幵郊ち业钠髽I(yè)驅動力越強)也不是那么容易,至少取數人員要配合做到以下幾點:
(1)提供平臺或工具:如果沒有適當的工具,讓非技術人員寫SQL(姑且認為分析師是技術吧),可能普通業(yè)務會排斥,此時需要給他們提供一個界面化、可點擊、可拖拽的工具。這種系統(tǒng)如果只是簡單的基于底層數據來開發(fā)不難,無非是將用戶界面的點擊和篩選條件,映射到后臺的sql“模板”,并生成一個sql語句然后再去數據庫執(zhí)行,這種方法往往比較容易接受且非常靈活?;蛘呤忻嫔嫌鞋F成的BI工具,諸如下放圖片所示的FineBI,可以直接用于搭建企業(yè)的數據分析系統(tǒng),也是非常好的選擇!
(2)提供適當的培訓:各業(yè)務線學員自己要能獲取數據,要給業(yè)務線的其中一個經常運用到數據的人員進行培訓,對每個部門種下一名種子選手,當這名選手學會之后,他有個任務就是把技能擴散到部門中的各個人員。
(3)普及數據文化:由于人員培養(yǎng)是個長期過程,因此需要協(xié)同公司的人力等部門,建立一套常態(tài)化的培訓機制,包括課程體系、師資隊伍等等,比如筆者企業(yè)的大數據千人計劃,當前每年開展的培訓次數超過4000人次。
如果你已經意識到這一點,可以嘗試著現在就提出這種思路,甚至簡單的去實現一個自助取數工具,說不定會獲得認可呢?即使推動不了業(yè)務部門用,自己用也可以,配置是絕對快過自己寫代碼的,比如我們有只7個人的取數團隊,手工+配置每天能做到30張單子,原來沒有配置能力前就只能做十幾個。
授人以漁這種支撐模式跟每個企業(yè)的發(fā)展階段有關系,其實你能做的大多時候只能是順勢而為,但要相信自助化是一個趨勢,不嘗試永遠沒有機會。
5、與業(yè)務人員做一定的博弈
博弈的目的不是為了推擋取數需求,而是因為取數這種事務性的工作,特別容易讓你陷入低質勤奮的狀態(tài),取數人員需要為自己留出一定的時間來思考前面筆者提出的系列問題,比如機器換人,大量的資源投入長遠來講實際還損害公司的利益,不少企業(yè)碩士或者博士都在長期取數,這是資源的浪費。
(1)建立一套取數管理機制和流程,包括標準化的取數模板,嚴格的審批流程等等,雖然增加了取數門檻,但也會擋掉一些需求,給自己一些時間緩沖,否則很容易會被各種緊急需求淹沒。
(2)多問問業(yè)務人員取數的目的,別當老好人,你問得越多,業(yè)務人員提需求就會越謹慎,比如常問“你要這個數據干什么?“,對業(yè)務人員來說就是一種威懾,有可能數據需求連他們自己都沒想明白,這可以有效過濾掉不靠譜的、不尊重別人時間的需求。
(3)需求太多的時候可以跟業(yè)務人員協(xié)商,排定優(yōu)先級,暗示時間和資源有限,把時間放在高價值、最重要的地方。
相信你的上級所以一直讓你做取數,大多時候,是因為根本不知道你除了取數還能干什么,假如你的確按照以上的做了,發(fā)現企業(yè)仍然不能給你進一步提升的機會,你就要考慮是不是應該換個公司。
這好像是很多數據分析師難逃的命運!
不過從根源上來說本人認為原因有兩個:
第一,公司和領導缺乏認知,對于崗位定位不明確,放縱一個本來可以創(chuàng)造更多價值的崗位變成了一個取數機器!
第二,數據分析師是一個同時偏業(yè)務測和技術側的崗位,但其核心還是對于問題的思考方式,并非一身技術才華就能做得很好的,所以這一塊還是靠著個人扎實技術的同時,多思考業(yè)務真正的問題,很多問題并非真正的問題,就好像之前遇到過一個公司一直在努力解決公司的投訴問題,殊不知投訴的根源是產品問題!
數據分析師就是用簡單、通俗的數據表現方法表達數據內在的本質及規(guī)律性。要完成此目的并不是簡單的進行一系列的數字邏列,而是要在充分的大量的數據基礎上進行分析、判斷,此外還需進行各種調查研究,進行對比分析,找出可信的、有說服力的行業(yè)或糸統(tǒng)資料,為領導分析、判斷提供科學的數據支持。
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答