{eval=Array;=+count(Array);}
大數(shù)據(jù)是我的研究方向之一,所以我來(lái)回答一下這個(gè)問(wèn)題。
大數(shù)據(jù)專(zhuān)業(yè)是一個(gè)非常新的專(zhuān)業(yè),早期有的學(xué)校開(kāi)設(shè)了數(shù)據(jù)科學(xué)專(zhuān)業(yè),后來(lái)隨著條件逐步成熟,一部分高校開(kāi)設(shè)了大數(shù)據(jù)專(zhuān)業(yè)。大數(shù)據(jù)專(zhuān)業(yè)的教學(xué)內(nèi)容主要集中在三個(gè)方面,一個(gè)方面是數(shù)學(xué),因?yàn)榇髷?shù)據(jù)需要用到大量的算法,所以數(shù)學(xué)基礎(chǔ)對(duì)大數(shù)據(jù)研發(fā)人員來(lái)說(shuō)還是非常重要的。一方面是統(tǒng)計(jì)學(xué),大數(shù)據(jù)的很多內(nèi)容是統(tǒng)計(jì)學(xué)的延伸,尤其是大數(shù)據(jù)分析領(lǐng)域。還有一方面是計(jì)算機(jī)技術(shù),大數(shù)據(jù)是物聯(lián)網(wǎng)和云計(jì)算發(fā)展的必然產(chǎn)物,所以大數(shù)據(jù)的基礎(chǔ)就是計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)。
大數(shù)據(jù)專(zhuān)業(yè)畢業(yè)的學(xué)生就業(yè)面非常廣,由于目前大數(shù)據(jù)正在由概念向產(chǎn)業(yè)轉(zhuǎn)換,所以大部分大數(shù)據(jù)專(zhuān)業(yè)的畢業(yè)生都在從事大數(shù)據(jù)平臺(tái)工程師的崗位,主要任務(wù)是搭建企業(yè)的大數(shù)據(jù)平臺(tái)以及開(kāi)發(fā)一些平臺(tái)上的具體功能。
當(dāng)然,未來(lái)大數(shù)據(jù)崗位涉及到算法分析師、算法實(shí)現(xiàn)工程師、數(shù)據(jù)分析師、BI工程師(還有很多細(xì)分崗位)、數(shù)據(jù)工程師(采集、整理等)、程序員等。
由于目前大數(shù)據(jù)領(lǐng)域的人才缺口比較大,所以目前從事大數(shù)據(jù)崗位的工程師待遇都非常不錯(cuò),相信在未來(lái)很長(zhǎng)一段時(shí)間內(nèi),大數(shù)據(jù)相關(guān)崗位的待遇會(huì)明顯高于軟件行業(yè)平均水平。
另外,建議大數(shù)據(jù)專(zhuān)業(yè)的本科生繼續(xù)讀研,讀研會(huì)提供一個(gè)更好的研究平臺(tái),也會(huì)明顯提升自己的職場(chǎng)競(jìng)爭(zhēng)力。
我目前在帶大數(shù)據(jù)團(tuán)隊(duì)做一些落地項(xiàng)目,我會(huì)陸續(xù)在頭條上寫(xiě)一些大數(shù)據(jù)相關(guān)的科普文章,感興趣的朋友可以關(guān)注我的頭條號(hào),相信一定會(huì)有所收獲。
如果有大數(shù)據(jù)方面的問(wèn)題,或者是考研方面的問(wèn)題,都可以咨詢(xún)我。
謝謝!
本人從事大數(shù)據(jù)以及相關(guān)行業(yè),從目前大數(shù)據(jù)實(shí)際運(yùn)用的角度來(lái)說(shuō)一下這個(gè)問(wèn)題。以下是我整理的近年來(lái)大數(shù)據(jù)相關(guān)好崗位以及崗位職責(zé),技能需求需求,供參考
一,大數(shù)據(jù)開(kāi)發(fā)
從事大數(shù)據(jù)開(kāi)發(fā)工程師
崗位職責(zé)
1、利用Hadoop、Spark等技術(shù)在分布式系統(tǒng)上對(duì)海量歷史數(shù)據(jù)進(jìn)行預(yù)處理,挖掘用戶(hù)信
息;
2、參與大數(shù)據(jù)基礎(chǔ)平臺(tái)的搭建和維護(hù);
3、負(fù)責(zé)廣告投放項(xiàng)目管理平臺(tái)研發(fā);
4、負(fù)責(zé)大數(shù)據(jù)計(jì)算處理平臺(tái)項(xiàng)目研發(fā)。
技術(shù)要求
1、熟練掌握c++/Java開(kāi)發(fā),具備扎實(shí)的程序設(shè)計(jì)基本功和學(xué)習(xí)能力
2、熟悉 Linux,熟悉 shell/perl/python/php 等腳本語(yǔ)言的一種或多種。
3、熟悉傳統(tǒng)數(shù)據(jù)庫(kù)MySQL。
4、熟悉MapReduce、Storm、Spark、Spark Streaming等大數(shù)據(jù)開(kāi)發(fā)工具,對(duì)源代碼
有一定研究者優(yōu)先;
5、熟悉linux環(huán)境,熟悉shell等腳本編程;
6、有大規(guī)模數(shù)據(jù)處理和日志處理經(jīng)驗(yàn)的優(yōu)先。
7、有較強(qiáng)的人際溝通、協(xié)調(diào)能力,具備與技術(shù)人員溝通數(shù)據(jù)需求的能力;
8、具備良好的邏輯分析能力和解決實(shí)際問(wèn)題的能力。
二,大數(shù)據(jù)運(yùn)維
從事大數(shù)據(jù)運(yùn)維工程師
崗位職責(zé)
1、負(fù)責(zé)大數(shù)據(jù)平臺(tái)整體軟硬件的日常運(yùn)維;
2、分析平臺(tái)運(yùn)行狀態(tài),進(jìn)行性能優(yōu)化;
3、負(fù)責(zé)大數(shù)據(jù)平臺(tái)運(yùn)行故障的分析、定位和解決;
4、負(fù)責(zé)新技術(shù)、新組件的技術(shù)探索、測(cè)試和應(yīng)用;
5、支撐運(yùn)維自動(dòng)化系統(tǒng)的設(shè)計(jì)和開(kāi)發(fā)。
崗位要求:
1、 熟悉hadoop生態(tài)圈主要開(kāi)源技術(shù)組件及其工作原理,能閱讀相關(guān)源代碼,能順利閱讀英文文檔;
2、熟悉軟硬件設(shè)備、網(wǎng)絡(luò)原理,有豐富的大數(shù)據(jù)平臺(tái)部署、性能優(yōu)化和運(yùn)維經(jīng)驗(yàn);
3、熟悉Linux,熟悉cacti、ganglia、zabbix等運(yùn)維軟件,熟悉SaltStack、Ansible等自動(dòng)化軟件,有python、java、shell編程基礎(chǔ);
4、工作認(rèn)真負(fù)責(zé),有較強(qiáng)的學(xué)習(xí)能力、動(dòng)手能力和分析解決問(wèn)題的能力;
補(bǔ)充:
熟悉
Hadoop/Hbase/Hive/Presto/Yarn/Spark/Storm/Kafka/Elasticsearch/Flume等開(kāi)源項(xiàng)目,有運(yùn)維優(yōu)化經(jīng)驗(yàn)者優(yōu)先;
熟悉Linux操作系統(tǒng)的配置、管理及優(yōu)化;
熟悉Python、Linux、shell,有ETL維護(hù)經(jīng)驗(yàn)、電信行業(yè)大數(shù)據(jù)維護(hù)經(jīng)驗(yàn)者優(yōu)先
三,數(shù)據(jù)挖掘
從事數(shù)據(jù)挖掘工程師
崗位職責(zé)
1、對(duì)海量數(shù)據(jù)進(jìn)行分析,建立數(shù)據(jù)挖掘算法,利用大數(shù)據(jù)對(duì)產(chǎn)品進(jìn)行研究和建模,為用戶(hù)提供評(píng)估和預(yù)測(cè)等功能;
2、參與/負(fù)責(zé)用戶(hù)畫(huà)像、推薦等系統(tǒng)搭建,參與核心產(chǎn)品推薦場(chǎng)景算法的研發(fā)和優(yōu)化;
3、采用先進(jìn)的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法,為公司業(yè)務(wù)部門(mén)提供決策依據(jù);
4、搭建數(shù)據(jù)挖掘系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng),實(shí)現(xiàn)智能平臺(tái)的自動(dòng)化流程。
1、具備強(qiáng)悍的編碼能力,有扎實(shí)的數(shù)據(jù)結(jié)構(gòu)和算法功底;
2、優(yōu)秀的學(xué)習(xí)能力、獨(dú)立分析問(wèn)題和解決問(wèn)題能力;
3、熟悉Linux開(kāi)發(fā)環(huán)境,熟悉Python,PHP,Java等語(yǔ)言?xún)煞N以上;
4、熟悉基本的數(shù)據(jù)分析方法、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)算法;
5、熟悉SPSS/Modeler/R/Python等至少一種數(shù)據(jù)挖掘工具;
6、熟悉Hadoop/Spark,有Elasticsearch,Solr,Kafka,F(xiàn)lume等開(kāi)源項(xiàng)目使用經(jīng)驗(yàn)
7、有畫(huà)像、廣告、推薦,搜索等算法方向?qū)嶋H工作經(jīng)驗(yàn)優(yōu)先
四,BI(商務(wù)智能)工程師— (包括數(shù)據(jù)庫(kù)開(kāi)發(fā)、BI開(kāi)發(fā)工程師、ETL開(kāi)發(fā)、報(bào)表開(kāi)發(fā)、BI咨詢(xún)顧問(wèn))
崗位職責(zé)
1、獨(dú)立負(fù)責(zé)業(yè)務(wù)數(shù)據(jù)收集整理,構(gòu)建經(jīng)營(yíng)分析和報(bào)表系統(tǒng);
2、通過(guò)專(zhuān)題分析,對(duì)業(yè)務(wù)問(wèn)題進(jìn)行深入分析,為業(yè)務(wù)的策略、產(chǎn)品優(yōu)化提供數(shù)據(jù)支持;
3、 以數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)為目標(biāo),進(jìn)行數(shù)倉(cāng)研發(fā)工作但不局限于數(shù)倉(cāng);
4、 參與數(shù)據(jù)倉(cāng)庫(kù)ETL設(shè)計(jì)、開(kāi)發(fā)和優(yōu)化工作,保證數(shù)據(jù)準(zhǔn)確、穩(wěn)定、組織合理
崗位要求
1、掌握Oracle、MySQL、ODPS等數(shù)據(jù)庫(kù)開(kāi)發(fā)技能,熟練應(yīng)用開(kāi)發(fā)、數(shù)據(jù)庫(kù)原理和常用性能優(yōu)化和擴(kuò)展技術(shù);
2、掌握數(shù)據(jù)倉(cāng)庫(kù)建設(shè)、熟悉大數(shù)據(jù)平臺(tái)操作,離線(xiàn)計(jì)算Hive/MR研發(fā)、實(shí)時(shí)計(jì)算spark streaming/storm;
3、熟悉ETL邏輯、OLAP設(shè)計(jì)和數(shù)據(jù)分析技術(shù)(聚類(lèi)分析、回歸分析、決策樹(shù)等)、數(shù)據(jù)挖掘相關(guān)算法;
4、熟悉Linux系統(tǒng)環(huán)境開(kāi)發(fā),掌握shell、perl、python等至少一種開(kāi)發(fā)語(yǔ)言。
6. 有較強(qiáng)的邏輯/概率思維能力,善于分析、歸納、描述、溝通、和解決問(wèn)題。
補(bǔ)充(根據(jù)企業(yè)工具區(qū)別)
1、全面熟知數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)理念、設(shè)計(jì)方法,熟練掌握Informatica、Kettle、Automation等至少一種ETL工具;
2、熟練掌握SAP BO、MSTR、SmartBI、Cognos、QV等至少一種BI工具;
3、熟悉數(shù)據(jù)倉(cāng)庫(kù),掌握BI相關(guān)工具,如ETL工具(SSIS, SAP DataService)、OLAP工具(SSAS)和前端展示工具(BO CR/Webi)
五,數(shù)據(jù)可視化
從事可視化工程師
崗位職責(zé)
1、負(fù)責(zé)大數(shù)據(jù)平臺(tái)業(yè)務(wù)邏輯和數(shù)據(jù)可視化功能,數(shù)據(jù)可視化組件研發(fā);
2、搭建基礎(chǔ)的可視化分析平臺(tái),設(shè)計(jì)數(shù)據(jù)分析應(yīng)用的架構(gòu),實(shí)現(xiàn)實(shí)時(shí)數(shù)據(jù)調(diào)用與展示;
3、數(shù)據(jù)相關(guān)性分析與根因分析;
4、支持客戶(hù)需求分析和數(shù)據(jù)分析。
崗位要求
1、熟練Web前端技術(shù)(SVG/HTML5/JavaScriptdeJS等);
2、熟練D3、Echarts、Three.js、WebGL等開(kāi)源數(shù)據(jù)可視化庫(kù)和技術(shù);
3、有Web服務(wù)器端編程語(yǔ)言(如Node/Java)開(kāi)發(fā)經(jīng)驗(yàn)優(yōu)先;
4、有blender(以及blender game engine)或者unity 3d或unreal engine等開(kāi)發(fā)經(jīng)驗(yàn)優(yōu)先
一些BI崗位的詳細(xì)介紹
BI工程師(開(kāi)發(fā)、咨詢(xún)、實(shí)施)
BI開(kāi)發(fā)工程師
崗位職責(zé)
1、執(zhí)行在框架設(shè)計(jì)的基礎(chǔ)上完成具體組件的概要設(shè)計(jì)、詳細(xì)設(shè)計(jì)編寫(xiě);
2、完成BI系統(tǒng)具體組件的代碼編寫(xiě)、單元測(cè)試;
3、參與BI系統(tǒng)報(bào)表平臺(tái)技術(shù)架構(gòu)設(shè)計(jì),數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì);
4、參與BI系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的構(gòu)架、建模和實(shí)現(xiàn)。
5、負(fù)責(zé)向需求方提供數(shù)據(jù)及業(yè)務(wù)分析服務(wù),負(fù)責(zé)整體風(fēng)控模型的優(yōu)化,理解并掌握BI報(bào)表需求;
崗位要求
1、有數(shù)據(jù)倉(cāng)庫(kù)或統(tǒng)計(jì)分析類(lèi)項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn)或較深的理論知識(shí);
2、熟悉Cognos、Webfocus、ireport等數(shù)據(jù)分析報(bào)表開(kāi)發(fā)工具和技術(shù);
3、熟悉Linux/Unix服務(wù)器,并了解一些基本的操作命令;
4、至少熟悉Informix/Oracle/SQL Server等數(shù)據(jù)庫(kù)中的一種,并在此基礎(chǔ)上有過(guò)ETL程序或存儲(chǔ)過(guò)程的開(kāi)發(fā)。
5、能夠熟練應(yīng)用JSP/Servlet/JavaScript等WEB開(kāi)發(fā)技術(shù),熟悉Spring,Struts2和iBATIS等主流的開(kāi)發(fā)框架,熟悉BIRT、JasperReports等開(kāi)源報(bào)表工具;
6、熟悉Linux Shell、Perl等腳本語(yǔ)言,熟悉ORACLE數(shù)據(jù)庫(kù),PL/SQL編程;
7、熟悉BI系統(tǒng)技術(shù)框架,熟悉數(shù)據(jù)采集流程,對(duì)數(shù)據(jù)倉(cāng)庫(kù)有比較深入的了解;
8、熟悉行業(yè)經(jīng)營(yíng)分析系統(tǒng)(BI)架構(gòu)及實(shí)現(xiàn)者優(yōu)先。
BI咨詢(xún)顧問(wèn)
崗位職責(zé)
1、分析客戶(hù)的數(shù)據(jù)要求;
2、負(fù)責(zé)Qlikview/Tableau BI項(xiàng)目的實(shí)施和報(bào)表開(kāi)發(fā);
3、負(fù)責(zé)校驗(yàn)數(shù)據(jù),保障數(shù)據(jù)的準(zhǔn)確;
4、 負(fù)責(zé)客戶(hù)需求收集、分析,梳理業(yè)務(wù)流程解決方案,項(xiàng)目的拓展支撐;
5、撰寫(xiě)需求規(guī)格書(shū)及各類(lèi)相關(guān)文檔;
6、良好的團(tuán)隊(duì)合作、協(xié)調(diào)、問(wèn)題處理能力;
崗位要求
1、對(duì)BI有系統(tǒng)的認(rèn)知;
2、熟練使用Qlikview,Tableau等前端工具;
3、熟悉MS SQL Server,熟練運(yùn)用SQL語(yǔ)言;
4、前端報(bào)表偏業(yè)務(wù)方向需熟悉主流報(bào)表工具或新興前端報(bào)表工具Qlikview、Tableau等優(yōu)先考慮;
6、后臺(tái)數(shù)據(jù)處理需熟悉掌握至少一種后臺(tái)ETL開(kāi)發(fā)工具,例:Informatica powercenter、Datastage、OWB、微軟DTS、Kettle等;
7、后臺(tái)數(shù)據(jù)建模需熟練掌握至少一種數(shù)據(jù)挖掘算法和建模方法,了解建模;
8、良好的英文能力,能快速閱讀和撰寫(xiě)英文技術(shù)文檔者優(yōu)先。
BI實(shí)施工程師
崗位職責(zé)
1、負(fù)責(zé)BI項(xiàng)目的需求調(diào)研與分析工作;
2、負(fù)責(zé)BI項(xiàng)目的方案設(shè)計(jì)、實(shí)施或項(xiàng)目管理工作;
3、參與公司BI產(chǎn)品和項(xiàng)目的實(shí)施開(kāi)發(fā)工作。
崗位要求
1、良好的數(shù)據(jù)庫(kù)基礎(chǔ),精通SQL,深入掌握Oracle或其他數(shù)據(jù)庫(kù),能夠進(jìn)行數(shù)據(jù)庫(kù)調(diào)優(yōu);
3、熟悉ORACLE、MYSQL、SQLSERVER等主流數(shù)據(jù)庫(kù)的安裝及配置、熟悉SQL語(yǔ)句編寫(xiě)及ETL、BI實(shí)施工作;
3、熟悉LINUX操作系統(tǒng)安裝及常用命令;
4、熟悉BI基礎(chǔ)理論知識(shí),使用過(guò)BI相關(guān)產(chǎn)品;
5、參與BI相關(guān)項(xiàng)目的實(shí)施工作;
6、熟悉TOMCAT、JDK等安裝及參數(shù)配置;
7、具備較強(qiáng)的語(yǔ)言表達(dá)能力,能與客戶(hù)順暢溝通或產(chǎn)品介紹;
8、具備較強(qiáng)的學(xué)習(xí)與動(dòng)手能力,能夠適應(yīng)全國(guó)范圍內(nèi)出差;
9、熟悉hadoop大數(shù)據(jù)及自動(dòng)化運(yùn)維工具經(jīng)驗(yàn)者的待遇從優(yōu)。
ETL工程師
崗位要求:
具備一般的JAVA應(yīng)用開(kāi)發(fā)能力;
熟悉Oracle下的分區(qū),表空間, SQL性能調(diào)優(yōu)等操作;
熟悉常用的ETL工具,如:kettle, informatica等;
熟悉常用的報(bào)表工具,如:Cognos等。
崗位職責(zé):
負(fù)責(zé)行業(yè)生產(chǎn)交易系統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā),存儲(chǔ)過(guò)程編寫(xiě),數(shù)據(jù)模型研究,大數(shù)據(jù)研究
六,數(shù)據(jù)分析工程師
崗位職責(zé):
1、進(jìn)行業(yè)務(wù)和企業(yè)經(jīng)營(yíng)行為分析,梳理業(yè)務(wù)規(guī)律和業(yè)務(wù)需求;
2、將業(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)需求,發(fā)現(xiàn)數(shù)據(jù)應(yīng)用場(chǎng)景,梳理指標(biāo)體系;
3、使用合適的數(shù)據(jù)分析工具進(jìn)行數(shù)據(jù)分析和模型設(shè)計(jì);
4、提出基于數(shù)據(jù)的結(jié)果和分析建議,根據(jù)分析結(jié)果進(jìn)行行業(yè)研究、評(píng)估和預(yù)測(cè);
5、編寫(xiě)數(shù)據(jù)分析報(bào)告;
6、完成領(lǐng)導(dǎo)交辦的其他工作。
崗位要求
1、本科以上學(xué)歷,計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)專(zhuān)業(yè);
2、深刻理解大數(shù)據(jù)分析原理及相關(guān)應(yīng)用;
3、熟練掌握主流數(shù)據(jù)庫(kù)技術(shù);
4、精通數(shù)據(jù)分析、挖掘工具與方法,如SAS、R、Python、EXCEL等;
5、敏銳的數(shù)據(jù)觀(guān)察和分析能力,及時(shí)發(fā)現(xiàn)和分析其中隱含的變化和問(wèn)題并給出建議;
6、良好的溝通能力和團(tuán)隊(duì)精神,較強(qiáng)的學(xué)習(xí)能力,能承擔(dān)一定的工作壓力;
互聯(lián)網(wǎng)是一個(gè)快速發(fā)展的行業(yè),如果你剛上大學(xué),可能四年出來(lái)就會(huì)有變化!所以還是注意相關(guān)咨詢(xún)!希望能夠幫到你,歡迎關(guān)注,討論
1、大數(shù)據(jù)開(kāi)發(fā)工程師
開(kāi)發(fā),建設(shè),測(cè)試和維護(hù)架構(gòu),負(fù)責(zé)公司大數(shù)據(jù)平臺(tái)的開(kāi)發(fā)和維護(hù),負(fù)責(zé)大數(shù)據(jù)平臺(tái)持續(xù)集成相關(guān)工具平臺(tái)的架構(gòu)設(shè)計(jì)與產(chǎn)品開(kāi)發(fā)等
2、數(shù)據(jù)分析師
收集,處理和執(zhí)行統(tǒng)計(jì)數(shù)據(jù)分析;運(yùn)用工具,提取、分析、呈現(xiàn)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的商業(yè)意義,需要業(yè)務(wù)理解和工具應(yīng)用能力
3、數(shù)據(jù)挖掘工程師
數(shù)據(jù)建模、機(jī)器學(xué)習(xí)和算法實(shí)現(xiàn);商業(yè)智能,用戶(hù)體驗(yàn)分析,預(yù)測(cè)流失用戶(hù)等;需要過(guò)硬的數(shù)學(xué)和統(tǒng)計(jì)學(xué)功底以外,對(duì)算法的代碼實(shí)現(xiàn)也有很高的要求
4、數(shù)據(jù)架構(gòu)師
需求分析,平臺(tái)選擇,技術(shù)架構(gòu)設(shè)計(jì),應(yīng)用設(shè)計(jì)和開(kāi)發(fā),測(cè)試和部署;高級(jí)算法設(shè)計(jì)與優(yōu)化;數(shù)據(jù)相關(guān)系統(tǒng)設(shè)計(jì)與優(yōu)化,需要平臺(tái)級(jí)開(kāi)發(fā)和架構(gòu)設(shè)計(jì)能力
5、數(shù)據(jù)科學(xué)家
數(shù)據(jù)挖掘架構(gòu)、模型標(biāo)準(zhǔn)、數(shù)據(jù)報(bào)告、數(shù)據(jù)分析方法;利用算法和模型提高數(shù)據(jù)處理效率、挖掘數(shù)據(jù)價(jià)值、實(shí)現(xiàn)從數(shù)據(jù)到知識(shí)的轉(zhuǎn)換。等等。
加米谷大數(shù)據(jù)培訓(xùn),6月大數(shù)據(jù)開(kāi)發(fā)0基礎(chǔ)班、提高班,預(yù)報(bào)名中
相關(guān):大數(shù)據(jù)培訓(xùn)相關(guān)的職業(yè)崗位及主要工作內(nèi)容
https://www.toutiao.com/i6642200037784814094/
第一次工業(yè)革命是機(jī)械化,第二次電氣化,第三次信息化,第四次智能化。這次的工業(yè)革命從規(guī)模,從對(duì)每個(gè)人的生活、對(duì)整個(gè)社會(huì)的影響的廣泛性和深度,都要遠(yuǎn)遠(yuǎn)大于前幾次。在技術(shù)上來(lái)講,核心技術(shù)是通過(guò)數(shù)據(jù)來(lái)觀(guān)察世界,通過(guò)數(shù)據(jù)來(lái)獲取知識(shí)。
站在浪尖上面臨150萬(wàn)的人才緊缺的大數(shù)據(jù)。
大數(shù)據(jù)主要分成三大類(lèi):大數(shù)據(jù)系統(tǒng)研發(fā)類(lèi)、大數(shù)據(jù)應(yīng)用開(kāi)發(fā)類(lèi)、大數(shù)據(jù)分析類(lèi),崗位包括大數(shù)據(jù)系統(tǒng)架構(gòu)、大數(shù)據(jù)開(kāi)發(fā)、大數(shù)據(jù)系統(tǒng)分析、數(shù)據(jù)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)可視化、數(shù)據(jù)庫(kù)管理、數(shù)據(jù)遷移等。
據(jù)有關(guān)媒體報(bào)道,目前行業(yè)最稀缺的人才:
1、java大數(shù)據(jù)開(kāi)發(fā)
2、大數(shù)據(jù)精準(zhǔn)營(yíng)銷(xiāo)
3、大數(shù)據(jù)分析師(金融企業(yè)急需和緊缺的,尤為突出)
4、數(shù)據(jù)架構(gòu)師
當(dāng)下最熱門(mén)的崗位兩大類(lèi):一類(lèi)是應(yīng)用類(lèi),另一類(lèi)是系統(tǒng)類(lèi)。
應(yīng)用類(lèi)
應(yīng)用類(lèi),偏向于數(shù)據(jù)分析和數(shù)據(jù)應(yīng)用,經(jīng)常說(shuō)到的數(shù)據(jù)分析、數(shù)據(jù)挖掘,就是典型的應(yīng)用技術(shù)。這一類(lèi)職位,要求采用適當(dāng)?shù)姆治龊屯诰蚍椒▽?duì)數(shù)據(jù)進(jìn)行分析,提取數(shù)據(jù)中隱含的業(yè)務(wù)信息,來(lái)支撐企業(yè)決策。
最典型的職位就是:大數(shù)據(jù)分析師。
主要崗位有:
1、大數(shù)據(jù)分析師:主要是指,基于業(yè)務(wù)問(wèn)題,能夠選擇最合適的數(shù)據(jù)分析和數(shù)據(jù)挖掘方法,提取數(shù)據(jù)中的業(yè)務(wù)信息,從而支撐業(yè)務(wù)決策。要求熟悉數(shù)據(jù)分析/挖掘過(guò)程,掌握數(shù)據(jù)分析/挖掘方法,理解數(shù)據(jù)分析模型,熟練操作數(shù)據(jù)分析工具(比如Excel、SPSS、SAS等)。一般對(duì)于大數(shù)據(jù)分析師,其能力要求比較全面,不管是業(yè)務(wù)邏輯、還是分析方法、模型、可視化,都要求全面掌握。
2、業(yè)務(wù)數(shù)據(jù)分析師:側(cè)重于商業(yè)理解,要求能夠?qū)I(yè)務(wù)問(wèn)題和商業(yè)問(wèn)題,轉(zhuǎn)化為大數(shù)據(jù)的問(wèn)題,并將分析結(jié)果從業(yè)務(wù)層面進(jìn)行解讀,從而形成業(yè)務(wù)建議和業(yè)務(wù)策略。要求熟悉業(yè)務(wù)邏輯和業(yè)務(wù)模型,掌握數(shù)據(jù)分析思路,能將數(shù)據(jù)可視化,對(duì)數(shù)據(jù)解讀等。當(dāng)然,類(lèi)似的職位還有大數(shù)據(jù)觀(guān)察員、大數(shù)據(jù)研究員等等,這些都側(cè)重于商業(yè)理解。
3、大數(shù)據(jù)建模/算法師:側(cè)重于數(shù)據(jù)建模,能夠圍繞業(yè)務(wù)問(wèn)題,構(gòu)建合適的數(shù)據(jù)分析框架和分析模型,將業(yè)務(wù)問(wèn)題進(jìn)行分解,從而達(dá)到定性或定量來(lái)描述業(yè)務(wù)的目的。要求熟悉數(shù)據(jù)建模、模型評(píng)估、模型優(yōu)化、模型應(yīng)用等等。
4、大數(shù)據(jù)算法師:側(cè)重于數(shù)據(jù)模型的實(shí)現(xiàn)算法研究、設(shè)計(jì)與實(shí)現(xiàn),為達(dá)到分析目的,對(duì)實(shí)現(xiàn)算法進(jìn)行分析、選擇與優(yōu)化,確保實(shí)現(xiàn)性能及效果。一般情況下,算法師往往和建模師在一起工作。
系統(tǒng)類(lèi)
系統(tǒng)類(lèi),偏向于系統(tǒng)研發(fā),比如Hadoop系統(tǒng)、云計(jì)算,就屬于系統(tǒng)類(lèi)技術(shù)。這一類(lèi)職位,要求熟悉Hadoop大數(shù)據(jù)平臺(tái)的核心框架和組件,能夠基于大數(shù)據(jù)平臺(tái)來(lái)寫(xiě)代碼開(kāi)發(fā)應(yīng)用,支撐業(yè)務(wù)應(yīng)用。
最典型的職位就是:大數(shù)據(jù)工程師。
1、大數(shù)據(jù)開(kāi)發(fā)工程師:負(fù)責(zé)大數(shù)據(jù)系統(tǒng)的開(kāi)發(fā)工作,能夠運(yùn)用編程語(yǔ)言進(jìn)行應(yīng)用程序的開(kāi)發(fā)、測(cè)試和維護(hù),實(shí)現(xiàn)產(chǎn)品功能。要求掌握編程語(yǔ)言,如JAVA、R、Python等等。
2、大數(shù)據(jù)架構(gòu)師:負(fù)責(zé)大數(shù)據(jù)系統(tǒng)的平臺(tái)架構(gòu)設(shè)計(jì)、平臺(tái)構(gòu)建。要求熟悉Hadoop/Storm/Spark等平臺(tái),熟悉整個(gè)生態(tài)系統(tǒng)的組件,有平臺(tái)級(jí)開(kāi)發(fā)和架構(gòu)設(shè)計(jì)能力等等。
3、大數(shù)據(jù)運(yùn)維工程師:側(cè)重于大數(shù)據(jù)平臺(tái)運(yùn)維管理,包括系統(tǒng)運(yùn)維規(guī)劃、系統(tǒng)監(jiān)控、系統(tǒng)優(yōu)化等等,保障大數(shù)據(jù)平臺(tái)服務(wù)的穩(wěn)定性和可用性。掌握平臺(tái)各組件的安裝、配置與調(diào)試,有良好的系統(tǒng)性能優(yōu)化及故障排除能力。
4、大數(shù)據(jù)庫(kù)管理員:側(cè)重于數(shù)據(jù)庫(kù)/數(shù)據(jù)倒倉(cāng)庫(kù)的設(shè)計(jì)、開(kāi)發(fā)、管理和優(yōu)化,監(jiān)控?cái)?shù)據(jù)庫(kù)的性能、故障檢測(cè)和排除,包括數(shù)據(jù)采集,數(shù)據(jù)庫(kù)架構(gòu)設(shè)計(jì),空間和容量規(guī)劃,性能優(yōu)化,數(shù)據(jù)安全和隱私,數(shù)據(jù)容錯(cuò),等等。
當(dāng)然,在不同的企業(yè)中,職位的名稱(chēng)和叫法有所不同,或者會(huì)衍生出新的職位,但基本的崗位職責(zé)是類(lèi)似的。
1、大數(shù)據(jù)系統(tǒng)架構(gòu)師
大數(shù)據(jù)平臺(tái)搭建、系統(tǒng)設(shè)計(jì)、基礎(chǔ)設(shè)施。
技能:計(jì)算機(jī)體系結(jié)構(gòu)、網(wǎng)絡(luò)架構(gòu)、編程范式、文件系統(tǒng)、分布并行處理等。
年薪百萬(wàn)百度大數(shù)據(jù)架構(gòu)師需要掌握什么技術(shù)?
大數(shù)據(jù)極為龐大。如今每天為我們創(chuàng)造出約2.3萬(wàn)億GB數(shù)據(jù),這意味著數(shù)據(jù)世界每?jī)赡甓紝⒃鲩L(zhǎng)一倍。那么,展望即將到來(lái)的2018年,大數(shù)據(jù)領(lǐng)域會(huì)出現(xiàn)哪些變化?這些變化又會(huì)給我們?cè)斐稍鯓拥挠绊懀?/p>
(1)、我們終將利用暗數(shù)據(jù);
(2)、 結(jié)構(gòu)化與非結(jié)構(gòu)化邊界的消失;
(3)、CDO快速崛起;
(4)、量子計(jì)算進(jìn)入公眾視野。
那么,大數(shù)據(jù)架構(gòu)師需要掌握什么技術(shù)?
(1)、統(tǒng)計(jì)分析
大數(shù)定律、抽樣推測(cè)規(guī)律、 秩和檢測(cè) 、回歸分析、方差分析等
(2)、可視化輔助工具
Excel 、PPT、Xmind 、Visio
(3)、大數(shù)據(jù)處理框架
Hadoop 、 Kaffka、Storm 、ELK、Spark
(4)、數(shù)據(jù)庫(kù)
SQlite 、MySQL 、MongoDB 、Redis 、Cassandra 、HBase
(5)、數(shù)據(jù)倉(cāng)庫(kù)/商業(yè)智能
SSIS數(shù)據(jù)倉(cāng)庫(kù)、SSAS MDX多維數(shù)據(jù)表Ssrs、DW2.0
(6)、數(shù)據(jù)挖掘工具
Matlab、SAS、SPSS、R、Python
(7)、人工智能/挖掘算法
機(jī)器學(xué)習(xí)、數(shù)據(jù)結(jié)構(gòu)一致性、常用算法
(8)、編程語(yǔ)言
Python、R、Ruby、Java
2、大數(shù)據(jù)系統(tǒng)分析師
面向?qū)嶋H行業(yè)領(lǐng)域,利用大數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)安全生命周期管理、分析和應(yīng)用。
技能:人工智能、機(jī)器學(xué)習(xí)、數(shù)理統(tǒng)計(jì)、矩陣計(jì)算、優(yōu)化方法。
3、大數(shù)據(jù)開(kāi)發(fā)工程師
圍繞大數(shù)據(jù)系平臺(tái)系統(tǒng)級(jí)的研發(fā)人員, 熟練Hadoop、Spark、Storm等主流大數(shù)據(jù)平臺(tái)的核心框架。深入掌握如何編寫(xiě)MapReduce的作業(yè)及作業(yè)流的管理完成對(duì)數(shù)據(jù)的計(jì)算, 熟練掌握Hadoop整個(gè)生態(tài)系統(tǒng)的組件如: Yarn,HBase、Hive、Pig等重要組件,能夠?qū)崿F(xiàn)對(duì)平臺(tái)監(jiān)控、輔助運(yùn)維系統(tǒng)的開(kāi)發(fā)。
通過(guò)學(xué)習(xí)一系列面向開(kāi)發(fā)者的Hadoop、Spark等大數(shù)據(jù)平臺(tái)開(kāi)發(fā)技術(shù),掌握設(shè)計(jì)開(kāi)發(fā)大數(shù)據(jù)系統(tǒng)或平臺(tái)的工具和技能,能夠從事分布式計(jì)算框架如Hadoop、Spark群集環(huán)境的部署、開(kāi)發(fā)和管理工作,如性能改進(jìn)、功能擴(kuò)展、故障分析等。
4、數(shù)據(jù)分析師
不同行業(yè)中,專(zhuān)門(mén)從事行業(yè)數(shù)據(jù)搜集、整理、分析,并依據(jù)數(shù)據(jù)做出行業(yè)研究、評(píng)估和預(yù)測(cè)的專(zhuān)業(yè)人員。在工作中通過(guò)運(yùn)用工具,提取、分析、呈現(xiàn)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的商業(yè)意義。
作為一名數(shù)據(jù)分析師,至少需要熟練SPSS、STATISTIC、Eviews、SAS、大數(shù)據(jù)魔鏡等數(shù)據(jù)分析軟件中的一門(mén),至少能用Acess等進(jìn)行數(shù)據(jù)庫(kù)開(kāi)發(fā),至少掌握一門(mén)數(shù)學(xué)軟件如matalab、mathmatics進(jìn)行新模型的構(gòu)建,至少掌握一門(mén)編程語(yǔ)言。總之,一個(gè)優(yōu)秀的數(shù)據(jù)分析師,應(yīng)該業(yè)務(wù)、管理、分析、工具、設(shè)計(jì)都不落下。
5、數(shù)據(jù)挖掘工程師
做數(shù)據(jù)挖掘要從海量數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,這就需要一定的數(shù)學(xué)知識(shí),最基本的比如線(xiàn)性代數(shù)、高等代數(shù)、凸優(yōu)化、概率論等。經(jīng)常會(huì)用到的語(yǔ)言包括Python、Java、C或者C++,我自己用Python或者Java比較多。有時(shí)用MapReduce寫(xiě)程序,再用Hadoop或者Hyp來(lái)處理數(shù)據(jù),如果用Python的話(huà)會(huì)和Spark相結(jié)合。
6、大數(shù)據(jù)實(shí)施工程師:能熟練架設(shè)數(shù)據(jù)庫(kù).大數(shù)據(jù)分析生態(tài)系統(tǒng),通過(guò)Hive編寫(xiě)常見(jiàn)的 MapReduce程序。
7、用戶(hù)交互技術(shù)工程師
大數(shù)據(jù)所提供的用戶(hù)交互方式主要有五種類(lèi)型,分別是統(tǒng)計(jì)分析和數(shù)據(jù)挖掘、任意查詢(xún)和分析、立方體分析、企業(yè)報(bào)表、報(bào)表分發(fā)和預(yù)警,它們?cè)诮换コ潭群陀脩?hù)群類(lèi)型及規(guī)模上各有差異。
8、大數(shù)據(jù)可視化工程師
隨著大數(shù)據(jù)在人們工作及日常生活中的應(yīng)用,大數(shù)據(jù)可視化也改變著人類(lèi)的對(duì)信息的閱讀和理解方式。從百度遷徙到谷歌流感趨勢(shì),再到ucloud云推出縣域經(jīng)濟(jì)可視化產(chǎn)品,大數(shù)據(jù)技術(shù)和大數(shù)據(jù)可視化都是幕后的英雄。
9、大數(shù)據(jù)采集與管理師
大數(shù)據(jù)浪潮,洶涌來(lái)襲,與互聯(lián)網(wǎng)的發(fā)明一樣,這絕不僅僅是信息技術(shù)領(lǐng)域的革命,更是在全球范圍加速企業(yè)創(chuàng)新、引領(lǐng)社會(huì)變革的利器?,F(xiàn)代關(guān)系學(xué)之父德魯克有言,預(yù)測(cè)未來(lái)最好的方法,就是去創(chuàng)造未來(lái)。而“大數(shù)據(jù)戰(zhàn)略”,則是當(dāng)下領(lǐng)航全球的先機(jī)。“大數(shù)據(jù)”(BigData)指一般的軟件工具難以捕捉、管理和分析的大容量數(shù)據(jù)?!按髷?shù)據(jù)”之“大”,并不僅僅在于“容量之大”,更大的意義在于:通過(guò)對(duì)海量數(shù)據(jù)的交換、整合和分析,發(fā)現(xiàn)新的知識(shí),創(chuàng)造新的價(jià)值,帶來(lái)“大知識(shí)”、“大科技”、“大利潤(rùn)”和“大發(fā)展”?!按髷?shù)據(jù)”能幫助企業(yè)找到一個(gè)個(gè)難題的答案,給企業(yè)帶來(lái)前所未有的商業(yè)價(jià)值與機(jī)會(huì)。大數(shù)據(jù)同時(shí)也給企業(yè)的IT系統(tǒng)提出了巨大的挑戰(zhàn)。通過(guò)不同行業(yè)的“大數(shù)據(jù)”應(yīng)用狀況,我們能夠看到企業(yè)如何使用大數(shù)據(jù)和云計(jì)算技術(shù),解決他們的難題,靈活、快速、高效地響應(yīng)瞬息萬(wàn)變的市場(chǎng)需求。
10、數(shù)據(jù)安全師
從事數(shù)據(jù)安全的系統(tǒng)管理與監(jiān)測(cè)工作,數(shù)據(jù)安全在大數(shù)據(jù)行業(yè)極為重要,因此數(shù)據(jù)安全師的地位遠(yuǎn)遠(yuǎn)高于線(xiàn)下生活中保安的地位。
11、數(shù)據(jù)營(yíng)銷(xiāo)師
大家一看不算很新,但是實(shí)際上這個(gè)職位與過(guò)去的營(yíng)銷(xiāo)崗位除了有相近的傳播、推廣、溝通說(shuō)服與信息匯集的功能以外,在今天的數(shù)據(jù)營(yíng)銷(xiāo)師會(huì)遇到的最大問(wèn)題是客戶(hù)提出了問(wèn)題,而這個(gè)問(wèn)題或者需求是原來(lái)的大數(shù)據(jù)產(chǎn)品或者技術(shù)不能完全解決的,因此營(yíng)銷(xiāo)過(guò)程帶有較強(qiáng)的探索性溝通與尋求合作研發(fā)的特性。
同時(shí),數(shù)據(jù)營(yíng)銷(xiāo)師往往需要一定的架構(gòu)能力,而且能夠理解數(shù)據(jù)架構(gòu)的邏輯,從而能夠創(chuàng)造性地推廣前沿性的數(shù)據(jù)產(chǎn)品與服務(wù)。
12、數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是指能采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具對(duì)復(fù)雜多量的數(shù)字、符號(hào)、文字、網(wǎng)址、音頻或視頻等信息進(jìn)行數(shù)字化重現(xiàn)與認(rèn)識(shí),并能尋找新的數(shù)據(jù)洞察的工程師或?qū)<?不同于統(tǒng)計(jì)學(xué)家或分析師)。一個(gè)優(yōu)秀的數(shù)據(jù)科學(xué)家需要具備的素質(zhì)有:懂?dāng)?shù)據(jù)采集、懂?dāng)?shù)學(xué)算法、懂?dāng)?shù)學(xué)軟件、懂?dāng)?shù)據(jù)分析、懂預(yù)測(cè)分析、懂市場(chǎng)應(yīng)用、懂決策分析等。
13、大數(shù)據(jù)分析架構(gòu)師
梳理業(yè)務(wù)數(shù)據(jù)的來(lái)源、定義、邏輯,根據(jù)多樣化的業(yè)務(wù)需求制定、優(yōu)化報(bào)表;l 理解并分析相關(guān)產(chǎn)品和制造流程現(xiàn)狀,根據(jù)業(yè)務(wù)需求分析挖掘數(shù)據(jù)規(guī)律、趨勢(shì)、關(guān)注點(diǎn),為產(chǎn)品制造業(yè)務(wù)提供決策支持;l 基于海量數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)和AI的方法,為個(gè)人電腦和手機(jī)產(chǎn)品制造業(yè)務(wù)提供個(gè)性化服務(wù),提升制造效率和質(zhì)量;l 負(fù)責(zé)相應(yīng)安全AI模型設(shè)計(jì),研發(fā)適合在業(yè)務(wù)中使用的模型、算法和工具,以支持?jǐn)?shù)據(jù)分析需求和模擬預(yù)測(cè)業(yè)務(wù)場(chǎng)景。l 結(jié)合業(yè)務(wù)層面數(shù)字化項(xiàng)目,開(kāi)發(fā)系統(tǒng)數(shù)據(jù)接口及建立分析預(yù)判機(jī)制,實(shí)現(xiàn)數(shù)據(jù)定制可視化、預(yù)警、模擬、決策輔助。
14、大數(shù)據(jù)解決方案架構(gòu)師
負(fù)責(zé)大數(shù)據(jù)業(yè)務(wù)的售前技術(shù)支持,能獨(dú)立進(jìn)行售前工作,包括并不限于客戶(hù)需求調(diào)研、解決方案編制和技術(shù)交流;
對(duì)競(jìng)爭(zhēng)產(chǎn)品和方案進(jìn)行競(jìng)爭(zhēng)分析和對(duì)比,對(duì)市場(chǎng)競(jìng)爭(zhēng)形勢(shì)進(jìn)行總結(jié);
配合銷(xiāo)售團(tuán)隊(duì)培訓(xùn)代理商合作伙伴,并提供相關(guān)培訓(xùn)和技術(shù)支持;
分析、撰寫(xiě)和總結(jié)公司產(chǎn)品的行業(yè)應(yīng)用方案。
不同的平臺(tái)對(duì)應(yīng)不同的職位
1、數(shù)據(jù)平臺(tái)
Data Platform,構(gòu)建、維護(hù)穩(wěn)定、安全的大數(shù)據(jù)平臺(tái),按需設(shè)計(jì)大數(shù)據(jù)架構(gòu),調(diào)研選型大數(shù)據(jù)技術(shù)產(chǎn)品、方案,實(shí)施部署上線(xiàn)。對(duì)于大數(shù)據(jù)領(lǐng)域涉及到的大多數(shù)技術(shù)都要有所了解,并精通某一部分,具備分布式系統(tǒng)的知識(shí)背景;
對(duì)應(yīng)職位:大數(shù)據(jù)架構(gòu)師,數(shù)據(jù)平臺(tái)工程師
2、數(shù)據(jù)采集
Data Collecting,從Web/Sensor/RDBMS等渠道獲取數(shù)據(jù),為大數(shù)據(jù)平臺(tái)提供數(shù)據(jù)來(lái)源,如Apache Nutch是開(kāi)源的分布式數(shù)據(jù)采集組件,大家熟知的Python爬蟲(chóng)框架ScraPy等。
對(duì)應(yīng)職位:爬蟲(chóng)工程師,數(shù)據(jù)采集工程師
3、數(shù)據(jù)倉(cāng)庫(kù)
Data Warehouse,有點(diǎn)類(lèi)似于傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)工作內(nèi)容:設(shè)計(jì)數(shù)所倉(cāng)庫(kù)層級(jí)結(jié)構(gòu)、ETL、進(jìn)行數(shù)據(jù)建模,但基于的平臺(tái)不一樣,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)倉(cāng)庫(kù)大多基于大數(shù)據(jù)技術(shù)實(shí)現(xiàn),例如Hive就是基于Hadoop的數(shù)據(jù)倉(cāng)庫(kù)。
對(duì)應(yīng)職位:ETL工程師,數(shù)據(jù)倉(cāng)庫(kù)工程師
3、數(shù)據(jù)處理
Data Processing,完成某些特定需求中的處理或數(shù)據(jù)清洗,在小團(tuán)隊(duì)中是結(jié)合在數(shù)據(jù)倉(cāng)庫(kù)中一起做的,以前做ETL或許是利用工具直接配置處理一些過(guò)濾項(xiàng),寫(xiě)代碼部分會(huì)比較少,如今在大數(shù)據(jù)平臺(tái)上做數(shù)據(jù)處理可以利用更多的代碼方式做更多樣化的處理,所需技術(shù)有Hive、Hadoop、Spark等。隨便說(shuō)下,千萬(wàn)不要小看數(shù)據(jù)處理,后續(xù)的數(shù)據(jù)分析、數(shù)據(jù)挖掘等工作都是基于數(shù)據(jù)處理的質(zhì)量,可以說(shuō)數(shù)據(jù)處理在整個(gè)流程中有特別重要的位置。
對(duì)應(yīng)職位:Hadoop工程師,Spark工程師
5、數(shù)據(jù)分析
Data Analysis,基于統(tǒng)計(jì)分析方法做數(shù)據(jù)分析:例如回歸分析、方差分析等;大數(shù)據(jù)分析例如Ad-Hoc交互式分析,SQL on Hadoop的技術(shù)有:Hive、Impala、Presto、Spark SQL,支持OLAP的技術(shù)有:Kylin;
對(duì)應(yīng)職位:數(shù)據(jù)分析師
6、數(shù)據(jù)挖掘
Data Mining,是一個(gè)比較寬泛的概念,可以直接理解為從大量數(shù)據(jù)中發(fā)現(xiàn)有用的信息。大數(shù)據(jù)中的數(shù)據(jù)挖掘,主要是設(shè)計(jì)并在大數(shù)據(jù)平臺(tái)上實(shí)現(xiàn)數(shù)據(jù)挖掘算法:分類(lèi)算法、聚類(lèi)算法、關(guān)聯(lián)分析等。
對(duì)應(yīng)職位:數(shù)據(jù)挖掘工程師
7、機(jī)器學(xué)習(xí)
Machine Learning,與數(shù)據(jù)挖掘經(jīng)常一起討論,甚至被認(rèn)為是同一事物。機(jī)器學(xué)習(xí)是一個(gè)計(jì)算機(jī)與統(tǒng)計(jì)學(xué)交叉的學(xué)科,基本目標(biāo)是學(xué)習(xí)一個(gè)x->y的函數(shù)(映射),來(lái)做分類(lèi)或者回歸的工作。之所以經(jīng)常和數(shù)據(jù)挖掘合在一起講是因?yàn)楝F(xiàn)在好多數(shù)據(jù)挖掘的工作是通過(guò)機(jī)器學(xué)習(xí)提供的算法工具實(shí)現(xiàn)的,例如個(gè)性化推薦,是通過(guò)機(jī)器學(xué)習(xí)的一些算法分析平臺(tái)上的各種購(gòu)買(mǎi),瀏覽和收藏日志,得到一個(gè)推薦模型,來(lái)預(yù)測(cè)你喜歡的商品。
對(duì)應(yīng)職位:算法工程師,研究員
8、深度學(xué)習(xí)
Deep Learning,是機(jī)器學(xué)習(xí)里面的一個(gè)topic(非?;鸬腡opic),從深度學(xué)習(xí)的內(nèi)容來(lái)看其本身是神經(jīng)網(wǎng)絡(luò)算法的衍生,在圖像、語(yǔ)音、自然語(yǔ)言等分類(lèi)和識(shí)別上取得了非常好的效果,大部分的工作是在調(diào)參。不知道大家有否發(fā)現(xiàn)現(xiàn)在的Google翻譯比以前的要準(zhǔn)確很多,因?yàn)镚oogle在去年底將其Google翻譯的核心從原來(lái)基于統(tǒng)計(jì)的方法換成了基于神經(jīng)網(wǎng)絡(luò)的方法;
對(duì)應(yīng)職位:算法工程師,研究員
9、數(shù)據(jù)可視化
Data Visualization,將分析、挖掘后的高價(jià)值數(shù)據(jù)用比較優(yōu)美、靈活的方式展現(xiàn)在老板、客戶(hù)、用戶(hù)面前,更多的是一些前端的東西,也可能要求有一定的美學(xué)知識(shí)。結(jié)合使用者的喜好,以最恰當(dāng)?shù)姆绞匠尸F(xiàn)數(shù)據(jù)價(jià)值;
對(duì)應(yīng)職位:數(shù)據(jù)工程師,BI工程師
10、數(shù)據(jù)應(yīng)用
Data Application,從以上的每個(gè)部分可以衍生出的應(yīng)用,例如廣告精準(zhǔn)投放、個(gè)性化推薦、用戶(hù)畫(huà)像等。
對(duì)應(yīng)職位:數(shù)據(jù)工程師
從數(shù)據(jù)科學(xué)家到數(shù)據(jù)架構(gòu)師,大數(shù)據(jù)職場(chǎng)中的核心新崗位
任何新行業(yè)興起的時(shí)候必然伴隨著行業(yè)的深化與細(xì)化,伴隨著新職業(yè)崗位的生長(zhǎng),大數(shù)據(jù)行業(yè)也不例外。大家都說(shuō)大數(shù)據(jù),很多人甚至省略掉了數(shù)據(jù),其實(shí)我們今天很多朋友做的最多算數(shù)據(jù)行業(yè),還遠(yuǎn)不是大數(shù)據(jù)行業(yè),因?yàn)檫€沒(méi)有做數(shù)據(jù)源的整合、不同結(jié)構(gòu)數(shù)據(jù)源的清理與對(duì)接、數(shù)據(jù)的貫通分析與實(shí)時(shí)共享;即使已經(jīng)是大數(shù)據(jù)行業(yè),那么屬于大數(shù)據(jù)硬件行業(yè)(如制造、銷(xiāo)售、管理大數(shù)據(jù)服務(wù)器)還是軟件行業(yè)(開(kāi)發(fā)大數(shù)據(jù)管理系統(tǒng)、數(shù)據(jù)內(nèi)容的軟件化整合與開(kāi)發(fā)應(yīng)用)也是不一樣的;就算同是大數(shù)據(jù)軟件行業(yè),那么是屬于數(shù)據(jù)庫(kù)管理與運(yùn)行維護(hù),還是屬于數(shù)據(jù)應(yīng)用就是差異行業(yè);同樣是數(shù)據(jù)應(yīng)用行業(yè),數(shù)據(jù)資源的轉(zhuǎn)移應(yīng)用與精準(zhǔn)匹配應(yīng)用,與基于深度分析的決策應(yīng)用,也是深度細(xì)分的差異行業(yè);在大數(shù)據(jù)決策應(yīng)用行業(yè)中,基于大數(shù)據(jù)分析的人工應(yīng)用模式與基于大數(shù)據(jù)智能的自動(dòng)化應(yīng)用模式,可以看成不同的技術(shù)含量的精度細(xì)分行業(yè)。零點(diǎn)有數(shù)就是屬于最后這個(gè)類(lèi)別的大數(shù)據(jù)智能應(yīng)用服務(wù)機(jī)構(gòu)。
而在這樣的行業(yè)中,我們會(huì)看到不少新興的職業(yè)崗位興起,其中不少人已經(jīng)對(duì)數(shù)據(jù)科學(xué)家這一說(shuō)法有認(rèn)識(shí),他們往往是數(shù)據(jù)模型或者說(shuō)算法的設(shè)計(jì)者,也是復(fù)雜算法的修正優(yōu)化與管理者;數(shù)據(jù)營(yíng)銷(xiāo)師,大家一看不算很新,但是實(shí)際上這個(gè)職位與過(guò)去的營(yíng)銷(xiāo)崗位除了有相近的傳播、推廣、溝通說(shuō)服與信息匯集的功能以外,在今天的數(shù)據(jù)營(yíng)銷(xiāo)師會(huì)遇到的最大問(wèn)題是客戶(hù)提出了問(wèn)題,而這個(gè)問(wèn)題或者需求是原來(lái)的大數(shù)據(jù)產(chǎn)品或者技術(shù)不能完全解決的,因此營(yíng)銷(xiāo)過(guò)程帶有較強(qiáng)的探索性溝通與尋求合作研發(fā)的特性;數(shù)據(jù)工程師是與數(shù)據(jù)科學(xué)家合作實(shí)施具體的數(shù)據(jù)管理與開(kāi)發(fā)工作的技術(shù)白領(lǐng),今天絕大部分?jǐn)?shù)據(jù)工程師是邊干邊學(xué),一般他們往往是學(xué)習(xí)計(jì)算機(jī)或者數(shù)據(jù)科學(xué)出身的初級(jí)專(zhuān)業(yè)人員;數(shù)據(jù)挖掘師,在海量數(shù)據(jù)中從事數(shù)據(jù)分類(lèi)、清洗、標(biāo)簽與檢核工作;數(shù)據(jù)安全師,從事數(shù)據(jù)安全的系統(tǒng)管理與監(jiān)測(cè)工作,數(shù)據(jù)安全在大數(shù)據(jù)行業(yè)極為重要,因此數(shù)據(jù)安全師的地位遠(yuǎn)遠(yuǎn)高于線(xiàn)下生活中保安的地位。在所有這些崗位以外,有一個(gè)崗位往往是很少為人提及,但實(shí)際上至為重要的,那就是數(shù)據(jù)架構(gòu)師。數(shù)據(jù)架構(gòu)師需要判斷在某一領(lǐng)域、行業(yè)的基本趨勢(shì)與特點(diǎn),熟悉開(kāi)放式關(guān)鍵中的最佳標(biāo)桿與前沿和典型做法,對(duì)于半封閉與體系內(nèi)需要具備敏銳與犀利的洞察能力,由此而能來(lái)定義數(shù)據(jù)應(yīng)用任務(wù)或者項(xiàng)目的目標(biāo)與疆界、核心工作內(nèi)容與指標(biāo)、路線(xiàn)圖與時(shí)間表,其中涉及到在多大意義上要體現(xiàn)本任務(wù)與宏觀(guān)需要的契合、與周?chē)赡苡械钠渌P(guān)聯(lián)系統(tǒng)的對(duì)接口、要素保障與條件保障、危機(jī)測(cè)定與安全管理機(jī)制。架構(gòu)師需要將總體目標(biāo)、要素關(guān)系、推進(jìn)步驟能夠在合理構(gòu)設(shè)中藍(lán)圖化與實(shí)現(xiàn)優(yōu)化整合。與設(shè)計(jì)師不同的是,架構(gòu)師不只是藍(lán)圖設(shè)計(jì)者,也是藍(lán)圖可行性的負(fù)責(zé)人與推進(jìn)者、協(xié)調(diào)者。
盡管我們?cè)谇懊婷枋龃髷?shù)據(jù)行業(yè)的時(shí)候有一種介紹序列,其實(shí)在實(shí)際的大數(shù)據(jù)應(yīng)用中,我們可以反過(guò)來(lái)看我們的大數(shù)據(jù)需要,然后設(shè)定我們?cè)诖髷?shù)據(jù)應(yīng)用、軟硬件建設(shè)中的需要,這也是數(shù)據(jù)架構(gòu)師所可能設(shè)計(jì)的工作內(nèi)容。而我們所說(shuō)的數(shù)據(jù)科學(xué)家,在一定程度上是鏈接與細(xì)化數(shù)據(jù)架構(gòu)師工作的,而數(shù)據(jù)營(yíng)銷(xiāo)師往往需要一定的架構(gòu)能力,而且能夠理解數(shù)據(jù)架構(gòu)的邏輯,從而能夠創(chuàng)造性地推廣前沿性的數(shù)據(jù)產(chǎn)品與服務(wù)。如果我能夠大致提出一個(gè)典型大數(shù)據(jù)智能服務(wù)機(jī)構(gòu)中這幾類(lèi)崗位的人員比例,那么它們大致是:數(shù)據(jù)架構(gòu)師:數(shù)據(jù)營(yíng)銷(xiāo)師:數(shù)據(jù)科學(xué)家:數(shù)據(jù)工程師:數(shù)據(jù)挖掘師:數(shù)據(jù)安全師=1:2:3:30:60:5。而從人才市場(chǎng)的供應(yīng)來(lái)說(shuō),實(shí)際上越是后面的崗位越是可以依靠專(zhuān)業(yè)機(jī)構(gòu)培訓(xùn)的,越是前面的人才往往是在一定專(zhuān)業(yè)基礎(chǔ)上在實(shí)際工作涌現(xiàn)的具有特殊技能的營(yíng)運(yùn)人才而需要數(shù)據(jù)機(jī)構(gòu)領(lǐng)導(dǎo)人去留心發(fā)現(xiàn)。
由于國(guó)內(nèi)高校2016年開(kāi)始開(kāi)設(shè)大數(shù)據(jù)本科專(zhuān)業(yè),目前還沒(méi)有畢業(yè)生流向市場(chǎng),造成人才嚴(yán)重短缺,所以大數(shù)據(jù)人才待遇較高。
初級(jí)崗位(3—5年):15000—25000月/元;
中級(jí)崗位(5—10年):25000—35000月/元;
高級(jí)崗位(10年以上):40—100萬(wàn)/年。
如大數(shù)據(jù)系統(tǒng)架構(gòu)師、大數(shù)據(jù)分析架構(gòu)師、數(shù)據(jù)科學(xué)家等。
總之,選擇大數(shù)據(jù)專(zhuān)業(yè),從事大數(shù)據(jù)工作,待遇高,前景好!
0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答0
回答4
回答