摘要:我強(qiáng)烈推薦這本書給初學(xué)者,因?yàn)楸緯鴤?cè)重于統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)的基本概念,并提供詳細(xì)而直觀的解釋。關(guān)于完善簡歷,我推薦以下網(wǎng)站和文章怎樣的作品集能幫助我們找到第一數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)方面的工作簡歷是不夠的,你還需要作品集的支撐。
作者 | Admond Lee
翻譯 | Mika
本文為 CDA 數(shù)據(jù)分析師原創(chuàng)作品,轉(zhuǎn)載需授權(quán)
你想成為一名數(shù)據(jù)科學(xué)家?很棒,說明你是很有上進(jìn)心的人,而且對數(shù)據(jù)科學(xué)充滿熱情,并希望通過解決復(fù)雜的問題為公司帶來價值。但是你在數(shù)據(jù)科學(xué)方面毫無經(jīng)驗(yàn),也不知道如何開始。我很懂你,因?yàn)樵?jīng)我也是如此。本文就是特別針對熱情且有抱負(fù)的數(shù)據(jù)科學(xué)家,解答進(jìn)入該領(lǐng)域最常見的問題和挑戰(zhàn)。
我希望通過分享我自己的經(jīng)驗(yàn),幫助你了解入科從事數(shù)據(jù)科學(xué)的職業(yè),并為你提供一些指南,讓你的學(xué)習(xí)之旅更加愉快。讓我們開始吧!
數(shù)據(jù)科學(xué)人才缺口
根據(jù)國際數(shù)據(jù)公司(IDC)預(yù)測,2020年全球大數(shù)據(jù)和業(yè)務(wù)分析收入將超過2100億美元。
根據(jù)LinkedIn 與2018年8月發(fā)布的美國勞動力報(bào)告, 2015年美國的數(shù)據(jù)科學(xué)人才過剩。三年后,隨著越來越多公司面臨數(shù)據(jù)科學(xué)技能人才的短缺,這一趨勢發(fā)生了巨大變化。越來越多的公司開始使用大數(shù)據(jù)得出分析見解和制定決策。
從經(jīng)濟(jì)角度講,這完全取決于供需關(guān)系。
好消息是:形勢以及發(fā)生了轉(zhuǎn)變。壞消息是:隨著數(shù)據(jù)科學(xué)領(lǐng)域的就業(yè)機(jī)會不斷增加,但很多有抱負(fù)的數(shù)據(jù)科學(xué)家由于技能不符合市場的需求,而難以找到心儀的工作。
在接下來的部分中,你將看到該如何提高數(shù)據(jù)科學(xué)技能,從而在大量求職者中脫穎而出,最終收獲夢想的工作。
終極指南
1.需要哪些技能以及如何掌握?
說實(shí)話,要掌握數(shù)據(jù)科學(xué)領(lǐng)域所有技能幾乎是不可能的,因?yàn)榉秶珡V了??傆幸恍┘夹g(shù)是數(shù)據(jù)科學(xué)家沒有掌握的,因?yàn)椴煌臉I(yè)務(wù)需要不同的技能。
但有一些核心技能是數(shù)據(jù)科學(xué)家所必須掌握的。
技術(shù)能力,數(shù)學(xué)和統(tǒng)計(jì)學(xué),編程和商業(yè)知識。盡管無論使用何種語言,編程能力都是必備的。作為數(shù)據(jù)科學(xué)家,我們應(yīng)該運(yùn)用商業(yè)溝通能力想企業(yè)高層說明模型結(jié)果,同時基于數(shù)學(xué)和統(tǒng)計(jì)學(xué)的支持。
數(shù)學(xué)和統(tǒng)計(jì)學(xué)
關(guān)于數(shù)學(xué)和統(tǒng)計(jì)學(xué),可以查看Randy Lao的相關(guān)文章,當(dāng)中的資源非常豐富。
https://medium.com/@randylaosat
當(dāng)我剛開始學(xué)習(xí)數(shù)據(jù)科學(xué)時,我讀了這本書 An Introduction to Statistical Learning?—?with Applications in R(統(tǒng)計(jì)學(xué)習(xí)導(dǎo)論 - 與R中的應(yīng)用)。我強(qiáng)烈推薦這本書給初學(xué)者,因?yàn)楸緯鴤?cè)重于統(tǒng)計(jì)建模和機(jī)器學(xué)習(xí)的基本概念,并提供詳細(xì)而直觀的解釋。如果你特別喜歡數(shù)學(xué),也許你更喜歡這本書:The Elements of Statistical Learning(統(tǒng)計(jì)學(xué)習(xí)中的元素)。
編程
關(guān)于學(xué)習(xí)編程,特別是對于沒有經(jīng)驗(yàn)的初學(xué)者,我建議專注于學(xué)習(xí)一種語言,我個人更喜歡Python,因?yàn)镻ython更容易學(xué)習(xí)。關(guān)于Python或R哪種語言更好一直都存在爭論,我個人認(rèn)為重點(diǎn)應(yīng)放在如何幫助企業(yè)解決問題,而不是使用哪種語言。
商業(yè)知識
最后,我要強(qiáng)調(diào)的是對商業(yè)知識的理解也是至關(guān)重要的。
軟技能
事實(shí)上,軟技能比硬技能更重要。在LinkedIn詢問了2000名商業(yè)領(lǐng)袖,我們發(fā)現(xiàn)2018年他們最希望員工具備的軟技能包括:領(lǐng)導(dǎo)力、溝通能力、合作能力和時間管理能力。我認(rèn)為這些軟技能在數(shù)據(jù)科學(xué)家的日常工作中起著至關(guān)重要的作用。
2.如何選擇合適的訓(xùn)練營和在線課程?
隨著人工智能和數(shù)據(jù)科學(xué)的興起,大量課程課程、訓(xùn)練營如雨后春筍般涌現(xiàn),都不希望錯失良機(jī)。
因此問題來了,該如何選擇適合你的學(xué)習(xí)資源呢?
我的選擇方法如下:
沒有一門課程能涵蓋你需要的所有資源。有些課程在某些方面是重疊的,因此不值得花錢購買不同但有重復(fù)性的課程。
首先要知道你需要學(xué)什么。不要因?yàn)榛ㄉ诤臀说臉?biāo)題就盲目選擇課程。通過查看求職網(wǎng)站上數(shù)據(jù)科學(xué)家的職位描述,你會發(fā)現(xiàn)一些公司需要的通用技能。然后通過了解自己缺乏的技能去搜索相應(yīng)課程。
比較不同平臺提供的優(yōu)質(zhì)課程。類比幾個課程,并且查看其他人的評論(非常重要?。?。另一方面,Coursera、Udemy、Lynda、Codecademy、DataCamp、Dataquest等平臺也提供許多免費(fèi)課程。
以下是我個人特別喜歡的一些課程:
1.Machine Learning ,主講人: Coursera的聯(lián)合創(chuàng)始人吳恩達(dá)
2.Python for Data Science and Machine Learning Bootcamp,主講人 :Jose Portilla
3.Deep Learning A-Z?: Hands-On Artificial Neural Networks,主講人: Kirill Eremenko,Hadelin de Ponteves
4.Python for Data Science Essential Training ,主講人:Lillian Pierson
5.The Ultimate Hands-On Hadoop?—?Tame your Big Data,主講人:Frank Kane
3.能否通過開源學(xué)習(xí)成為數(shù)據(jù)科學(xué)家?
我想說的是,通過開源學(xué)習(xí)足以讓你開始從事數(shù)據(jù)科學(xué),之后可以根據(jù)業(yè)務(wù)需求進(jìn)一步發(fā)展自己的職業(yè)生涯。
4.對于零基礎(chǔ)的初學(xué)者有什么推薦的書籍嗎?
沒有固定的學(xué)習(xí)途徑,條條大路通羅馬。閱讀相關(guān)書籍是掌握基礎(chǔ)知識的良好。
注意不要試圖去記憶具體的數(shù)學(xué)和算法細(xì)節(jié),因?yàn)楫?dāng)應(yīng)用于實(shí)際問題進(jìn)行編程時,你可能會忘記這些內(nèi)容。
你只需了解一定的基礎(chǔ)知識,并繼續(xù)學(xué)習(xí),要務(wù)實(shí)。不要試圖完全了解所有知識,因?yàn)橛袝r完美主義會給你的學(xué)習(xí)拖后腿。
關(guān)于Python、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的基礎(chǔ)知識,我推薦以下書籍:
Learning Python
Python for Data Analysis
An Introduction to Statistical Learning
Machine Learning for Absolute Beginners
Python Machine Learning
Python Data Science Handbook
Introduction to Machine Learning with Python
Deep Learning with Python
Deep Learning with Keras
5.如何在理解商業(yè)問題(制定解決方案)和提高技術(shù)技能(編程、數(shù)學(xué)知識等)之間取得平衡?
在理解商業(yè)問題和制定解決方案之前,我首先去提高自己的技術(shù)技能。
商業(yè)問題在于”是什么”和”為什么”。要解決商業(yè)問題,首先必須解決問題。而技術(shù)技能是注重于”怎么做”。我的建議主要基于個人經(jīng)驗(yàn)。
6.如何克服開啟數(shù)據(jù)科學(xué)家職業(yè)生涯的挑戰(zhàn)?
對于許多數(shù)據(jù)科學(xué)家來說,主要挑戰(zhàn)就是數(shù)據(jù)科學(xué)是信息的海洋。我們可能失去方向,因?yàn)橛刑嗟慕ㄗh和資源,大量的在線課程、研討會等等,你需要保持專注,知道你擁有什么,你需要什么。
在我的數(shù)據(jù)科學(xué)歷程中,我主要通過這些方法克服這些挑戰(zhàn):
有效地篩選學(xué)習(xí)資源
在剛開始時,我因?yàn)榇罅康馁Y源感到困惑。通過聽數(shù)據(jù)科學(xué)家的播客,閱讀如何開啟數(shù)據(jù)科學(xué)領(lǐng)域的文章,嘗試不同在線課程。最終我關(guān)注我在本文中分享的這些優(yōu)質(zhì)資源。
不要放棄
當(dāng)學(xué)習(xí)過程太過艱難時,我開始懷疑自己,我真的有能力做到嗎?我追求的道理是正確的嗎?最終對數(shù)據(jù)科學(xué)的熱情和耐心讓我重新開始,繼續(xù)不斷努力和前行。
獲得數(shù)據(jù)科學(xué)相關(guān)的工作
由于就業(yè)市場競爭激烈,找到心儀的數(shù)據(jù)科學(xué)工作對我來說并非易事。我提交了大量的簡歷都毫無結(jié)果。因此我開始改進(jìn)找工作的方法,參加聚會和研討會,在網(wǎng)上分享我的學(xué)習(xí)經(jīng)歷,在招聘會上于潛在雇主接觸等等。
7.如何有效地在簡歷中加入自己的工作經(jīng)驗(yàn),從而提高被錄用的幾率?
這是一種誤解,你并不能通過簡歷中的經(jīng)驗(yàn)就被聘用。事實(shí)上,簡歷是面試的敲門磚。
因此,學(xué)習(xí)如何寫簡歷對于獲得面試機(jī)會至關(guān)重要。研究表明,招聘人員在確定求職者是否適合該職位時,平均看簡歷的時間僅為6秒。
關(guān)于完善簡歷,我推薦以下網(wǎng)站和文章:
Vault
TopResume
Optimize Guide
A Resume Expert Gives Career Advice
https://www.facebook.com/busi...
How to Pass the 6-Second Resume Test
https://www.topresume.com/car...
How to tailor your Academic CV for Data Science roles
https://www.linkedin.com/puls...
What do Hiring Managers Look For in a Data Scientist’s CV?
https://www.linkedin.com/puls...
The 14 Things You Need On Your Resume To Land Your Dream Job
https://www.elitedaily.com/mo...
8.怎樣的作品集能幫助我們找到第一數(shù)據(jù)科學(xué)或機(jī)器學(xué)習(xí)方面的工作?
簡歷是不夠的,你還需要作品集的支撐。在看了簡歷之后,招聘人員希望更多地了解你的背景,這時就需要作品集了。
可以試著在社交媒體平臺分享自己的學(xué)習(xí)經(jīng)歷,寫文章和做播客都是不錯的選擇。
更多資源
學(xué)習(xí)平臺 :
Towards Data Science, Quora, DZone, KDnuggets, Analytics Vidhya, DataTau, fast.ai
推薦視頻:
Webinars——Data Science Office Hours, Data Science Connect, Humans of Data Science (HoDS)
推薦文章:
A Badass’s Guide to Breaking Into Data
http://www.data-mania.com/blo...
10 Must Have Data Science Skills
https://www.kdnuggets.com/201...
My Data Science & Machine Learning, Beginner’s Learning Path
https://www.linkedin.com/puls...
24 Ultimate Data Science Projects To Boost Your Knowledge and Skills
https://www.analyticsvidhya.c...
值得關(guān)注的數(shù)據(jù)科學(xué)家
LinkedIn上的數(shù)據(jù)科學(xué)社區(qū)非常棒,以下是我認(rèn)為值得關(guān)注的數(shù)據(jù)科學(xué)家和專業(yè)人士:
Randy Lao
Kyle McKiou
Favio Vázquez
Vin Vashishta
Eric Weber
Sarah Nooravi
Kate Strachnyi
Tarry Singh
Karthikeyan P.T.R.
Megan Silvey
Imaad Mohamed Khan
Andreas Kretz
Andriy Burkov
Carla Gentry
Nic Ryan
Beau Walker
結(jié)語
希望本文能夠解決你的問題。每當(dāng)你在數(shù)據(jù)科學(xué)旅程中遇到任何障礙,快要放棄時請記住,堅(jiān)持是關(guān)鍵。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19877.html
摘要:基于大量的數(shù)據(jù)統(tǒng)計(jì),網(wǎng)球是一種很好的預(yù)測類體育項(xiàng)目。數(shù)據(jù)科學(xué)家根據(jù)歷史數(shù)據(jù)和玩家信息來構(gòu)建預(yù)測模型,并將結(jié)果與博彩公司的評估進(jìn)行比較。目標(biāo)是找出機(jī)器學(xué)習(xí)模型與博彩公司評估之間的差距,從而有機(jī)會獲勝。這是一個很好的實(shí)際數(shù)據(jù)科學(xué)項(xiàng)目。 作者:chen_h微信號 & QQ:862251340微信公眾號:coderpai簡書地址:https://www.jianshu.com/p/56c......
摘要:本文與大家分享一些編程語言的入門書籍,其中不乏經(jīng)典。全書貫穿的主體是如何思考設(shè)計(jì)開發(fā)的方法,而具體的編程語言,只是提供一個具體場景方便介紹的媒介。入門入門容易理解而且讀起來幽默風(fēng)趣,對于編程初學(xué)者和語言新手而言是理想的書籍。 本文與大家分享一些Python編程語言的入門書籍,其中不乏經(jīng)典。我在這里分享的,大部分是這些書的英文版,如果有中文版的我也加上了。有關(guān)書籍的介紹,大部分截取自是官...
閱讀 2398·2021-09-22 16:01
閱讀 3163·2021-09-22 15:41
閱讀 1181·2021-08-30 09:48
閱讀 496·2019-08-30 15:52
閱讀 3335·2019-08-30 13:57
閱讀 1719·2019-08-30 13:55
閱讀 3670·2019-08-30 11:25
閱讀 767·2019-08-29 17:25