摘要:機(jī)器學(xué)習(xí)的過程機(jī)器學(xué)習(xí)的流程可以概括為幾大部分,分別是設(shè)置數(shù)據(jù)集劃分訓(xùn)練集和測試集構(gòu)建計(jì)算網(wǎng)絡(luò)訓(xùn)練模型測試模型以及其他一些環(huán)節(jié)。機(jī)器學(xué)習(xí)在某些時(shí)候,很接近于線性回歸,而這個(gè)庫很適合用來創(chuàng)建大量的數(shù)字集合。
網(wǎng)上關(guān)于機(jī)器學(xué)習(xí)的文章,視頻不計(jì)其數(shù),本來寫這么一篇東西,我自己也覺得有點(diǎn)多余,但是我還真沒找到一個(gè)能幫助像我這樣零基礎(chǔ)的人,快速接觸和上手機(jī)器學(xué)習(xí)的文章。這篇文章不能讓你深入學(xué)習(xí)和掌握機(jī)器學(xué)習(xí)的相關(guān)知識,但是一定能讓你快速了解什么是機(jī)器學(xué)習(xí),以及你到底要不要深入學(xué)習(xí),你需要提前學(xué)哪些東西來makes you ready。
機(jī)器學(xué)習(xí)是什么其實(shí)這個(gè)恐怕任何一個(gè)從業(yè)人員都已經(jīng)了解了,我也不過多介紹了,用我自己的話來說就是:讓機(jī)器學(xué)會用接近人類思考的方式來學(xué)習(xí)新的技能,從而幫助人類從一些簡單的智能工作上解脫出來。比如車牌號識別、手寫識別、語音識別、圖片OCR等等。
機(jī)器學(xué)習(xí)的過程機(jī)器學(xué)習(xí)的流程可以概括為幾大部分,分別是:設(shè)置數(shù)據(jù)集、劃分訓(xùn)練集和測試集、構(gòu)建計(jì)算網(wǎng)絡(luò)、訓(xùn)練模型、測試模型以及其他一些環(huán)節(jié)。設(shè)置數(shù)據(jù)集就是獲取測試數(shù)據(jù),你不能用爬蟲隨便爬幾千個(gè)圖片來訓(xùn)練,必須將圖片先轉(zhuǎn)化為規(guī)范的數(shù)據(jù)集合,比如大小相同等。其他的語音識別等,也需要先做類似的工作。幸運(yùn)的是,你可以注冊一個(gè)kaggle的賬號,來獲取一些已經(jīng)采集好的標(biāo)準(zhǔn)數(shù)據(jù)集。第二步是劃分集合,一多半用來訓(xùn)練,一小半用來測試,具體的比例你可以自行測試調(diào)優(yōu)。訓(xùn)練集用來訓(xùn)練模型,測試集用來評估訓(xùn)練結(jié)果。為了防止模型過于匹配某些訓(xùn)練數(shù)據(jù)(術(shù)語叫做過擬合),訓(xùn)練時(shí)往往是不停的隨機(jī)抽取樣本建立批次來進(jìn)行訓(xùn)練的,而不是分批次逐個(gè)批次訓(xùn)練做到全覆蓋。后面的幾個(gè)環(huán)節(jié),我就不細(xì)說了,網(wǎng)上最多的就是這個(gè)。在keras框架中,這三個(gè)環(huán)節(jié)也就是幾行代碼的事。
tensorflow、keras、Matlab和神經(jīng)網(wǎng)絡(luò)CNN都是什么這個(gè)是我初學(xué)的時(shí)候最困擾我的問題之一。Matlab是一種開發(fā)工具,類似于python語言,通信專業(yè)的孩子都懂的,經(jīng)常用來繪制數(shù)學(xué)圖像。tensorflow是一套機(jī)器學(xué)習(xí)框架,你可以詳細(xì)的設(shè)計(jì)和定制你的學(xué)習(xí)模型和流程,當(dāng)然你需要大量的專業(yè)知識和技能才能做到。keras是最適合我這種入門小白學(xué)習(xí)的,但是抽象的級別過高,你還是先了解下tensorflow再用比較好。它把很多tensorflow的功能(也可以使用theano和其他計(jì)算框架)都進(jìn)行了更高層面的組合,讓你用很少的代碼就能實(shí)現(xiàn)很多功能。神經(jīng)網(wǎng)絡(luò)CNN是主要用于圖像領(lǐng)域的計(jì)算框架,是一種計(jì)算模型,類似于基于Java或者PHP語言所使用的后端架構(gòu)。實(shí)現(xiàn)的方式多種多樣,這種架構(gòu)比較適合圖像識別(也可以用于語音識別等)。
基礎(chǔ)知識的準(zhǔn)備matplotlib庫是你必備的,這個(gè)是數(shù)學(xué)工具庫,主要用來繪制數(shù)學(xué)函數(shù)和圖像,非常的強(qiáng)大,很接近于Matlab的功能。這個(gè)網(wǎng)上也有專門的教程,建議先簡單學(xué)習(xí)一下。
然后是numpy庫,這個(gè)庫是科學(xué)計(jì)算領(lǐng)域常用的庫,專門用來做數(shù)字方面的工作,也是建議先學(xué)習(xí)一下。機(jī)器學(xué)習(xí)在某些時(shí)候,很接近于線性回歸,而這個(gè)庫很適合用來創(chuàng)建大量的數(shù)字集合。
再之后是OpenCV庫,這個(gè)是專門用來做圖像處理的庫(我學(xué)的是python版本,原版貌似是c++開發(fā)的),包括攝像頭采集,圖像變換,圖像分析分類等等,功能非常的強(qiáng)悍,可以說是計(jì)算機(jī)視覺領(lǐng)域必備的庫。網(wǎng)上也有專門的大量教程,也建議先學(xué)習(xí)一下,了解基礎(chǔ)用法。其中攝像頭人臉檢測(就是在圖像中識別出有沒有人臉),甚至已經(jīng)內(nèi)置了處理模型,能直接調(diào)用api檢測出來。
想要開發(fā)出一個(gè)識別人臉或者動物的模型其實(shí)很簡單,但是但是但是!想要知道這個(gè)模型是如何設(shè)計(jì)的,以及設(shè)計(jì)一個(gè)屬于自己的模型去解決特定問題,這個(gè)是很難的。也就是說,寫代碼很簡單,關(guān)鍵是熟練使用各種數(shù)學(xué)模型組成計(jì)算框架。斯坦福大學(xué)在網(wǎng)易云課堂上面有一個(gè)公開課,里面全都是各種數(shù)學(xué)模型和公式,目前我還無法駕馭,數(shù)學(xué)學(xué)渣感覺壓力很大。如果你想深入研究并解決你自己遇到的特定問題,那么你需要熟練使用各種數(shù)學(xué)模型,還要知道如何評估自己的模型的準(zhǔn)確率。星辰大海等著你去征服,少年。
最后的最后,我學(xué)這個(gè)時(shí)間確實(shí)很短,一定會有很多遺漏和錯(cuò)誤之處,如果大家發(fā)現(xiàn)了,請一定指出并最好附上文檔鏈接,大家共同學(xué)習(xí)。
最后補(bǔ)充一些特別好的文章資料,供大家進(jìn)一步閱讀:
https://zhuanlan.zhihu.com/p/... 專欄里的文章都不錯(cuò),比較容易理解
http://www.cnblogs.com/neo-T/... 這是我看過的最簡單的入門文章
https://www.bilibili.com/vide... 這個(gè)up的視頻講的也不錯(cuò),真·手把手教
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/41869.html
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時(shí)一運(yùn)維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時(shí)一運(yùn)維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
閱讀 2094·2021-11-24 10:34
閱讀 3067·2021-11-22 11:58
閱讀 3726·2021-09-28 09:35
閱讀 1739·2019-08-30 15:53
閱讀 2791·2019-08-30 14:11
閱讀 1566·2019-08-29 17:31
閱讀 556·2019-08-26 13:53
閱讀 2153·2019-08-26 13:45