成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

機(jī)器學(xué)習(xí)從入門到放棄之KNN算法

XUI / 1274人閱讀

摘要:好了,廢話不多說,馬上開講第一個機(jī)器學(xué)習(xí)的算法,算法。另外,本文題目是機(jī)器學(xué)習(xí)從入門到放棄之算法而非機(jī)器學(xué)習(xí)從入門到放棄算法這樣,因為如果是后者,某日我要棄坑就會觸發(fā)我的強(qiáng)迫癥,而前者并不會,哈哈哈。

談起機(jī)器學(xué)習(xí),真是令人心生向往同時又讓人頭痛不已。

心生向往是因為機(jī)器學(xué)習(xí)在很多方面都已經(jīng)展現(xiàn)出其魅力,在人工智能的領(lǐng)域比如說AlphaGo,計算機(jī)視覺領(lǐng)域的人臉識別,車牌識別,靠近生活的有推薦系統(tǒng),用戶畫像情感分析等等,都或多或少用到機(jī)器學(xué)習(xí)的知識。其中大部分應(yīng)用是相當(dāng)能滿足程序員心中的極客精神的

但令人頭不痛不已的當(dāng)你去涉足機(jī)器學(xué)習(xí)這個領(lǐng)域的時候,你會發(fā)現(xiàn)其中涉及大量的數(shù)學(xué)知識,這對很多程序員來說都很不友好。

但沒關(guān)系,程序員應(yīng)該是工程師,而不是科學(xué)家,我們要做的是學(xué)會把理論落實成為生產(chǎn)力。

因此本系列將盡可能降低數(shù)學(xué)的描述(避免一長串的數(shù)學(xué)證明)來描述機(jī)器學(xué)習(xí)算法的基本原理。如果需要對算法進(jìn)行深入了解和學(xué)習(xí),那么讀者還是應(yīng)該學(xué)習(xí)算法背后的數(shù)學(xué)原理。

好了,廢話不多說,馬上開講第一個機(jī)器學(xué)習(xí)的算法,KNN算法。

KNN算法 算法背景

假設(shè),你是一個電影公司的影片分類員,你需要從一大堆影片里面分類出武俠片愛情片,用肉眼一部部看肯定不科學(xué),現(xiàn)在有一個程序能識別影片中的鏡頭,聰明的你想到了又么么噠的場面的一定是愛情片,有廝打場面的就是武俠片。

其中,么么噠廝打兩種場面則稱為特征

你把這兩種特征放入程序里面一分類,咦,怎么錯這么多?!

然后,你決定打開其中一兩個錯誤的結(jié)果看看……

咦,剛剛還刀劍相向的女主角怎么怎么和男主角吻了起來,臥槽,那可是你的殺父仇人啊喂,哦,原來男主角是被奸人所逼……

咦,這愛情片男女主角怎么吻著吻著就廝打起來,臥槽,還要脫衣服,天啊,我還是個孩子……

你終于明白,錯誤的原因是因為無法將么么噠廝打作為單一特征,這時,你明白需要重設(shè)設(shè)計分類的標(biāo)準(zhǔn)了。

算法設(shè)計

牛逼的你發(fā)現(xiàn),雖然無法將么么噠廝打作為唯一標(biāo)準(zhǔn),但是是可以作為參考的。比如說,在武俠片中雖然也會出現(xiàn)么么噠的鏡頭,但顯然廝打鏡頭仍會占主流。

于是你對以往已經(jīng)分好類別的電影做出統(tǒng)計,并的做出以下表格。

其中這部分樣本又叫做訓(xùn)練集

X=么么噠鏡頭的數(shù)量
Y=廝打鏡頭的數(shù)量
0代表愛情片,1代表武俠片

電影ID X Y 類型
1 10 2 0
2 8 3 0
3 2 6 1
…… …… …… ……

把它畫出二維圖大概是這樣:

黃點(diǎn)代表1類電影的分布,綠色代表0類電影的分布,紫色代表需要分類的電影樣本。

那么該怎么判別紫色的那顆點(diǎn)所在的類別呢?

沒錯,KNN就是最簡單粗暴的方法,首先判別紫色點(diǎn)離黃色群體和離綠色群體距離,然后將紫色判斷為距離最近的那個群體。

這里具體指出利用KNN的具體步驟:

計算上述圖中所有點(diǎn)到達(dá)待測點(diǎn)的歐式距離(勾股定理計算)。

選出離待測點(diǎn)最近的K個點(diǎn),k由用戶指定。

計算在這k個點(diǎn)中,各個類型的個數(shù)

將個數(shù)最多的類型作為預(yù)測點(diǎn)的類型。

代碼實現(xiàn)

KNN代碼實現(xiàn),收錄我的github上,點(diǎn)擊一下連接并進(jìn)入classify目錄下就可訪問

github

后話

在我的github中會慢慢更新TO DO LIST里提及的算法,但文章因需要語言總結(jié)會稍慢一點(diǎn)。

另外,本文題目是機(jī)器學(xué)習(xí)從入門到放棄之KNN算法而非機(jī)器學(xué)習(xí)從入門到放棄(1):KNN算法這樣,因為如果是后者,某日我要棄坑就會觸發(fā)我的強(qiáng)迫癥,而前者并不會,哈哈哈。

如有錯誤,歡迎指點(diǎn)。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/38014.html

相關(guān)文章

  • 機(jī)器學(xué)習(xí)入門放棄邏輯回歸

    摘要:分類問題回到本系列的第一篇文章機(jī)器學(xué)習(xí)從入門到放棄之算法,在里面有這樣的一個問題黃點(diǎn)代表類電影的分布,綠色代表類電影的分布,紫色代表需要分類的電影樣本。 分類問題 回到本系列的第一篇文章機(jī)器學(xué)習(xí)從入門到放棄之KNN算法,在里面有這樣的一個問題 showImg(https://sfault-image.b0.upaiyun.com/106/875/1068758747-576918491...

    Cympros 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<