神經(jīng)網(wǎng)絡(luò)NN算法(理論篇)

BenCHou 發(fā)布于2019-07-30 15:15 / 2034人閱讀

摘要：起步神經(jīng)網(wǎng)絡(luò)算法是機器學習中非常非常重要的算法。于是計算科學家們開始考慮用調(diào)整權(quán)值的方法來讓機器學習。年，和等人提出了反向傳播，算法，這是最著名的一個神經(jīng)網(wǎng)絡(luò)算法。算法算法是多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練一個核心的算法。

起步

神經(jīng)網(wǎng)絡(luò)算法( Neural Network )是機器學習中非常非常重要的算法。這是整個深度學習的核心算法，深度學習就是根據(jù)神經(jīng)網(wǎng)絡(luò)算法進行的一個延伸。理解這個算法的是怎么工作也能為后續(xù)的學習打下一個很好的基礎(chǔ)。

背景

神經(jīng)網(wǎng)絡(luò)是受神經(jīng)元啟發(fā)的，對于神經(jīng)元的研究由來已久，1904年生物學家就已經(jīng)知曉了神經(jīng)元的組成結(jié)構(gòu)。

1943年，心理學家McCulloch和數(shù)學家Pitts參考了生物神經(jīng)元的結(jié)構(gòu)，發(fā)表了抽象的神經(jīng)元模型MP。

1949年心理學家Hebb提出了Hebb學習率，認為人腦神經(jīng)細胞的突觸（也就是連接）上的強度上可以變化的。于是計算科學家們開始考慮用調(diào)整權(quán)值的方法來讓機器學習。這為后面的學習算法奠定了基礎(chǔ)。

1958年，計算科學家Rosenblatt提出了由兩層神經(jīng)元組成的神經(jīng)網(wǎng)絡(luò)。他給它起了一個名字--感知器（ Perceptron ）。

1986年，Rumelhar和Hinton等人提出了反向傳播（ Backpropagation ，BP）算法，這是最著名的一個神經(jīng)網(wǎng)絡(luò)算法。

神經(jīng)網(wǎng)絡(luò)的構(gòu)成

多層神經(jīng)網(wǎng)絡(luò)由三部分組成：輸入層( input layer ), 隱藏層 ( hidden layers ), 輸出層 ( output layers )。

每一層都是有單元( units )組成，其中，輸入層是由訓(xùn)練集中實例特征向量傳入，根據(jù)連接點之間的權(quán)重傳遞到下一層，這樣一層一層向前傳遞。

輸入層和輸出層都只有一層，隱藏層的個數(shù)可以是任意的。神經(jīng)網(wǎng)絡(luò)的層數(shù)計算中不包括輸入層，比方說一個神經(jīng)網(wǎng)絡(luò)中有2個隱藏層，我們就說這是一個3層的神經(jīng)網(wǎng)絡(luò)。

作為多層向前神經(jīng)網(wǎng)絡(luò)，理論上，如果有足夠多的隱藏層和訓(xùn)練集，是可以模擬出任何方程的。

神經(jīng)網(wǎng)絡(luò)可以用來解決分類( classification ）問題，也可以解決回歸( regression )問題。

從單層到多層的神經(jīng)網(wǎng)絡(luò)

由兩層神經(jīng)網(wǎng)絡(luò)構(gòu)成了單層神經(jīng)網(wǎng)絡(luò)，它還有個別名———— 感知器 。

如圖中，有3個輸入，連接線的權(quán)值分別是 w1, w2, w3。將輸入與權(quán)值進行乘積然后求和，作為 z 單元的輸入，如果 z 單元是函數(shù) g ，那么就有 z = g(a1 * w1 + a2 * w2 + a3 * w3) 。

單層神經(jīng)網(wǎng)絡(luò)的擴展，也是一樣的計算方式：

在多層神經(jīng)網(wǎng)絡(luò)中，只不過是將輸出作為下一層的輸入，一樣是乘以權(quán)重然后求和：

設(shè)計神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

使用神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練之前，必須確定神經(jīng)網(wǎng)絡(luò)的層數(shù)，以及每一層中單元的個數(shù)。整個訓(xùn)練過程就是調(diào)整連接點之間的權(quán)重值。

特征向量在被傳入輸入層前，通常要先標準化為 0 到 1 之間的數(shù)，這是為了加速學習過程。

對于分類問題，如果是兩類，可以用一個輸出單元（0 和 1 表示分類結(jié)果）進行表示。如果是多分類問題，則每一個類別用一個輸出單元表示。分類問題中，輸出層單元個數(shù)通常等于類別的數(shù)量。

目前沒有明確的規(guī)則來設(shè)計最好有多少個隱藏層，通常是根據(jù)實驗測試和誤差，以及準確度來進行改進。

交叉驗證方法

如何來預(yù)測準確度呢？在SVM的應(yīng)用篇中，有個方法就是將數(shù)據(jù)集分為兩類，訓(xùn)練集和測試集，利用測試集的數(shù)據(jù)將模型的預(yù)測結(jié)果進行對比，得出準確度。這里介紹另一個常用但更科學的方法————交叉驗證方法( Cross-Validation )。

這個方法不局限于將數(shù)據(jù)集分成兩份，它可以分成 k 份。用第一份作為訓(xùn)練集，其余作為測試集，得出這一部分的準確度 ( evaluation )。再用第二份作為訓(xùn)練集，其余作為測試集，得出這第二部分的準確度。以此類推，最后取各部分的準確度的平均值。從而可以得到設(shè)計多少層最佳。

BP 算法

BP 算法 ( BackPropagation )是多層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練一個核心的算法。目的是更新每個連接點的權(quán)重，從而減小預(yù)測值( predicted value )與真實值 ( target value )之間的差距。輸入一條訓(xùn)練數(shù)據(jù)就會更新一次權(quán)重，反方向（從輸出層=>隱藏層=>輸入層）來以最小化誤差（error）來更新權(quán)重（weitht）。

在訓(xùn)練神經(jīng)網(wǎng)絡(luò)之前，需要初始化權(quán)重( weights )和偏向( bias )，初始化是隨機值， -1 到 1 之間，每個單元有一個偏向。

算法詳細介紹

數(shù)據(jù)集用 D 表示，學習率用 l 表示。對于每一個訓(xùn)練實例 X，都是一樣的步驟。

利用上一層的輸入，得到本層的輸入:

$$ I_j = sum_i w_{i,j}O_i + heta{j} $$

得到輸入值后，神經(jīng)元要怎么做呢？我們先將單個神經(jīng)元進行展開如圖：

得到值后需要進行一個非線性轉(zhuǎn)化，這個轉(zhuǎn)化在神經(jīng)網(wǎng)絡(luò)中稱為激活函數(shù)( Activation function )，這個激活函數(shù)是一個 S 函數(shù)，圖中以 f 表示，它的函數(shù)為：

$$ O_j = frac1{1+e^{-I_j}} $$

更新權(quán)重

通過上面的傳遞規(guī)則，可以得到最終的輸出，而訓(xùn)練實例中包含實際的值，因此可以得到訓(xùn)練和實際之間的誤差。根據(jù)誤差(error)反向傳送。

對于輸出層的誤差為：

$$ Err_j = O_j(1 - O_j)(T_j - O_j) $$

其中 Oj 表示預(yù)測值， Tj 表示真實值。

對隱藏層的誤差：

$$ Err_j = O_j(1 - O_j)sum_k Err_kw_{j,k} $$

更新權(quán)重：

$$ egin{align*} Delta w_{i,j} &= (l)Err_jO_i w_{i,j} &= w_{i,j} + Delta w_{i,j} end{align*} $$

這里的 l 是學習率。偏向更新：

$$ egin{align*} Delta heta{j} &= (l)Err_j heta{j} &= heta{j} + Delta heta{j} end{align*} $$

訓(xùn)練的終止條件

怎樣才算是一個訓(xùn)練好了的神經(jīng)網(wǎng)絡(luò)呢？滿足下面一個情況即可：

權(quán)重的更新低于某個閾值，這個閾值是可以人工指定的；

預(yù)測的錯誤率低于某個閾值；

達到預(yù)設(shè)一定的循環(huán)次數(shù)。

BP 算法舉例

假設(shè)有一個兩層的神經(jīng)網(wǎng)絡(luò)，結(jié)構(gòu)，權(quán)重和數(shù)據(jù)集如下：

計算誤差和更新權(quán)重：

GPU云服務(wù)器云服務(wù)器最優(yōu)化理論算法答案最優(yōu)化理論與算法答案 NN 近鄰nn

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/41136.html

發(fā)表評論

登陸后可評論

0條評論

BenCHou

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow2.1

閱讀 3285·2023-04-25 20:35
我所了解的CSS包含塊

閱讀 3632·2019-08-30 15:54
vue中如何實現(xiàn)的自定義按鈕

閱讀 2017·2019-08-30 15:43
vertical-align:垂直對齊方式相關(guān)說明

閱讀 2200·2019-08-29 15:14
對css居中的一點總結(jié)

閱讀 1906·2019-08-29 11:17
豆瓣讀書搜索頁的window.__DATA__的解密

閱讀 3400·2019-08-26 13:36
JS數(shù)組中那些你知道或不知道的

閱讀 722·2019-08-26 10:15
如何解決vue打包項目中的圖片,靜態(tài)css,js 不能訪問路徑問題

閱讀 2861·2019-08-23 15:41

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

神經(jīng)網(wǎng)絡(luò)NN算法(理論篇)

相關(guān)文章

淺析 Hinton 最近提出的 Capsule 計劃

【面向代碼】學習 Deep Learning（一）Neural Network

六種GAN評估指標的綜合評估實驗，邁向定量評估GAN的重要一步

AI技術(shù)說：人工智能相關(guān)概念與發(fā)展簡史

發(fā)表評論

0條評論

BenCHou

男|高級講師

TA的文章

tensorflow2.1

我所了解的CSS包含塊

vue中如何實現(xiàn)的自定義按鈕

vertical-align:垂直對齊方式相關(guān)說明

對css居中的一點總結(jié)

豆瓣讀書搜索頁的window.DATA的解密

JS數(shù)組中那些你知道或不知道的

如何解決vue打包項目中的圖片,靜態(tài)css,js 不能訪問路徑問題

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

神經(jīng)網(wǎng)絡(luò)NN算法(理論篇)

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！