深度學(xué)習(xí)中的「卷積層」如何深入理解？

MasonEast 發(fā)布于2019-04-25 18:20 / 3174人閱讀

摘要：在現(xiàn)有深度學(xué)習(xí)框架下，我們所編寫的卷積層往往是一個單行語句，它可以抽象出許多結(jié)構(gòu)細(xì)節(jié)。本文試圖闡述卷積層的一個特定的解剖特征，而這是在大多數(shù)文章和相關(guān)討論中被忽略的問題。來自卷積層的輸出經(jīng)常用作后續(xù)卷積層的輸入。

近來，深度學(xué)習(xí)的火爆程度顯而易見，而在深度學(xué)習(xí)領(lǐng)域，卷積網(wǎng)絡(luò)則是引起這許多令人驚嘆的結(jié)果的主要原因。自從2012年AlexNet公開亮相之后，現(xiàn)如今，我們很難列舉一個根本不使用卷積架構(gòu)，具有突破性的計(jì)算機(jī)視覺架構(gòu)。

在現(xiàn)有深度學(xué)習(xí)框架下，我們所編寫的卷積層往往是一個單行語句，它可以抽象出許多結(jié)構(gòu)細(xì)節(jié)。不過，有時候后退一步去揭開一些抽象概念也是一個不錯的選擇。本文試圖闡述卷積層的一個特定的解剖特征，而這是在大多數(shù)文章和相關(guān)討論中被忽略的問題。

許多卷積架構(gòu)是從一個外部卷積單元開始的，它將信道RGB的輸入圖像映射到一系列內(nèi)部過濾器中。在當(dāng)下最通用的深度學(xué)習(xí)框架中，這個代碼可能如下所示：

out_1=Conv2d(input=image, filter=32, kernel_size=(3,3), strides=(1,1))

relu_out=relu(out_1)

pool_out=MaxPool(relu_out, kernel_size=(2,2), strides=2)

對許多人來說，我們都很清楚，上面的結(jié)果是一系列的具有32層深度的過濾器。我們不知道的是，該如何將具有3個信道的圖像較精確地映射到這32層中！另外，我們也不清楚該如何應(yīng)用較大池（max-pool）操作符。例如，是否一次性將較大池化應(yīng)用到了所有的過濾層中以有效地生成一個單一的過濾映射？又或者，是否將較大池獨(dú)立應(yīng)用于每個過濾器中，以產(chǎn)生相同的32層的池化過濾器？

如何做

一張圖勝過千言萬語，下面有一個圖表，可以顯示上述代碼片段中所有的操作。

卷積層的應(yīng)用

觀察上圖，可以看到最顯著的一點(diǎn)是，步驟1中的每個過濾器（即過濾器-1、過濾器-2……）實(shí)際上包含一組3個卷積核（Wt-R、Wt-G和WT-B）。這些內(nèi)核中的每一個分別保存為輸入圖像中的紅（R）、綠（G）和藍(lán)（B）信道。

在正向傳播期間，圖像中的R、G和B像素值分別與Wt-R、Wt-G和Wt-B內(nèi)核相乘以產(chǎn)生一個間歇激活映射（intermittent activation map）（圖中未標(biāo)出）。然后將三個核的輸出相加以為每個過濾器產(chǎn)生一個激活映射。

隨后，這些激活中的每一個都要受到ReLu函數(shù)的支配，最后運(yùn)行到較大池化層，而后者主要負(fù)責(zé)減少輸出激活映射的維度。最后，我們得到的是一組激活映射，通常其維數(shù)是輸入圖像的一半，但現(xiàn)在其信號跨越了一組32個選擇（我們選擇作為過濾器的數(shù)量）作為二維張量。

來自卷積層的輸出經(jīng)常用作后續(xù)卷積層的輸入。因此，如果我們的第二個卷積單元如下：

conv_out_2 = Conv2d（input = relu_out，filters = 64）

那么框架就需要實(shí)例化64個過濾器，每個過濾器使用一組32個獨(dú)特的核。

為什么

另一個微妙的但重要的一點(diǎn)，就是為什么我們?yōu)榈谝粋€卷積層使用了32個過濾器。在許多常用的體系結(jié)構(gòu)中，隨著我們深入網(wǎng)絡(luò)，所使用的過濾器數(shù)量也越來越大（例如，第二個為64，第三個為128，依此類推）。

在本文中，Matt Zeiler使用了一個反卷積算子，以便可視化深度卷積結(jié)構(gòu)的不同層次和深度的核在訓(xùn)練過程中得到調(diào)諧。普遍的共識是，在經(jīng)過最優(yōu)訓(xùn)練的卷積網(wǎng)絡(luò)中，在邊緣（接近圖像）的濾波器對基本邊緣和圖案變得敏感。深層中的過濾器對逐漸升高的階數(shù)形狀和模式敏感。這些現(xiàn)象在Matt論文的圖表中得到了很好的總結(jié)：

?在第一層和第二層（最外層）上過濾器激活的可視化

第三層過濾器激活的可視化

第4層和第5層的過濾器的可視化激活

另一個我想了很長一段時間的問題是，為什么不同的過濾器，即使在任何給定的層，都會被調(diào)整到一個特定的形狀或模式。畢竟，任何內(nèi)核的權(quán)重都沒有什么異常的，這可以保證觀察到的結(jié)果。正是到了這一點(diǎn)：隨機(jī)梯度下降（SGD）的過程自動糾正權(quán)重，使內(nèi)核獲得以上的特征。重要的是：

?核（或權(quán)重矩陣）被隨機(jī)初始化，以確保每個核都被優(yōu)化到一個獨(dú)特的解決方案空間。

?我們定義了足夠多的過濾器來較大限度地捕獲我們數(shù)據(jù)集中的各種特征，同時針對所發(fā)生的計(jì)算成本實(shí)現(xiàn)了平衡。

最后，許多論文還提出，過濾器激活的可視化為卷積結(jié)構(gòu)的性能提供了一個窗口。一個平衡的和高性能的網(wǎng)絡(luò)通常顯示如上所述的激活，具有明確的邊緣和形狀檢測器的表現(xiàn)。一個過度擬合、欠擬合和泛化的網(wǎng)絡(luò)往往無法顯示這些觀察結(jié)果。因此，使用（2）中使用的過程來測試網(wǎng)絡(luò)是一個好主意，以查看實(shí)驗(yàn)性的卷積網(wǎng)絡(luò)是否產(chǎn)生了良好的結(jié)果。

參考文獻(xiàn)：

深度卷積神經(jīng)網(wǎng)絡(luò)的ImageNet分類，Alex Krizhevsky，Ilya Sutskever，Geoffrey E. Hinton，https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks

卷積網(wǎng)絡(luò)的可視化與理解，Matthew D Zeiler，Rob Fergus https://arxiv.org/abs/1311.2901

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實(shí)際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報(bào)表系統(tǒng)等全方位知識

QQ群：81035754

云服務(wù)器 GPU云服務(wù)器如何深入理解深度學(xué)習(xí) 如何深入學(xué)習(xí)深度學(xué)習(xí) 如何理解深度學(xué)習(xí) 深度學(xué)習(xí)如何理解

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/4665.html

發(fā)表評論

登陸后可評論

0條評論

MasonEast

男|高級講師

我要關(guān)注我要私信

TA的文章

#雙11#TMWHOST，澳門VPS，66折優(yōu)惠，限量款低至$11.11/季，此外充值最多返20%

閱讀 2052·2021-11-08 13:22
??思維導(dǎo)圖整理大廠面試高頻數(shù)組9: 刪除重復(fù)元素的通解問題, 力扣26/80??

閱讀 2513·2021-09-04 16:40
使用回調(diào)函數(shù)通過冒泡排序模擬實(shí)現(xiàn)qsort函數(shù)

閱讀 1159·2021-09-03 10:29
css3 偽類選擇器快速復(fù)習(xí)

閱讀 1726·2019-08-30 15:44
個人公眾號已開通！

閱讀 2130·2019-08-30 11:13
初識貝塞爾曲線

閱讀 2800·2019-08-29 17:07
Vue學(xué)習(xí)日記（一）——Vue介紹

閱讀 1974·2019-08-29 14:22
函數(shù)的防抖和節(jié)流

閱讀 1254·2019-08-26 14:00

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)中的「卷積層」如何深入理解？

相關(guān)文章

**卷積為什么如此強(qiáng)大？理解深度學(xué)習(xí)中的卷積**

**理解深度學(xué)習(xí)中的卷積**

**熬過深宮十幾載，深度學(xué)習(xí)上位這五年**

發(fā)表評論

0條評論

MasonEast

男|高級講師

TA的文章

#雙11#TMWHOST，澳門VPS，66折優(yōu)惠，限量款低至$11.11/季，此外充值最多返20%

??思維導(dǎo)圖整理大廠面試高頻數(shù)組9: 刪除重復(fù)元素的通解問題, 力扣26/80??

使用回調(diào)函數(shù)通過冒泡排序模擬實(shí)現(xiàn)qsort函數(shù)

css3 偽類選擇器快速復(fù)習(xí)

個人公眾號已開通！

初識貝塞爾曲線

Vue學(xué)習(xí)日記（一）——Vue介紹

函數(shù)的防抖和節(jié)流

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)中的「卷積層」如何深入理解？

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)中的「卷積層」如何深入理解？