成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

【機(jī)器學(xué)習(xí)基礎(chǔ)】卷積神經(jīng)網(wǎng)絡(luò)(CNN)基礎(chǔ)

番茄西紅柿 / 3315人閱讀

摘要:而在卷積神經(jīng)網(wǎng)絡(luò)中,這兩個(gè)神經(jīng)元可以共用一套參數(shù),用來(lái)做同一件事情。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖所示從右到左,輸入一張圖片卷積層池化層卷積層池化層展開全連接神經(jīng)網(wǎng)絡(luò)輸出。

最近幾天陸續(xù)補(bǔ)充了一些“線性回歸”部分內(nèi)容,這節(jié)繼續(xù)機(jī)器學(xué)習(xí)基礎(chǔ)部分,這節(jié)主要對(duì)CNN的基礎(chǔ)進(jìn)行整理,僅限于基礎(chǔ)原理的了解,更復(fù)雜的內(nèi)容和實(shí)踐放在以后再進(jìn)行總結(jié)。


卷積神經(jīng)網(wǎng)絡(luò)的基本原理 

  前面對(duì)全連接神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)進(jìn)行了簡(jiǎn)要的介紹,這一節(jié)主要對(duì)卷積神經(jīng)網(wǎng)絡(luò)的基本原理進(jìn)行學(xué)習(xí)和總結(jié)。

  所謂卷積,就是通過(guò)一種數(shù)學(xué)變換的方式來(lái)對(duì)特征進(jìn)行提取,通常用于圖片識(shí)別中。

  既然全連接的神經(jīng)網(wǎng)絡(luò)可以用于圖片識(shí)別,那么為什么還要用卷積神經(jīng)網(wǎng)絡(luò)呢?

0.使用卷積神經(jīng)網(wǎng)絡(luò)的理由

(1)首先來(lái)看下面一張圖片:

  在這個(gè)圖片當(dāng)中,鳥嘴是一個(gè)很明顯的特征,當(dāng)我們做圖像識(shí)別時(shí),當(dāng)識(shí)別到有“鳥嘴”這樣的特征時(shí),可以具有很高的確定性認(rèn)為圖片是一個(gè)鳥類。

  那么,在提取特征的過(guò)程中,有時(shí)就沒(méi)有必要去看完整張圖片,只需要一小部分就能識(shí)別出一定具有代表的特征。

  因此,使用卷積就可以使某一個(gè)特定的神經(jīng)元(在這里,這個(gè)神經(jīng)元可能就是用來(lái)識(shí)別“鳥嘴”的)僅僅處理帶有該特征的部分圖片就可以了,而不必去看整張圖片。

   那么這樣就會(huì)使得這個(gè)神經(jīng)元具有更少的參數(shù)(因?yàn)椴挥迷俑鷪D片的每一維輸入都連接起來(lái))。

(2)再來(lái)看下面一組圖片:

 上面兩張圖片都是鳥類,而不同的是,兩只鳥的“鳥嘴”的位置不同,但在普通的神經(jīng)網(wǎng)絡(luò)中,需要有兩個(gè)神經(jīng)元,一個(gè)去識(shí)別左上角的“鳥嘴”,另一個(gè)去識(shí)別中間的“鳥嘴”:

  但其實(shí)這兩個(gè)“鳥嘴”的形狀是一樣的,這樣相當(dāng)于上面兩個(gè)神經(jīng)元是在做同一件事情。

  而在卷積神經(jīng)網(wǎng)絡(luò)中,這兩個(gè)神經(jīng)元可以共用一套參數(shù),用來(lái)做同一件事情。

(3)對(duì)樣本進(jìn)行子采樣,往往不會(huì)影響圖片的識(shí)別。

  如下面一張圖:

  假設(shè)把一張圖片當(dāng)做一個(gè)矩陣的話,取矩陣的奇數(shù)行和奇數(shù)列,可看做是對(duì)圖片的一種縮放,而這種縮放往往不會(huì)影響識(shí)別效果。

  卷積神經(jīng)網(wǎng)絡(luò)中就可以對(duì)圖片進(jìn)行縮放,是圖片變小,從而減少模型的參數(shù)。

1.卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)

  卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖所示:

  從右到左,輸入一張圖片→卷積層→max pooling(池化層)→卷積層→max pooling(池化層)→......→展開→全連接神經(jīng)網(wǎng)絡(luò)→輸出。

  中間的卷積層和池化層可以重復(fù)多次。后面會(huì)一一介紹每一層是如何工作的。

  對(duì)于第0部分的三個(gè)功能:

  (1)某個(gè)神經(jīng)元只需偵測(cè)某一部分的圖片,來(lái)識(shí)別某種特征這個(gè)工作是在卷積層內(nèi)完成的。

  (2)具有相同功能的神經(jīng)元共用一套參數(shù),這個(gè)工作也是在卷積層內(nèi)完成的。

 ?。?)通過(guò)縮小圖片,來(lái)減少模型的參數(shù),這個(gè)工作是在池化層中完成的。

  稍后會(huì)解釋上面三個(gè)部分是如何進(jìn)行的。

1.1.卷積層的工作原理

  假設(shè)有一張6*6的黑白圖片,如圖所示:

  首先圖片經(jīng)過(guò)卷積層,卷積層有一組filter,每個(gè)filter用來(lái)抓取圖片中的某一種特征,如圖所示:

  假設(shè)filter是3*3的矩陣,每個(gè)filter有9個(gè)參數(shù),而這些參數(shù)就是通過(guò)訓(xùn)練學(xué)習(xí)得到的,這里假設(shè)我們已經(jīng)學(xué)習(xí)得到了上面一組參數(shù)的值。

  因此也就說(shuō)明了問(wèn)題(1)中,每一個(gè)filter只偵測(cè)圖片中的很小一部分?jǐn)?shù)據(jù)。

  那么每個(gè)filter是如何去抓取特征的呢?也就是(1)中使某一個(gè)神經(jīng)元只偵測(cè)一部分圖片就能提取某一種特征的問(wèn)題。

  首先看filter1,filter大小為3*3,那么相當(dāng)于這個(gè)filter1依次從左到右去覆蓋整張圖片,然后與覆蓋區(qū)域做內(nèi)積,如圖所示:

  首先從左上角開始,覆蓋圖片左上角3*3的區(qū)域,計(jì)算結(jié)果得到3,然后向右移動(dòng),這里移動(dòng)的步長(zhǎng)稱之為stride當(dāng)stride為1時(shí),即一次移動(dòng)一格,為2時(shí),一次移動(dòng)兩格,如圖所示:

  移動(dòng)之后再次用圖片被覆蓋的區(qū)域與filter做內(nèi)積,得到第二個(gè)值:

  依次進(jìn)行移動(dòng)和計(jì)算,當(dāng)移到最右邊盡頭時(shí),則從下一行開始繼續(xù)移動(dòng),最終得到如圖所示矩陣:

  通過(guò)觀察這個(gè)filter1可以看出,filter1的對(duì)角矩陣全為1其他為-1,那么對(duì)于圖片中對(duì)角為1的部分,與filter1做內(nèi)積后的值就會(huì)很大(例子中等于3),其他的則會(huì)很小。

  因此filter1是一種用于偵測(cè)對(duì)角都為1的圖片這種屬性,在圖片中可以看到,坐上角和右下角都具有這種特征。

  所以這也就說(shuō)明了(2)中的問(wèn)題,一個(gè)filter的一組參數(shù),可以偵測(cè)到圖片中兩個(gè)位置的相同屬性。

  接下來(lái)是第二個(gè)filter,filter2,那么filter2與圖片的計(jì)算方式一模一樣,如圖所示:

  其他的filter也是如此,依次計(jì)算,然后把每個(gè)filter處理結(jié)果放在一起,如圖所示:

  那么相當(dāng)于一個(gè)紅色方框現(xiàn)在是由2個(gè)值來(lái)描述的,最終得到的是2個(gè)4*4的圖片,稱之為“feature map”。

  上面是對(duì)于一張黑白的圖片進(jìn)行一次卷積(convolution)的過(guò)程,那么對(duì)于彩色的圖片是怎樣處理的呢?

  彩色圖片通常是由“RGB”組成,分別表示紅色、綠色和藍(lán)色,那么就相當(dāng)于有三個(gè)部分的組成,如圖所示:

  這三個(gè)層稱之為“通道”(channel),那么利用卷積處理這種圖片時(shí),filter也應(yīng)該是三層,即3*3*3的,是帶有深度的,長(zhǎng)下面這個(gè)樣子:

  相當(dāng)于每個(gè)filter具有27個(gè)參數(shù)。

卷積與全連接網(wǎng)絡(luò)的關(guān)系

  其實(shí)卷積就是一種特殊形式的全連接網(wǎng)絡(luò),還是假設(shè)是上面那張6*6的圖片,如下是全連接的網(wǎng)絡(luò)結(jié)構(gòu):

  把圖片進(jìn)行拉直展開,但在卷積中,這個(gè)網(wǎng)絡(luò)有些連接的地方被切斷了,只有一部分輸入與神經(jīng)元相連接。下面進(jìn)行解釋:

  正如上面的卷積過(guò)程,如下是其中的一步,如圖所示:

  那么這個(gè)步驟我們可以想象成是這樣子的:

  左邊把圖片的36個(gè)數(shù)值拉直,然后,對(duì)于filter1所覆蓋的區(qū)域?yàn)樽笊辖牵敲丛貙?duì)應(yīng)的位置為1、2、3、7、8、9、13、14、15

  然后這9個(gè)數(shù)值,依次經(jīng)過(guò)各自的weight相乘再相加,得到第一個(gè)值3,這里的weight就是對(duì)應(yīng)的filter中各個(gè)位置的值,圖中weight線的顏色與filter中圓圈顏色一一對(duì)應(yīng)。

  到這里就很清楚的看出卷積與全連接之間的關(guān)系,相當(dāng)于簡(jiǎn)化了全連接神經(jīng)網(wǎng)絡(luò),從而使得參數(shù)量更少。

  然后filter開始向右移動(dòng)一格(stride=1,上面計(jì)算過(guò)程的第二個(gè)方框,元素依次為2、3、4、8、9、10、14、15、16),與filter做inner product,得到結(jié)果-1,對(duì)應(yīng)到全連接網(wǎng)絡(luò)中如圖所示:

  依舊是每個(gè)元素的weight與輸入輸出連接,顏色對(duì)應(yīng)的filter圓圈與weight的顏色一致。

  從上面的圖可以看出,兩個(gè)神經(jīng)元(3和-1)都是通過(guò)filter1作為weight與輸入進(jìn)行連接的,也就是說(shuō),這兩個(gè)神經(jīng)元是共用同一組參數(shù),這樣,在上面減少參數(shù)的基礎(chǔ)上,使得模型的參數(shù)更少了。

  上述過(guò)程就是卷積層的工作過(guò)程,主要用于圖片中特征的抓取,完成第0節(jié)內(nèi)容的前兩個(gè)。

1.2池化層的工作原理

  池化層的作用上面說(shuō)了,就是為了圖片的縮放,那么池化層是如何進(jìn)行縮放的呢?

  其實(shí)池化層的原理很簡(jiǎn)單,這里以max-pooling為例,經(jīng)過(guò)卷積層之后的圖片變?yōu)?*4大小的圖片,有2個(gè)filter,也就是兩張4*4的圖片:

  池化就是將上面得到的數(shù)據(jù)進(jìn)行分組,如圖所示:

  如圖示中的分組方法,這種分組方法可以是任意的,也可以三個(gè)一組等等,然后取每個(gè)組中的最大值:

  那么原來(lái)4*4的圖片經(jīng)過(guò)maxpooling之后就縮小為2*2的圖片了,當(dāng)然這里也不一定非要取最大值,也可以取平均,或者又取平均又取最大值等。

  那么上面的過(guò)程總結(jié)一下就可以用如下圖進(jìn)行概括:

 

  這就是池化層的工作原理,比較簡(jiǎn)單。

1.3Flatten和全連接層

  接下來(lái)就來(lái)到了flatten和全連接層了,flatten的作用就是把上面得到的兩個(gè)2*2的image拉直展開,然后再丟進(jìn)全連接網(wǎng)絡(luò)中計(jì)算就可以了,這個(gè)跟前面全連接神經(jīng)網(wǎng)絡(luò)的方法一樣,如圖所示:

  這里就不再詳細(xì)贅述了。那么整個(gè)網(wǎng)絡(luò)就是利用梯度下降的方法進(jìn)行訓(xùn)練的,所有的參數(shù)被一起學(xué)習(xí)得到。

2.使用Keras對(duì)CNN的簡(jiǎn)單實(shí)現(xiàn)

  這里還是使用keras對(duì)CNN的建模過(guò)程進(jìn)行一個(gè)簡(jiǎn)單的實(shí)現(xiàn),首先先來(lái)看一下keras分別添加卷積層和池化層的過(guò)程:

  如圖中所示,首先要導(dǎo)入Convolution2D(后來(lái)這個(gè)接口會(huì)改成Conv2D)和Maxpooling2D。

  然后與之前神經(jīng)網(wǎng)絡(luò)中一樣,不過(guò)是把“Dense”換成了上面兩個(gè)方法,其中Convolution2D中,25表示filter的數(shù)量,3,3表示filter的尺寸,input_shape為輸入圖片的大小,28*28為圖片大小,1表示黑白圖片,3則表示彩圖“RGB”

  Maxpooling2D中只有分組的形狀,即2*2大小的。

  接下來(lái)就是根據(jù)設(shè)計(jì)的網(wǎng)絡(luò)的形狀,重復(fù)上面兩個(gè)步驟,完成卷積和池化。如圖所示:

  圖中黑色的方框?yàn)榇a的實(shí)現(xiàn)內(nèi)容,在keras1.0和2.0中可能有些差異;

  黃色的框中是輸入和輸出的尺寸大小,可以看到,輸入為28*28的圖片,經(jīng)過(guò)25個(gè)3*3的filter組成的第一個(gè)卷積層之后,變成了25*26*26的尺寸

  然后經(jīng)過(guò)第一個(gè)2*2的池化層,縮小后的輸出尺寸大小為25*13*13

  然后經(jīng)過(guò)第二個(gè)由50個(gè)3*3的filter之后,輸出變?yōu)?strong>50*11*11;

  之后經(jīng)過(guò)第二個(gè)2*2的池化層后,縮小后的輸出尺寸變?yōu)?strong>50*5*5(這里由于輸入為基數(shù),最后一格就忽略掉了)。

  而在卷積層中,filter的參數(shù)數(shù)量是在變化的,在第一個(gè)卷積層的參數(shù)為3*3=9個(gè),這個(gè)比較好理解;

  而在第二個(gè)卷積層中,參數(shù)就變成了225個(gè),這是因?yàn)樯弦粚拥妮敵鰹?5*13*13大小的圖片,這時(shí)是帶有channel的(就相當(dāng)于一開始輸入為RGB時(shí),通道數(shù)為3)當(dāng)使用3*3的filter進(jìn)行處理時(shí),需要帶有深度25,因此每個(gè)filter的參數(shù)數(shù)量為25*3*3=225。

  然后就是經(jīng)過(guò)Faltten和fully-connection了,這個(gè)與之前的神經(jīng)網(wǎng)絡(luò)一致:

  然后就可以對(duì)模型進(jìn)行訓(xùn)練了。這里要注意的是,這里的輸入跟全連接有所不同,要把輸入圖片數(shù)據(jù)轉(zhuǎn)化為(28,28,1)的格式。完整代碼如下:

from sklearn.datasets import fetch_openmlfrom sklearn.preprocessing import OneHotEncoderfrom sklearn.model_selection import train_test_splitimport numpy as npfrom keras import Sequentialfrom keras.layers import Densefrom keras.layers import Activationfrom keras.layers import Convolution2D, MaxPooling2D, Flattendata_x, data_y = fetch_openml(mnist_784, version=1, return_X_y=True)x = []for i in range(len(data_x)):    tmp = data_x.iloc[i, :].tolist()    tmp = np.array(tmp).reshape((28, 28, 1))    x.append(tmp)x = np.array(x)one_hot = OneHotEncoder()data_y = one_hot.fit_transform(np.array(data_y).reshape(data_y.shape[0], 1)).toarray()train_x, test_x, train_y, test_y = train_test_split(x, data_y)model2 = Sequential()model2.add(Convolution2D(25, 3, 3, input_shape=(28, 28, 1)))model2.add(MaxPooling2D((2, 2)))model2.add(Convolution2D(50, 3, 3))model2.add(MaxPooling2D((2, 2)))model2.add(Flatten())model2.add(Dense(units=100))model2.add(Activation(relu))model2.add(Dense(units=10))model2.add(Activation(softmax))model2.compile(optimizer=adam, loss=categorical_crossentropy, metrics=[accuracy])model2.fit(train_x, train_y, batch_size=300, epochs=20)

最后的輸出如下:

3.CNN都學(xué)到了啥?

  通過(guò)CNN的原理我們大致知道,CNN的卷積是不斷提取特征的過(guò)程,池化是對(duì)圖片的縮放,那么究竟CNN學(xué)習(xí)到了什么呢?如下面一張圖:

  給機(jī)器一張圖片,那么對(duì)人來(lái)說(shuō),這張圖片是一雙鞋,而對(duì)機(jī)器來(lái)說(shuō),它可能認(rèn)為是是美洲獅,因?yàn)閳D中的鞋標(biāo)有一只美洲獅。

  因此,我們想要知道CNN究竟學(xué)習(xí)到了啥,下面介紹幾種方法來(lái)查看CNN都在偵測(cè)什么特征的方法。

3.1 直接查看filter

  前面我們說(shuō)到,filter就是為了抓取某一種特征的,那么我們是不是可以看一下這些filter分別都是偵測(cè)什么樣的特征的。

  根據(jù)CNN的原理,隨著網(wǎng)絡(luò)越來(lái)越靠近輸出層,那么這一層所學(xué)習(xí)到的東西就越來(lái)越抽象,不太容易觀察。因此,我們選取第一個(gè)卷積層的filters來(lái)看一下。

  對(duì)于一個(gè)訓(xùn)練好的模型,將第一個(gè)卷積層的filters多帶帶拿出來(lái),并畫出來(lái),如圖所示:

  上面一共96個(gè)filter,每個(gè)filter的大小為11*11,從filter我們可以看出,上面幾排的filter主要是偵測(cè)形狀特征的,下面幾排的filter主要是偵測(cè)色彩特征的。

  我們也可以通過(guò)多帶帶看一個(gè)filter,然后把圖片依次輸入的CNN中,看哪些圖片經(jīng)過(guò)這個(gè)filter后的輸出(Activate)最大,如下圖所示:

  白色的框表示filter,這里白色的框看著很大,主要是因?yàn)檫@個(gè)filter比較靠后,也就是它所看到的是前面經(jīng)過(guò)縮小后的輸入,因此框就會(huì)變得很大。

  第一排的圖片中的框是一個(gè)filter1,可以看到,這個(gè)filter對(duì)于臉部的偵測(cè)比較強(qiáng);

  第二排的框是另一個(gè)filter2,可以看到filter2偵測(cè)的主要是洞狀排列的特征;

  第三排的filter3則是偵測(cè)紅色的特征;

  以此類推...

3.2 特征的可視化

  這種方法是查看特征的,也就是說(shuō)使用反卷積、反池化的方法,來(lái)可視化輸入圖像的激活特征。

  還用原理部分那個(gè)CNN結(jié)構(gòu)的例子,如下圖左邊的結(jié)構(gòu):

                           

  在第二個(gè)卷積層中,假設(shè)第k個(gè)filter,它與輸入作用以后得到的結(jié)果如上圖中右側(cè),每一個(gè)元素aij,然后把a(bǔ)ij相加,即為ak,即:

  那么現(xiàn)在我們想要通過(guò)輸入x使得ak最大,也就是找一張圖片x,使得ak的輸出最大,即:

這里就要利用gradient ascent的方法去找這個(gè)最大值了,即求:

  就相當(dāng)于原先經(jīng)過(guò)卷積、池化過(guò)程,現(xiàn)在要將x當(dāng)做未知量,反過(guò)來(lái)求反池化、反卷積去求解出一個(gè)使得ak最大的x注意這里x并不是真正的圖片了,相當(dāng)于是通過(guò)反池化和反卷積所得到的的帶有一些特征的圖像);

  具體原因就在于反池化和反卷積的求解過(guò)程,無(wú)法還原為原先的圖片,這里暫不過(guò)多介紹如何反池化和反卷積的原理,后續(xù)再補(bǔ)充。

  那么經(jīng)過(guò)上面的步驟,還原得到的x的結(jié)果如圖所示:

   一共50個(gè)filter,這里取前12個(gè),每個(gè)圖片的意思代表1個(gè)filter所還原得到的圖片x,也就是說(shuō),比如第一張圖片,將其作為input丟進(jìn)上面那個(gè)網(wǎng)絡(luò)后,其輸出與第一個(gè)filter作用后得到的ak最大。

  仔細(xì)觀察一下上面的圖,還是有一定的規(guī)律可循的。

  同時(shí)我們也可以去查看fully-connection部分的神經(jīng)元,原理跟上面一樣,不過(guò)再求解釋時(shí)又多了一層反向傳播的過(guò)程,如圖:

  當(dāng)然也可以去拿輸出層的神經(jīng)元,比如識(shí)別結(jié)果為0,輸出層在第0維值就很大,然后一樣根據(jù)上面的原理得到的結(jié)果如圖:

  會(huì)發(fā)現(xiàn)得到的結(jié)果什么也看不到,但是當(dāng)把某張圖片再次輸入進(jìn)網(wǎng)絡(luò)之后,得到的確實(shí)是對(duì)應(yīng)的結(jié)果。

  這也就說(shuō)明了深度學(xué)習(xí)很容易被欺騙,但從側(cè)面也反映出了,深度學(xué)習(xí)確實(shí)學(xué)習(xí)到了某些特征,并非僅僅簡(jiǎn)單“記住”數(shù)據(jù),也說(shuō)明深度學(xué)習(xí)的“玄學(xué)”性,難以解釋

  當(dāng)然,在上面的求解過(guò)程中,我們可以適當(dāng)加一些限制,比如正則化:

  那么得到的結(jié)果如圖:

  發(fā)現(xiàn)結(jié)果稍微清晰了一些,有些能夠看到一些筆畫。

  那么正則化的目的是在保證y越大越高的同時(shí),也要使得xij(圖片中的每一個(gè)pixel)越小越好,也就是說(shuō)對(duì)于圖片顯示(白色的是筆畫,黑色的是空白)時(shí),盡可能使空白減少,能連的連起來(lái)。所以效果會(huì)好些。

3.3 微分

  對(duì)于一張圖片的識(shí)別,我們可以計(jì)算類別y對(duì)圖像像素pixel的微分的值:

  通過(guò)改變像素xij,來(lái)看這個(gè)像素對(duì)識(shí)別的影響是否重要,也就是說(shuō),當(dāng)xij稍微做一下改變,對(duì)識(shí)別的結(jié)果影響有多大,用這樣的方法可以得到如下的結(jié)果:

  白色區(qū)域表示對(duì)識(shí)別影響較為重要的pixel,可以大概看到一些形狀。那這樣做有什么意義呢?

  有時(shí)當(dāng)我們從網(wǎng)上爬取圖片進(jìn)行建模后,發(fā)現(xiàn)對(duì)馬的識(shí)別率很高,但對(duì)其他的識(shí)別一般,這是因?yàn)榭赡荜P(guān)于“馬”的圖片都包含“horse”字樣的標(biāo)簽,機(jī)器真正識(shí)別到的是“horse”的標(biāo)簽,而并非知道馬長(zhǎng)什么樣子。

  同樣的道理,我們可以通過(guò)蓋住圖片的一部分,去看看蓋住的部分結(jié)果的影響有多大,比如:

  圖中灰色的區(qū)域是被蓋住的,不斷移動(dòng)灰色的區(qū)域,看對(duì)結(jié)果的影響有多大,那么可以獲取到下面一樣的熱力圖:

  圖中顏色越淺表示對(duì)辨識(shí)的結(jié)果影響越大,越不能辨別出是什么,可以看到,第一張當(dāng)蓋住狗的臉的時(shí)候,很難分辨出狗;

  第二張圖片當(dāng)蓋住輪胎部分的時(shí)候,就很難辨別出輪胎;

  第三張圖片當(dāng)蓋住狗的身子的部分,就很難辨別出狗了。

  更多有關(guān)CNN可視化的內(nèi)容,可搜索一些有關(guān)博客進(jìn)行學(xué)習(xí):https://blog.csdn.net/xys430381_1/article/details/90413169

4.關(guān)于CNN一些有趣的應(yīng)用

  根據(jù)上面的理論,我們可以通過(guò)修改某個(gè)filter的參數(shù),去還原出一張另類的圖片,比較有趣的應(yīng)用有deep dream和風(fēng)格遷移,如下圖(圖片來(lái)源于網(wǎng)絡(luò)):

這里就暫時(shí)不具體介紹原理了,后面會(huì)找一些開源的項(xiàng)目去玩。

 

參考資料:臺(tái)大李宏毅《機(jī)器學(xué)習(xí)-卷積神經(jīng)網(wǎng)絡(luò)》


 

上面是對(duì)CNN進(jìn)行的一個(gè)初步的介紹,后面會(huì)對(duì)深度學(xué)習(xí)部分進(jìn)行系統(tǒng)的學(xué)習(xí)和整理,這里主要是對(duì)原理有個(gè)初步的認(rèn)識(shí),因此很多都是概念性的東西,后續(xù)會(huì)進(jìn)一步添加補(bǔ)充。

 

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/125103.html

相關(guān)文章

  • 機(jī)器學(xué)習(xí)

    摘要:用離散信一文清晰講解機(jī)器學(xué)習(xí)中梯度下降算法包括其變式算法無(wú)論是要解決現(xiàn)實(shí)生活中的難題,還是要?jiǎng)?chuàng)建一款新的軟件產(chǎn)品,我們最終的目標(biāo)都是使其達(dá)到最優(yōu)狀態(tài)。 提高駕駛技術(shù):用GAN去除(愛情)動(dòng)作片中的馬賽克和衣服 作為一名久經(jīng)片場(chǎng)的老司機(jī),早就想寫一些探討駕駛技術(shù)的文章。這篇就介紹利用生成式對(duì)抗網(wǎng)絡(luò)(GAN)的兩個(gè)基本駕駛技能: 1) 去除(愛情)動(dòng)作片中的馬賽克 2) 給(愛情)動(dòng)作片中...

    wums 評(píng)論0 收藏0
  • 深度學(xué)習(xí)

    摘要:深度學(xué)習(xí)在過(guò)去的幾年里取得了許多驚人的成果,均與息息相關(guān)。機(jī)器學(xué)習(xí)進(jìn)階筆記之一安裝與入門是基于進(jìn)行研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng),被廣泛用于語(yǔ)音識(shí)別或圖像識(shí)別等多項(xiàng)機(jī)器深度學(xué)習(xí)領(lǐng)域。零基礎(chǔ)入門深度學(xué)習(xí)長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)。 多圖|入門必看:萬(wàn)字長(zhǎng)文帶你輕松了解LSTM全貌 作者 | Edwin Chen編譯 | AI100第一次接觸長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)時(shí),我驚呆了。原來(lái),LSTM是神...

    Vultr 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<