摘要:神經(jīng)網(wǎng)絡(luò)是一組特定的算法,對機器學(xué)習(xí)領(lǐng)域發(fā)生了革命性的變化。在這篇博客文章中,我想分享我認(rèn)為機器學(xué)習(xí)研究人員應(yīng)該熟悉的課程中的個神經(jīng)網(wǎng)絡(luò)架構(gòu),以推進他們的工作。卷積神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)研究一直以來都集中在對象檢測問題上。
摘要: 本文簡要講述了8種機器學(xué)習(xí)架構(gòu),希望可以給大家?guī)韼椭?/p>
在這篇文章中,我想與大家分享8個神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu),我相信任何一個機器學(xué)習(xí)的研究人員都應(yīng)該熟悉這一過程來促進他們的工作。
機器學(xué)習(xí)對于那些對人類來說太復(fù)雜而不能直接編碼的任務(wù)是必需的。有些任務(wù)非常復(fù)雜,因此人類不可能明確地計算出所有細(xì)微差別并對其進行編碼,這是不切實際的。相反,我們向機器學(xué)習(xí)算法提供大量數(shù)據(jù),讓算法通過探索數(shù)據(jù)并搜索一個能夠?qū)崿F(xiàn)程序員設(shè)定的模型來解決這個問題。
我們來看看這兩個例子:
編寫解決問題的程序非常困難,例如在一個混亂的場景中,新的光照條件下,從一個新穎的視角來識別三維物體。我們不知道要寫什么程序,因為我們不知道它是如何在我們的大腦中完成的。即使我們知道如何去做,這個程序可能會非常復(fù)雜。
很難編寫一個程序來計算信用卡交易欺詐的可能性??赡軟]有任何既簡單又可靠的規(guī)則。我們需要結(jié)合大量的弱規(guī)則。欺詐是一個移動的目標(biāo),而程序需要不斷變化。
然后是機器學(xué)習(xí)方法:我們不是為每個特定任務(wù)手動編寫程序,而是收集大量的例子來指定給定輸入的正確輸出。然后,機器學(xué)習(xí)算法就會使用這些例子,并生成一個執(zhí)行該任務(wù)的程序。學(xué)習(xí)算法產(chǎn)生的程序可能與典型的手寫程序看起來非常不同。它可能包含數(shù)百萬的數(shù)字。如果我們做得對,該計劃適用于新案例以及我們訓(xùn)練的案例。 如果數(shù)據(jù)發(fā)生變化,程序也可以通過對新數(shù)據(jù)進行訓(xùn)練來改變。你應(yīng)該注意到,大量的計算現(xiàn)在比付錢給某人編寫一個特定任務(wù)的程序要便宜。
鑒于此,機器學(xué)習(xí)最能解決的一些任務(wù)包括:
識別模式:真實場景中的物體,人臉識別或面部表情,口語單
識別異常:不尋常的信用卡交易序列,核電站傳感器讀數(shù)異常模式
預(yù)測:未來股票價格或貨幣匯率,將會感興趣的電影
神經(jīng)網(wǎng)絡(luò)是通用機器學(xué)習(xí)文獻中的一類模型。舉個例子,如果你參加一個關(guān)于機器學(xué)習(xí)的Coursera課程,神經(jīng)網(wǎng)絡(luò)很可能會被覆蓋。神經(jīng)網(wǎng)絡(luò)是一組特定的算法,對機器學(xué)習(xí)領(lǐng)域發(fā)生了革命性的變化。它們受到了生物神經(jīng)網(wǎng)絡(luò)的啟發(fā),目前所謂的深層神經(jīng)網(wǎng)絡(luò)已經(jīng)被證明非常有效。神經(jīng)網(wǎng)絡(luò)本身就是一般的函數(shù)逼近,這就是為什么它們幾乎可以應(yīng)用于幾乎任何機器學(xué)習(xí)問題,其中問題的關(guān)鍵是學(xué)習(xí)從輸入到輸出空間的復(fù)雜映射。
以下是說服你學(xué)習(xí)神經(jīng)計算的三個理由:
要理解大腦的實際工作原理:它非常龐大而且非常復(fù)雜,并且當(dāng)你戳到它時會死掉。所以我們需要使用計算機模擬。
了解受神經(jīng)元及其適應(yīng)性連接啟發(fā)的并行計算風(fēng)格:這是一種與順序計算非常不同的風(fēng)格。
用新的學(xué)習(xí)算法來解決實際問題:學(xué)習(xí)算法是非常有用的,即使它們不是大腦實際工作的方式。
在完成著名的Andrew Ng的機器學(xué)習(xí)Coursera課程后,我開始對神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)產(chǎn)生興趣。因此,我開始尋找最好的在線資源來了解這些主題,并找到了Geoffrey Hinton的機器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)課程。如果你是一個深度學(xué)習(xí)實踐者或想要進入深度學(xué)習(xí)/機器學(xué)習(xí)世界的人,你應(yīng)該真的參加這門課程。Geoffrey Hinton毫無疑問是深度學(xué)習(xí)世界的教父。而且他在這門課程中提供了一些特別的東西。在這篇博客文章中,我想分享我認(rèn)為機器學(xué)習(xí)研究人員應(yīng)該熟悉的課程中的8個神經(jīng)網(wǎng)絡(luò)架構(gòu),以推進他們的工作。
通常,這些體系結(jié)構(gòu)可以分為3個特定的類別:
1.前饋神經(jīng)網(wǎng)絡(luò)
這些是實際應(yīng)用中最常見的神經(jīng)網(wǎng)絡(luò)類型。第一層是輸入,最后一層是輸出。如果有多個隱藏層,我們稱它們?yōu)椤吧顚印?神經(jīng)網(wǎng)絡(luò)。它們計算出一系列改變案例之間相似性的轉(zhuǎn)變。每層神經(jīng)元的活動都是下層中活動的非線性函數(shù)。
2.遞歸神經(jīng)網(wǎng)絡(luò)
它們在它們的連接圖中有直接的循環(huán)。這意味著你有時可以回到你開始的地方。它們可能有復(fù)雜的動態(tài),這可能會使它們很難訓(xùn)練。 它們更具生物現(xiàn)實性。
目前在尋找有效的訓(xùn)練回歸網(wǎng)方面有很多的興趣。遞歸神經(jīng)網(wǎng)絡(luò)是建模時序數(shù)據(jù)的一種非常自然的方法。它們相當(dāng)于每個時間片具有一個隱藏層的非常深的網(wǎng)絡(luò); 除了它們在每個時間片上使用相同的權(quán)重并且它們在每個時間片都得到輸入。它們有能力長時間記住隱藏狀態(tài)的信息,但很難訓(xùn)練它們使用這種潛力。
3.對稱連接網(wǎng)絡(luò)
這些就像遞歸網(wǎng)絡(luò),但是單元之間的連接是對稱的(它們在兩個方向上具有相同的權(quán)重)。對稱網(wǎng)絡(luò)比遞歸網(wǎng)絡(luò)更容易分析。 因為它們服從能量函數(shù),所以它們在做的事情上也受到更多的限制。沒有隱藏單元的對稱連接的網(wǎng)絡(luò)被稱為“霍普菲爾德網(wǎng)絡(luò)”。具有隱藏單元的對稱連接網(wǎng)絡(luò)稱為“玻爾茲曼機器”。
考慮到第一代神經(jīng)網(wǎng)絡(luò),感知器只是單個神經(jīng)元的計算模型。它們是由Frank Rosenblatt在20世紀(jì)60年代早期推廣的。它們似乎有一個非常強大的學(xué)習(xí)算法,并且為它們可以學(xué)習(xí)的東西做了很多重大的宣傳。1969年,Minsky和Papers發(fā)表了一本名為《感知器》的書,分析了它們可以做什么并展示了它們的局限性。許多人認(rèn)為這些限制適用于所有的神經(jīng)網(wǎng)絡(luò)模型。然而,感知器學(xué)習(xí)過程在今天仍然被廣泛地應(yīng)用于包含數(shù)百萬個特性的巨大特征向量的任務(wù)。
在統(tǒng)計模式識別的標(biāo)準(zhǔn)范例中,我們首先將原始輸入向量轉(zhuǎn)換為特征激活向量。 然后,我們使用基于常識的手寫程序來定義特征。 接下來,我們將學(xué)習(xí)如何對每個特征激活進行加權(quán)以獲得單個標(biāo)量數(shù)量。如果這個數(shù)量高于某個閾值,我們就決定輸入向量是目標(biāo)類的一個正面例子。
標(biāo)準(zhǔn)的感知器體系結(jié)構(gòu)遵循前饋模型,這意味著輸入被發(fā)送到神經(jīng)元中,被處理并產(chǎn)生輸出。在下面的圖中,這意味著網(wǎng)絡(luò)是自下而上的:輸入來自底部,輸出從頂部輸出。
然而,感知器確實有局限性:如果你遵循手動選擇特性并使用足夠的特性,那么你幾乎可以做任何事情。對于二元輸入向量,我們可以為每個指數(shù)多的二進制向量分別設(shè)置一個特征單元,因此我們可以對二進制輸入向量進行任何可能的區(qū)分。但是,一旦確定了手工編碼的特性,就會對感知器的學(xué)習(xí)有很大的限制。
這個結(jié)果對感知器來說是毀滅性的,因為整個模式識別的重點是識別模式,盡管像翻譯這樣的轉(zhuǎn)換。Minsky和Papert的“群體不變定理”說,如果轉(zhuǎn)化形成一個群體,學(xué)習(xí)感知器的部分不能學(xué)會這樣做。為了處理這種轉(zhuǎn)換,感知器需要使用多個特征單元來識別信息性子模式的轉(zhuǎn)換。所以模式識別的棘手部分必須通過手動編碼特征檢測器來解決,而不是學(xué)習(xí)過程。
沒有隱藏單元的網(wǎng)絡(luò)在它們可以學(xué)習(xí)建模的輸入輸出映射方面非常有限。更多層次的線性單元不起作用。它仍然是線性的。固定輸出非線性是不夠的。 因此,我們需要多層自適應(yīng)非線性隱藏單元。 但我們?nèi)绾斡?xùn)練這樣的網(wǎng)?我們需要一種有效的方法來適應(yīng)所有的權(quán)重,而不僅僅是最后一層。這是很難的。學(xué)習(xí)進入隱藏單位的權(quán)重等同于學(xué)習(xí)功能。這很難,因為沒有人直接告訴我們隱藏單位應(yīng)該做什么。
2.卷積神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)研究一直以來都集中在對象檢測問題上。有很多東西讓我們很難識別物體:
分割:真實場景與其他對象混雜在一起。很難分辨哪些部分是同一個對象的一部分。對象的某些部分可以隱藏在其他對象后面。
照明:像素的強度取決于物體的照明程度。
變形:物體以各種非仿射方式變形。一個手寫的也可以有一個大的圈,或者只是一個尖頭。
可用性:對象類通常由它們的使用方式來定義。例如,椅子是專為坐著而設(shè)計的,因此它們具有各種各樣的外形。
觀點:觀點的改變導(dǎo)致標(biāo)準(zhǔn)學(xué)習(xí)方法無法處理的圖像變化。輸入維度(即像素)之間的信息跳躍。
設(shè)想一個醫(yī)學(xué)數(shù)據(jù)庫,其中患者的年齡有時希望達(dá)到通常編碼體重的輸入維度! 為了應(yīng)用機器學(xué)習(xí),我們首先要消除這種維度跳躍。
復(fù)制特征方法是目前神經(jīng)網(wǎng)絡(luò)解決目標(biāo)檢測問題的主要方法。它使用不同位置的同一功能檢測器的許多不同副本。它也可以在規(guī)模和方向上進行復(fù)制,這很棘手,也很昂貴。
復(fù)制大大減少了要學(xué)習(xí)的可用參數(shù)的數(shù)量。它使用了幾種不同的特性類型,每個特征類型都有自己的復(fù)制檢測器映射。它還允許每個圖像塊以多種方式表示。
那么復(fù)制特征探測器是如何實現(xiàn)的?等效活動:復(fù)制的特性不會使神經(jīng)活動不變量轉(zhuǎn)換。這些活動是等變的。
不變知識:如果在訓(xùn)練過程中某個特性在某些位置有用,那么在測試期間,該特性的檢測器將在所有位置都可用。
1998年,Yann LeCun和他的合作者開發(fā)出了一種名為LeNet的手寫數(shù)字識別器。它在具有許多隱藏層的前饋網(wǎng)中使用反向傳播,在每層中復(fù)制單元的許多映射,匯集附近復(fù)制單元的輸出,即使它們重疊也能夠一次處理幾個字符的寬網(wǎng),以及聰明的訓(xùn)練一個完整的系統(tǒng),而不僅僅是一個識別器。后來,它被命名為卷積神經(jīng)網(wǎng)絡(luò)。 有趣的事實:這個網(wǎng)絡(luò)用于讀取北美地區(qū)約10%的支票。
卷積神經(jīng)網(wǎng)絡(luò)可以用于所有與物體識別有關(guān)的工作,從手寫數(shù)字到3D對象。然而,從網(wǎng)上下載彩色照片中的真實物體要比識別手寫數(shù)字復(fù)雜得多。有100倍的類(1000比10),100倍的像素(256 x 256色vs 28 x 28灰色),二維圖像的三維場景,雜亂的場景需要分割,以及每個對象中有多個對象圖片。相同類型的卷積神經(jīng)網(wǎng)絡(luò)會起作用嗎?
之后,ILSVRC-2012競賽在ImageNet上進行,該數(shù)據(jù)集包含大約120萬張高分辨率訓(xùn)練圖像。測試圖像將顯示沒有初始注釋(無分割或標(biāo)簽),算法將不得不產(chǎn)生指定圖像中存在什么對象的標(biāo)簽。一些最優(yōu)秀的計算機視覺方法是通過來自牛津,INRIA, XRCEa的計算機視覺組來測試的。通常,計算機視覺系統(tǒng)使用復(fù)雜的多級系統(tǒng)和早期通常是手工調(diào)整通過優(yōu)化幾個參數(shù)。
大賽的獲勝者Alex Krizhevsky(NIPS 2012)開發(fā)了一種非常復(fù)雜的神經(jīng)網(wǎng)絡(luò),由Yann LeCun首創(chuàng)。它的體系結(jié)構(gòu)包括7個隱藏層,而不包括一些混合池。早期的層是卷積的,而最后兩層是全局連接的。激活函數(shù)在每個隱藏層中被糾正為線性單位。這些訓(xùn)練比物流單位訓(xùn)練速度更快,表現(xiàn)力更強。除此之外,當(dāng)附近的單位有更強的活動時,它還使用競爭性標(biāo)準(zhǔn)化來壓制隱藏的活動。這有助于強度的變化。
有幾個技術(shù)訣竅可以顯著提高神經(jīng)網(wǎng)絡(luò)的泛化程度:
從256 x 256圖像中隨機抽取224 x 224個補丁,以獲得更多的數(shù)據(jù),并使用圖像的左右反射。在測試時,結(jié)合10個不同補丁的意見:4個224 x 224角補丁加上中央224 x 224補丁加上這5個補丁的反射。
使用dropout在全局連接的層中調(diào)整權(quán)重(包含大多數(shù)參數(shù))。中途退出意味著每一個訓(xùn)練實例中,有一半的隱藏單元被隨機移除。這阻止了隱藏單位過多地依賴其他隱藏單位。
就硬件要求而言,Alex在2個Nvidia GTX 580 GPU(超過1000個快速小內(nèi)核)上使用了非常高效的卷積網(wǎng)絡(luò)實現(xiàn)。GPU非常適合矩陣矩陣乘法,并且還具有非常高的內(nèi)存帶寬。這使他可以在一周內(nèi)訓(xùn)練網(wǎng)絡(luò),并使測試時快速結(jié)合10個補丁的結(jié)果。如果我們能夠以足夠快的速度交流狀態(tài),我們可以在許多核心上擴展網(wǎng)絡(luò)。隨著核心越來越便宜,數(shù)據(jù)集越來越大,大型神經(jīng)網(wǎng)絡(luò)將比老式計算機視覺系統(tǒng)提高得更快。
下文中我們繼續(xù)介紹另外6種神經(jīng)網(wǎng)絡(luò)架構(gòu),希望可以給大家?guī)韼椭?/p>
文章原標(biāo)題《The 8 Neural Network Architectures Machine Learning Researchers Need to Learn》
作者:Nand Kishor,譯者:董昭男,審校:
詳情請閱讀原文
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/11862.html
摘要:它是第一個能夠?qū)W習(xí)內(nèi)部表示的神經(jīng)網(wǎng)絡(luò)之一,能夠代表和解決困難的組合問題。在普通玻爾茲曼機器中,單位的隨機更新需要是連續(xù)的。 上文講述了機器學(xué)習(xí)的功能和神經(jīng)網(wǎng)絡(luò)的概念,以及簡要介紹了感知器和卷積神經(jīng)網(wǎng)絡(luò),接下來繼續(xù)介紹另外6種神經(jīng)網(wǎng)絡(luò)架構(gòu)。 3.遞歸神經(jīng)網(wǎng)絡(luò) showImg(https://segmentfault.com/img/bV8Hvo?w=2000&h=682); 為了理解RN...
摘要:近幾年,深度學(xué)習(xí)高速發(fā)展,出現(xiàn)了大量的新模型與架構(gòu),以至于我們無法理清網(wǎng)絡(luò)類型之間的關(guān)系。是由深度學(xué)習(xí)先驅(qū)等人提出的新一代神經(jīng)網(wǎng)絡(luò)形式,旨在修正反向傳播機制。當(dāng)多個預(yù)測一致時本論文使用動態(tài)路由使預(yù)測一致,更高級別的將變得活躍。 近幾年,深度學(xué)習(xí)高速發(fā)展,出現(xiàn)了大量的新模型與架構(gòu),以至于我們無法理清網(wǎng)絡(luò)類型之間的關(guān)系。在這篇文章中,香港科技大學(xué)(HKUST)助理教授金成勳總結(jié)了深度網(wǎng)絡(luò)類型之間...
閱讀 1034·2023-04-25 22:27
閱讀 879·2021-11-22 14:56
閱讀 995·2021-11-11 16:54
閱讀 1695·2019-08-30 15:54
閱讀 3512·2019-08-30 13:20
閱讀 1220·2019-08-30 10:55
閱讀 2090·2019-08-26 13:34
閱讀 3290·2019-08-26 11:53