深度學(xué)習(xí)的下一個熱點——GANs將改變世界

ningwang 發(fā)布于2019-04-25 18:07 / 2343人閱讀

摘要：生成式對抗網(wǎng)絡(luò)簡稱將成為深度學(xué)習(xí)的下一個熱點，它將改變我們認知世界的方式。配圖針對三年級學(xué)生的對抗式訓(xùn)練屬于你的最嚴厲的批評家五年前，我在哥倫比亞大學(xué)舉行的一場橄欖球比賽中傷到了自己的頭部，導(dǎo)致我右半身腰部以上癱瘓。

本文作者 Nikolai Yakovenko 畢業(yè)于哥倫比亞大學(xué)，目前是 Google 的工程師，致力于構(gòu)建人工智能系統(tǒng)，專注于語言處理、文本分類、解析與生成。

生成式對抗網(wǎng)絡(luò)—簡稱GANs—將成為深度學(xué)習(xí)的下一個熱點，它將改變我們認知世界的方式。

準(zhǔn)確來講，對抗式訓(xùn)練為指導(dǎo)人工智能完成復(fù)雜任務(wù)提供了一個全新的思路，某種意義上他們（人工智能）將學(xué)習(xí)如何成為一個專家。

舉個對抗式訓(xùn)練的例子，當(dāng)你試圖通過模仿別人完成某項工作時，如果專家都無法分辨這項工作是你完成的還是你的模仿對象完成的，說明你已經(jīng)完全掌握了該工作的所需的技巧。對于像寫論文這樣復(fù)雜的工作，這個例子可能不適用，畢竟每個人的最終成果多少有些不同，但對于中等難度的任務(wù)，比如造句或?qū)懸欢卧?，對抗式?xùn)練大有用武之地，事實上它現(xiàn)在已經(jīng)是計算機生成真實圖像的關(guān)鍵所在了。

GANs解決問題的方式是用不同的目標(biāo)分別訓(xùn)練兩種不同的網(wǎng)絡(luò)。

? ? 一種網(wǎng)絡(luò)創(chuàng)造答案（生成方）

? ?另一種網(wǎng)絡(luò)分辨前者創(chuàng)造的答案與真實答案的區(qū)別（對抗方）

GANs的訣竅是這樣的：訓(xùn)練兩種網(wǎng)絡(luò)進行競爭，一段時間后，兩種網(wǎng)絡(luò)都無法在對抗中取得進步，或者生成方變得非常厲害以至于即使給定足夠的線索和時間，其對抗網(wǎng)絡(luò)也無法分辨它給的答案是真實的還是合成的。

這其中有很多有趣的細節(jié)，但我們暫時先忽略這些細節(jié)。GANs 可以在給定繪制圖像類別和隨機種子（random seed）的條件下，自主完成圖像的繪制：

“給我畫一只啄木鳥，并且它不能是我之前給你看過的那些啄木鳥?！?/p>

配圖：StackGAN繪制的合成鳥。

在數(shù)學(xué)方面, 谷歌研究中心的科學(xué)家們用GANs創(chuàng)造了一種編碼協(xié)議。GANs的生成方 Alice向Bob傳遞通過卷積神經(jīng)網(wǎng)絡(luò)編碼的信息以及密鑰。Eve則扮演對抗方，即可以拿到編碼的信息，但沒有密鑰。Eve訓(xùn)練網(wǎng)絡(luò)來分辨信息中的噪音和有價值的部分，然而對抗方失敗了，無法將上述兩個部分區(qū)分開來。

在這一網(wǎng)絡(luò)結(jié)構(gòu)興起的早期，以及現(xiàn)在，我還從未聽說哪個基于GAN的公開demo（演示程序）可以在完成某句話這一任務(wù)上媲美前饋LSTM。雖然前饋LSTM（比如Karpathy特征循環(huán)神經(jīng)網(wǎng)絡(luò)）僅僅是一個基準(zhǔn)（baseline），但可以想象遲早有一天，有人會創(chuàng)造出一個可以根據(jù)亞馬遜購物網(wǎng)站的商品打分來撰寫評論的GAN 來。

人類通過直接反饋來學(xué)習(xí)

對我來說，相比強化學(xué)習(xí)（RL）而言，對抗式學(xué)習(xí)更接近人類的學(xué)習(xí)方式。也許因為我是一個喜歡自己找自己麻煩的人吧。

RL通過較大化（平均）最終獎勵來達到訓(xùn)練目的。當(dāng)前的狀態(tài)也許與獎勵無關(guān)，但最終的結(jié)局一定會由“獎勵函數(shù)”給出。我已經(jīng)做過RL領(lǐng)域的一些工作，并且它也極大地促進了我們研究領(lǐng)域的發(fā)展，但是除非你是在玩游戲，否則很難寫出一個獎勵函數(shù)來較精確衡量來自周邊環(huán)境的反饋。

二十世紀90年代，強化學(xué)習(xí)在十五子棋游戲中取得巨大突破，它是DeepMind創(chuàng)造的AlphaGo的一個重要組成部分，DeepMind團隊甚至用RL來節(jié)省谷歌的數(shù)據(jù)中心的冷卻費用。

可以想象RL能在谷歌數(shù)據(jù)中心這一環(huán)境中，算得到一個最優(yōu)結(jié)果，因為獎勵函數(shù)（在防止溫度高于限定值的條件下盡可能省錢）可以很好地定義。這是真實世界可以像游戲一樣被參數(shù)化的例子，這樣的例子通常只能在好萊塢電影中見到。

對于那些更實際的問題，獎勵函數(shù)是什么呢？即使是類似游戲中的任務(wù)如駕駛，其目標(biāo)既不是盡快達到目的地，也并非始終待在道路邊界線內(nèi)。我們可以很容易地找到一個負獎勵（比如撞壞車輛，使乘客受傷，不合理地加速）但卻很難找到一個可以規(guī)范駕駛行為的正獎勵。

邊觀察，邊學(xué)習(xí)

我們是如何學(xué)習(xí)寫字的？除非你念的是要求很嚴格的小學(xué)，否則學(xué)習(xí)寫字的過程很難說是較大化某個與書寫字母有關(guān)的函數(shù)。最可能的情況是你模仿老師在黑板上的書寫筆順，然后內(nèi)化這一過程。

你的生成網(wǎng)絡(luò)書寫字母，而你的識別網(wǎng)絡(luò)（對抗方）觀察你的字體和教科書中理想字體的區(qū)別。?

配圖：針對三年級學(xué)生的對抗式訓(xùn)練

屬于你的最嚴厲的批評家

五年前，我在哥倫比亞大學(xué)舉行的一場橄欖球比賽中傷到了自己的頭部，導(dǎo)致我右半身腰部以上癱瘓。受傷兩周后我出了重癥監(jiān)護病房，開始教自己學(xué)習(xí)如何寫字。那時我住在布魯克林的公寓里。

配圖：再次學(xué)習(xí)如何寫字, 五月

我的左腦受到了嚴重的創(chuàng)傷，因此我失去了控制我右胳膊的能力。然而，我大腦的其余部分完好無損，因此我仍能夠識別正確的書寫方式。換句話說，我的文字生成網(wǎng)絡(luò)壞了，而識別網(wǎng)絡(luò)功能正常。

說句玩笑話，我很有可能因為這一過程學(xué)會一種新的（或更好的）書寫方式。然而結(jié)果是雖然我很快地教會了我自己如何書寫，但書寫筆跡和我受傷前的沒什么兩樣

我不知道我們的大腦是如何使用“行為人－批評家”的模式來學(xué)習(xí)的，我也不知道這種說法是事實還是僅僅是一個生動的比喻，但是可以確定的是在有一個專家即時反饋的條件下，我們可以更有效率地學(xué)習(xí)新東西。

當(dāng)學(xué)習(xí)編程或攀巖時，如果你一直接收某個專家的“beta（反饋建議）”，則可以進步得更快。在你獲得足夠的經(jīng)驗?zāi)軌蜃晕曳答伵u之前，有一個外部的批評家來糾正你每一小步的錯誤可以更容易訓(xùn)練你大腦的生成網(wǎng)絡(luò)。即使有一個內(nèi)部批評家在監(jiān)督你，學(xué)習(xí)一個有效的生成網(wǎng)絡(luò)仍然需要認真的練習(xí)。我們總不能把我們大腦的生成器換成亞馬遜推出的GPU實例吧。

擺脫糾結(jié)，勇往直前？

實際中，GANs 被用于解決這樣一些問題：為生成器生成的圖片添加一些真實的效果如銳化邊緣。盡管在這樣的圖片中，不一定每個動物都只有一個腦袋。

讓生成網(wǎng)絡(luò)與合適的對抗方競爭能迫使其做出取舍。正如我的一位同事所說，你面臨一個選擇，既可以畫一只綠色的鸚鵡，也可以畫一只藍色的鸚鵡，但是你畫的必須是其中之一。一個沒有對抗方的監(jiān)督網(wǎng)絡(luò)接受了真實鸚鵡的識別訓(xùn)練，會傾向于畫出某種摻雜藍色或綠色的平均色，導(dǎo)致其線條模糊不清。而一個對抗式網(wǎng)絡(luò)則可以畫出藍色或綠色的鸚鵡，也可以在利用鸚鵡的｛藍，綠｝概率分布隨機地選擇一種顏色。但它絕不會畫出某種自然鸚鵡不存在的中間色，當(dāng)然這種顏色也可能存在于已經(jīng)滅絕的鸚鵡上。

我的同事最近理清了關(guān)于GANs的思路，其中包括對GANs的收斂性和可推廣性的悲觀態(tài)度。

某種程度上，這是由于這種蹺蹺板式的訓(xùn)練方法——一會兒訓(xùn)練生成方，一會兒訓(xùn)練識別方，如此反復(fù)——并不能保證收斂于一個穩(wěn)定解，更別提一個最優(yōu)解了。如下圖Alex J Champandard的一則Twitter 所示：

配圖在twitter上是一個GIF圖片，通常情況生成方和對抗方在玩一個極限博弈游戲，但只要再走一步，其將陷入震蕩

但是讓我們忽略這些細節(jié)，做一些美好的想象吧。若LSTM模型能寫出調(diào)理清楚的產(chǎn)品評論、圖片標(biāo)題、或者在唐納德競選總統(tǒng)時代替他在twitter上發(fā)聲（反正競選前夜他會保持沉默），那稍微聰明一點的識別器應(yīng)該都能提高這些任務(wù)的表現(xiàn)吧。

假設(shè)LSTM是隨機生成這些結(jié)果的，我們可以利用既有的生成器生成相應(yīng)的結(jié)果，再讓識別器從生成結(jié)果中較好的20個中選出最合適的。這不正是DeepDrumpf背后的運營團隊所做的事情嗎？

twitter中文字：對于facebook和twitter而言，我一直是一個完全的災(zāi)難，而且現(xiàn)在比以往更加嚴重了

生成器和識別器，誰更聰明？

一個問題自然而然地出現(xiàn)了——到底哪種網(wǎng)絡(luò)能夠真正理解所面臨問題，是生成器還是識別器？或者說究竟誰更會寫字，是寫字的學(xué)生，還是教寫字的老師？

現(xiàn)實世界通常是老師更會寫字，但在之前的例子中，我想應(yīng)該是學(xué)生更會寫字。因為一個用于識別產(chǎn)品評論的識別器只需知道一些常見的語法錯誤，就能投入使用。正如一個人像米開朗基羅一樣畫畫，一個人僅僅是抬頭看看西斯廷大教堂的天花板（上面有米開朗基羅的畫），誰需要更多的技巧呢？

正如我所理解的，手機圖像軟件Prisma在有對抗方的框架下，訓(xùn)練生成網(wǎng)絡(luò)，進行不同風(fēng)格的創(chuàng)作。大多數(shù)風(fēng)格正是通過這種方式生成了那些曲折的線條。我希望他們能增加訓(xùn)練GAN的時間，這樣GAN不僅能認出照片中的陰影,并給其涂上不同的顏色，還可能以一個印象派藝術(shù)家的風(fēng)格完成這些任務(wù)。當(dāng)它偶爾可以正確地區(qū)分光線和陰影的時候，那么它就是令人驚嘆的。

順著這條思路想下去可以得出一個很自然的結(jié)論，生成式對抗方法,可以讓人工智能有能力做實驗和A/B測試。一個人工智能模型給出了一個很好的解決方案，然后它搜集反饋來了解這個生成方案和標(biāo)準(zhǔn)答案是否相符，或與其他它正在學(xué)習(xí)或已經(jīng)內(nèi)化的人工智能模型比較，觀察得出的結(jié)果是否相符。在這一過程中，你沒必要去設(shè)計一個損失函數(shù)，因為雖然可能會花上一點時間,但這個人工智能模型終將找到自己的評判標(biāo)準(zhǔn)。

適可而止，見好就收

我寫了這整篇文章，卻還沒有親身嘗試一下對抗式網(wǎng)絡(luò)。本著模仿的心態(tài)，我期望其他人能夠在GANs上取得進步，較好是在文字生成領(lǐng)域取得突破。我預(yù)計很快就會有合適的技術(shù)，能夠良好運行并得到令人信服的結(jié)果。我們這個領(lǐng)域正是這樣，通過積累前人的經(jīng)驗而進步的。

與其去預(yù)測我沒有參與過的事，我更應(yīng)該花時間去優(yōu)化我的“撲克牌卷積神經(jīng)網(wǎng)絡(luò)”（PokerCNN）無限額德州撲克AI，為今年的年度計算機撲克大賽作準(zhǔn)備。其代碼將在2017年1月13日前完成。

在明年的比賽中我計劃添加一些對抗式訓(xùn)練。不難想象對抗式訓(xùn)練能夠幫助AI學(xué)習(xí)更好的撲克技巧。特別是當(dāng)對手也是很強大的黑箱AI時，這個方法更為有用。

既然是科學(xué)為目的，并且我的撲克牌AI代碼已經(jīng)開源了（在你看到這里時，我應(yīng)該已經(jīng)清理了代碼倉庫，并且添加了一個的readme幫助文檔，所以應(yīng)該可以更容易著手），所以請隨意拿去嘗試吧。

鏈接：向后看，向先看

如果沒有點出2016年深度學(xué)習(xí)領(lǐng)域中我最喜歡的幾大進步，那我就太怠惰了。以下列出了幾個我最愛的進步：

? ?2016年深度學(xué)習(xí)的主要進步： GANs, 非監(jiān)督學(xué)習(xí)領(lǐng)域的進步, 超分辨率,以及其他種種突破

? ?“我在神經(jīng)信息處理大會上學(xué)到的50樣?xùn)|西” 作者Andreas Stuhlmller

? ?以上幾條中我最喜歡的想法是：用不同的時期間隔來訓(xùn)練LSTM記憶單元，這樣可以迫使某些記憶單元記住長期信息，而其它的記憶單元可以更加關(guān)注短期記憶。這種方法更符合直覺，也避免了過多的超參數(shù)調(diào)優(yōu)

? ?大公司和有足夠資金的創(chuàng)業(yè)公司是否都在貪婪地尋找優(yōu)質(zhì)的深度學(xué)習(xí)數(shù)據(jù)？也許有專利的數(shù)據(jù)庫并不是所有人工智能的關(guān)鍵問題所在。并且維基百科也列出了一大堆免費的數(shù)據(jù)庫，包括前文提到的亞馬遜的商品評論。隨著很多公司繼續(xù)提供其擁有的大部分數(shù)據(jù)用于研究，以后將會涌現(xiàn)更多的數(shù)據(jù)。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報表系統(tǒng)等全方位知識

QQ群：81035754

GPU云服務(wù)器云服務(wù)器改變世界的編程語言物聯(lián)網(wǎng) 世界有怎樣的改變新一代云服務(wù)器改變的數(shù)智世界將OSS回滾到某一個時間

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/4444.html

發(fā)表評論

登陸后可評論

0條評論

ningwang

男|高級講師

我要關(guān)注我要私信

TA的文章

liteserver：荷蘭大硬盤vps;1核/1G內(nèi)存/512G HDD/1G帶寬/10T月流量,€

閱讀 1991·2021-09-26 10:19
Totyun：上新柬埔寨VPS，2核2G內(nèi)存，10Mps Premium 中國，$12/月起

閱讀 3265·2021-09-24 10:25
UCloud優(yōu)刻得海外混合云上線實現(xiàn)全球混合多云互聯(lián)

閱讀 1653·2019-12-27 11:39
原生JS實現(xiàn)滑動輪播圖

閱讀 1935·2019-08-30 15:43
為你推薦幾款開發(fā)常用的代碼編輯器

閱讀 683·2019-08-29 16:08
css 響應(yīng)式（媒介查詢）

閱讀 3515·2019-08-29 16:07
深入了解JS數(shù)組的常用方法

閱讀 915·2019-08-26 11:30
vue-router 基礎(chǔ)知識點

閱讀 1278·2019-08-26 10:41

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)的下一個熱點——GANs將改變世界

相關(guān)文章

火熱的生成對抗網(wǎng)絡(luò)（GAN），你究竟好在哪里

Google GAN之父 ICCV2017演講：解讀生成對抗網(wǎng)絡(luò)的原理與應(yīng)用

**OpenAI Ian Goodfellow的Quora問答：高歌猛進的機器學(xué)習(xí)人生**

**“未卜先知”、“自學(xué)成才”：GANs奇思妙想TOP10榜單**

**時下火熱的wGAN將變革深度學(xué)習(xí)？這得從源頭講起**

發(fā)表評論

0條評論

ningwang

男|高級講師

TA的文章

liteserver：荷蘭大硬盤vps;1核/1G內(nèi)存/512G HDD/1G帶寬/10T月流量,€

Totyun：上新柬埔寨VPS，2核2G內(nèi)存，10Mps Premium 中國，$12/月起

UCloud優(yōu)刻得海外混合云上線實現(xiàn)全球混合多云互聯(lián)

原生JS實現(xiàn)滑動輪播圖

為你推薦幾款開發(fā)常用的代碼編輯器

css 響應(yīng)式（媒介查詢）

深入了解JS數(shù)組的常用方法

vue-router 基礎(chǔ)知識點

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)的下一個熱點——GANs將改變世界

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！