摘要:我認(rèn)為在大多數(shù)深度學(xué)習(xí)中,算法層面上隨機(jī)梯度的下降是大家所認(rèn)可的。但目前似乎存在兩個(gè)問題計(jì)算層面納什平衡達(dá)不到可能會(huì)退化。
去年我一直在研究如何更好地調(diào)整GANs中的不足,但因?yàn)橹暗难芯糠较蛑魂P(guān)注了損失函數(shù),完全忽略了如何尋找極小值問題。直到我看到了這篇論文才有所改變:
詳解論文: The Numerics of GANs
我參考了Mar的三層分析,并在計(jì)算層面上仔細(xì)考慮了這個(gè)問題:我們這樣做的最終目標(biāo)是什么?我相信GANs在這個(gè)層面已經(jīng)有所突破了,因?yàn)樗麄冊(cè)噲D優(yōu)化錯(cuò)誤的東西或?qū)で蟛淮嬖诘钠胶獾?。這就是為什么我喜歡f-GANs、Wasserstein GANs、實(shí)例噪聲,而不大喜歡在優(yōu)化層面上做一些修復(fù)的嘗試:比如DCGAN或改進(jìn)技術(shù)(Salimans等,2016)等原因。我認(rèn)為在大多數(shù)深度學(xué)習(xí)中,算法層面上隨機(jī)梯度的下降是大家所認(rèn)可的。你可以去提升它,但是如果沒有突破性進(jìn)展,它通常不需要修復(fù)。
但閱讀本文后,我有一個(gè)啟示:
GANs可以同時(shí)在計(jì)算層面和算法層面有所突破
即使我們修復(fù)了目標(biāo),我們也沒有算法工具來尋找實(shí)際解決方案。
文章摘要:
結(jié)合我目前在研究的內(nèi)容,我將通過一個(gè)不同的視覺來分析該論文
介紹關(guān)于收斂與不收斂的矢量場(chǎng)的概念,并強(qiáng)調(diào)其一些屬性然后描述Mescheder等人文章提出的 consensus、optimization等方面的一些結(jié)論:在復(fù)雜的不收斂矢量場(chǎng)與理想的收斂矢量場(chǎng)之間進(jìn)行插值
最后,正如我研究的期望那樣,我還強(qiáng)調(diào)了另一個(gè)重要的細(xì)節(jié),一個(gè)在文中沒有討論的:我們應(yīng)該如何在小批量設(shè)置中做到所有這些?
簡(jiǎn)介:從GAN到矢量場(chǎng)
GANs可以被理解為博弈游戲(一個(gè)各不相互合作的雙人游戲)。一個(gè)玩家控制θ并希望較大化其收益f(θ,φ),另一個(gè)控制φ并尋求較大化g(θ,φ)。當(dāng)兩個(gè)玩家都不再會(huì)通過改變參數(shù)來提高收益的時(shí)候游戲就達(dá)到了納什均衡。因此,現(xiàn)在我們必須要設(shè)計(jì)一個(gè)算法來幫助達(dá)到這個(gè)納什均衡。
但目前GANs似乎存在兩個(gè)問題:
1.計(jì)算層面:納什平衡(Nash equilibrium)達(dá)不到可能會(huì)退化。
2.算法層面:我們依然還沒有找到可靠的工具來達(dá)到納什均衡(即使我們現(xiàn)在的算法能很好的收斂到局部納什均衡)。
Mescheder等在2017年非常成功地解決了第二個(gè)問題,為了找到納什均衡,我們較好的工具是同步梯度上升算方法,一個(gè)由以下遞歸定義的迭代算法:
起初大家覺得這是一個(gè)重要的發(fā)現(xiàn),可能看起來還挺矛盾的:將GANs訓(xùn)練視為神經(jīng)網(wǎng)絡(luò)訓(xùn)練的一個(gè)特殊例子是很自然的,但實(shí)際上它是另外一種方法。
同步梯度下降算法(simultaneous gradient descent)是梯度下降算法的概括,而不是特例。
不收斂的矢量場(chǎng)
普通梯度下降算法與同步梯度下降算法(simultaneous gradient descent)的一個(gè)關(guān)鍵區(qū)別在于,前者只能夠收斂到向量場(chǎng)的固定點(diǎn),后者可以處理不收斂的向量場(chǎng)。因此,我想花大部分在這篇文章里談?wù)撨@個(gè)差異以及這些術(shù)語是什么意思。
我們經(jīng)常在機(jī)器學(xué)習(xí)中遇到的則是另一個(gè)種(但不經(jīng)常將其視為矢量場(chǎng))是由自動(dòng)編碼器定義的矢量場(chǎng)。 AE的輸入一些向量x,并返回另一個(gè)相同大小的向量v(x)。比如在圖5是Alain和Bengio在201年對(duì)2D數(shù)據(jù)的自動(dòng)編碼去噪聲的矢量場(chǎng)訓(xùn)練,效果相當(dāng)不錯(cuò):
由AE定義的矢量場(chǎng)不一定是收斂的,這意味著可能會(huì)產(chǎn)生一些不確定性的奇奇怪怪的問題。會(huì)有什么樣的奇怪的事情產(chǎn)生呢?讓我們來看一個(gè)極端的例子:恒定卷積矢量場(chǎng),這是一個(gè)非常典型的不收斂矢量場(chǎng)例子:
這個(gè)向量場(chǎng)在零和游戲中經(jīng)常出現(xiàn)(譯者注:zero-sum game就是指“零和博弈”,指參與博弈的各方,在嚴(yán)格競(jìng)爭(zhēng)下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠(yuǎn)為“零”,雙方不存在合作的可能),其中。這和Salimans等人在2016年論文“Improved Techniques for Training GANs”中第3節(jié)里面提到的對(duì)抗生成網(wǎng)絡(luò)的框架里的一個(gè)小例子非常相似。如同在圓圈中的矢量場(chǎng),可以很明顯的看到它 場(chǎng)中的旋轉(zhuǎn)。事實(shí)上,如果你沿著這個(gè)矢量場(chǎng)(同時(shí)這也是梯度下降的方向)的箭頭,你最終會(huì)進(jìn)入圈子里,如圖所示:
可以把此矢量比作與埃舍爾的《不可思議城堡》(譯者注:埃舍爾,荷蘭 版畫家,因其繪畫中的數(shù)學(xué)性而聞名,有興趣的可以看看《不可能存在的存在》:http://www.360doc.com/content/17/0705/08/27794381_668875548.shtml)。在埃舍爾的“不可能存在的城堡”中,仆人認(rèn)為他們正在上臺(tái)階或者是在下臺(tái)階,但實(shí)際上他們所做的都是圍繞著圈子。當(dāng)然如果要將Escher的城堡構(gòu)建成是一個(gè)真正的3D 模型則是不可能的。類似地,不可能將卷積矢量場(chǎng)表示為標(biāo)量函數(shù)的梯度。
一個(gè)壞消息是,即使旋度場(chǎng)在處具有平衡點(diǎn),同步梯度下降算法也將永遠(yuǎn)發(fā)現(xiàn)不了。雖然我們我們共認(rèn)梯度下降算法能在局部收斂到最小值,但是同步下降算法一般不能收斂到均衡點(diǎn)。它會(huì)陷入一個(gè)死循環(huán),基于動(dòng)量的變量甚至可以積累無限的動(dòng)量直到完全崩潰。
一致優(yōu)化方法(Consensus optimization):訓(xùn)練一個(gè)不收斂的矢量場(chǎng)
Mescheder等人提出的解決方案是從原始構(gòu)造一個(gè)收斂的矢量場(chǎng),如下:?因?yàn)槲覀儗⑺x為標(biāo)量函數(shù)L的梯度,這顯然是收斂的。很容易看出,這個(gè)新的矢量場(chǎng)-?L具有與v相同的固定點(diǎn)。下面我繪制了對(duì)應(yīng)于上述旋度場(chǎng)的收斂矢量場(chǎng)-?L:
這和我們之前熟悉的一樣,L的梯度下降要收斂到局部最小值,即固定點(diǎn)v?,F(xiàn)在的問題是,我們無法控制我們收斂到什么樣的固定點(diǎn)。我們要尋求一個(gè)正平衡,但是-δL不能區(qū)分鞍點(diǎn)(既不是極大值點(diǎn)也不是極小值點(diǎn)的臨界點(diǎn))或平衡,或負(fù)平衡或正平衡之間。如下圖說明了矢量場(chǎng)
在左側(cè)的圖片中,我注釋了平衡點(diǎn)和鞍點(diǎn)。中間的圖片說明了收斂松弛點(diǎn)L,其中鞍點(diǎn)和平衡都轉(zhuǎn)向局部最小值。?
那我們?cè)撛趺崔k?我們可以簡(jiǎn)單地采用原始v和它相關(guān)的-?L進(jìn)行線性組合,這種組合仍然是不收斂的矢量場(chǎng)看起來像旋度場(chǎng)(即上圖第三個(gè)圖片)。
通過這兩個(gè)矢量場(chǎng)的組合,我們可能會(huì)得到一個(gè)稍微更好的模型,但仍然是不收斂的矢量場(chǎng)。衡量矢量場(chǎng)的效果的一種方法是查看其雅可比矩陣v"(x)的特征值。雅可比矩陣是矢量場(chǎng)的導(dǎo)數(shù),對(duì)于收斂的矢量場(chǎng),它被稱為海森矩陣或二階導(dǎo)數(shù)(譯者注:關(guān)于雅可比矩陣和海森矩陣可以參閱網(wǎng)絡(luò)資料——http://jacoxu.com/jacobian%E7%9F%A9%E9%98%B5%E5%92%8Chessian%E7%9F%A9%E9%98%B5/)。與總是對(duì)稱的海森矩陣不同,非收斂場(chǎng)的雅可比是非對(duì)稱的,它可以具有復(fù)雜的特征值。例如旋度場(chǎng)的雅可比矩陣是
其特征值完全是虛構(gòu)的+ i和-i。
Mesceder等人通過將v與-?L線形組合,可以控制組合場(chǎng)的特征值(詳見論文),如果我們選擇足夠大的γ,則同步梯度下降算法將收斂到平衡。這真的是太贊了(6666666)!
可悲的是,當(dāng)我們?cè)黾应脮r(shí),我們也會(huì)像以前一樣引入虛假的均衡。這里所謂的平衡,其實(shí)際上只是v的鞍點(diǎn)。所以我們不能一味的關(guān)注γ,我們必須找到一個(gè)合理的中間地帶。這是這種方法的局限性,目前尚不清楚實(shí)際中極限是多少。
再說說另一種方法:隨機(jī)梯度方法的變種
平均指標(biāo)(average norm)和總體方差(population variance )可以以無偏差的方式估計(jì)。 我已經(jīng)和作者討論過了,我會(huì)邀請(qǐng)他們發(fā)表評(píng)論,說明他們?cè)趯?shí)驗(yàn)中是如何做到的。 他們還承諾會(huì)在會(huì)議集影印版的論文中描述更多的細(xì)節(jié)。
總結(jié)
這篇論文讓我開拓了視野,本來我一直認(rèn)為在我們對(duì)抗生成網(wǎng)絡(luò)中使用的梯度下降算法只是梯度下降的一種特殊情況,但實(shí)際上它只是是一個(gè)泛化,梯度下降的良好屬性在這里并不能被認(rèn)為是理所當(dāng)然有的。希望這篇文章可以給大家?guī)硪粋€(gè)對(duì)抗生成網(wǎng)絡(luò)的滿意答案。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/4664.html
摘要:生成式對(duì)抗網(wǎng)絡(luò)簡(jiǎn)稱將成為深度學(xué)習(xí)的下一個(gè)熱點(diǎn),它將改變我們認(rèn)知世界的方式。配圖針對(duì)三年級(jí)學(xué)生的對(duì)抗式訓(xùn)練屬于你的最嚴(yán)厲的批評(píng)家五年前,我在哥倫比亞大學(xué)舉行的一場(chǎng)橄欖球比賽中傷到了自己的頭部,導(dǎo)致我右半身腰部以上癱瘓。 本文作者 Nikolai Yakovenko 畢業(yè)于哥倫比亞大學(xué),目前是 Google 的工程師,致力于構(gòu)建人工智能系統(tǒng),專注于語言處理、文本分類、解析與生成。生成式對(duì)抗網(wǎng)絡(luò)—...
摘要:但是在傳統(tǒng)的機(jī)器學(xué)習(xí)中,特征和算法都是人工定義的。傳統(tǒng)的深度學(xué)習(xí)中,是由人來決定要解決什么問題,人來決定用什么目標(biāo)函數(shù)做評(píng)估。 隨著柯潔與AlphaGo結(jié)束以后,大家是不是對(duì)人工智能的底層奧秘越來越有興趣?深度學(xué)習(xí)已經(jīng)在圖像分類、檢測(cè)等諸多領(lǐng)域取得了突破性的成績(jī)。但是它也存在一些問題。首先,它與傳統(tǒng)的機(jī)器學(xué)習(xí)方法一樣,通常假設(shè)訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)服從同樣的分布,或者是在訓(xùn)練數(shù)據(jù)上的預(yù)測(cè)結(jié)果與在...
摘要:運(yùn)用深度學(xué)習(xí),這個(gè)系統(tǒng)能夠根據(jù)輸入的圖形用戶界面截圖直接輸出對(duì)應(yīng)的代碼,從而省去前端手動(dòng)編寫代碼的過程。如果二者存在任何長(zhǎng)度上的差異,同樣會(huì)被認(rèn)定為錯(cuò)誤。我們相信未來將與人類協(xié)作,而不是代替人類。 UI設(shè)計(jì)和前端工程師之間,可能還需要一個(gè)神經(jīng)網(wǎng)絡(luò)。近日,位于哥本哈根的一家創(chuàng)業(yè)公司Uizard Technologies開發(fā)出了一個(gè)名為pix2code的系統(tǒng)。運(yùn)用深度學(xué)習(xí),這個(gè)系統(tǒng)能夠根據(jù)輸入的...
摘要:但年在機(jī)器學(xué)習(xí)的較高級(jí)大會(huì)上,蘋果團(tuán)隊(duì)的負(fù)責(zé)人宣布,公司已經(jīng)允許自己的研發(fā)人員對(duì)外公布論文成果。蘋果第一篇論文一經(jīng)投放,便在年月日,斬獲較佳論文。這項(xiàng)技術(shù)由的和開發(fā),使用了生成對(duì)抗網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)方法。 GANs「對(duì)抗生成網(wǎng)絡(luò)之父」Ian Goodfellow 在 ICCV 2017 上的 tutorial 演講是聊他的代表作生成對(duì)抗網(wǎng)絡(luò)(GAN/Generative Adversarial ...
閱讀 2102·2023-04-25 22:58
閱讀 1451·2021-09-22 15:20
閱讀 2725·2019-08-30 15:56
閱讀 2035·2019-08-30 15:54
閱讀 2160·2019-08-29 12:31
閱讀 2782·2019-08-26 13:37
閱讀 627·2019-08-26 13:25
閱讀 2144·2019-08-26 11:58