CMU、NYU與FAIR共同提出GLoMo：遷移學(xué)習(xí)新范式

phoenixsky 發(fā)布于2019-04-25 18:28 / 1074人閱讀

摘要：研究人員稱，其提出的可以無(wú)監(jiān)督地學(xué)習(xí)并遷移數(shù)據(jù)單元對(duì)之間的依賴關(guān)系和圖形表征，并在自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)任務(wù)中取得了很好的效果。表自然語(yǔ)言處理任務(wù)中的模型簡(jiǎn)化測(cè)試。

近日，由卡耐基梅隆大學(xué)、紐約大學(xué)和 Facebook 的研究者楊植麟、Junbo Zhao 等人提交的論文將遷移學(xué)習(xí)向前推進(jìn)了一步。研究人員稱，其提出的 GLoMo 可以無(wú)監(jiān)督地學(xué)習(xí)并遷移數(shù)據(jù)單元對(duì)之間的依賴關(guān)系和圖形表征，并在自然語(yǔ)言處理和計(jì)算機(jī)視覺(jué)任務(wù)中取得了很好的效果。值得一提的是，該論文作者還包括何愷明、Ruslan Salakhutdinov 和 Yann LeCun 等人。

深度學(xué)習(xí)的進(jìn)展很大程度上依賴于諸如卷積網(wǎng)絡(luò)（CNN）[ 18 ] 和循環(huán)網(wǎng)絡(luò)（RNN）[ 14 ] 之類的架構(gòu)及注意力機(jī)制 [ 1 ]。這些架構(gòu)雖然具有較高的表征能力，但由于其內(nèi)置的「先天優(yōu)勢(shì)」，它們主要在網(wǎng)格狀或順序結(jié)構(gòu)上運(yùn)行。因此，CNN 和 RNN 在很大程度上依賴高表達(dá)能力來(lái)模擬復(fù)雜的結(jié)構(gòu)現(xiàn)象，抵消了它們沒(méi)有明確利用結(jié)構(gòu)和圖形表征的事實(shí)。

這種范式導(dǎo)致了遷移學(xué)習(xí)和預(yù)處理的標(biāo)準(zhǔn)化規(guī)范——在有監(jiān)督或無(wú)監(jiān)督的大數(shù)據(jù)集上擬合表達(dá)函數(shù)，然后將該函數(shù)應(yīng)用到下游任務(wù)數(shù)據(jù)中進(jìn)行特征提取。值得重視的例子包括預(yù)處理的 ImageNet 特征 [ 13 ] 和預(yù)處理的單詞嵌入 [ 23，28 ]。

相比之下，現(xiàn)實(shí)世界中的各種數(shù)據(jù)顯示出比簡(jiǎn)單的網(wǎng)格狀或順序結(jié)構(gòu)更豐富的關(guān)系圖結(jié)構(gòu)。最近的其他類似研究也強(qiáng)調(diào)了這一點(diǎn) [3]。例如在語(yǔ)言領(lǐng)域，語(yǔ)言學(xué)家使用解析樹(shù)來(lái)表示單詞之間的句法依賴性；信息檢索系統(tǒng)利用知識(shí)圖形反映實(shí)體關(guān)系；共指消解被設(shè)計(jì)成連接相同實(shí)體的不同表達(dá)式。因此，不管目標(biāo)任務(wù)如何，這些示例性結(jié)構(gòu)普遍存在于幾乎任何自然語(yǔ)言數(shù)據(jù)中，這意味著跨任務(wù)遷移的可能性。這些觀察也可以推廣到其他領(lǐng)域，如計(jì)算機(jī)視覺(jué)。在 CV 領(lǐng)域里，像素之間關(guān)系的建模被證明是有用的 [ 27，49，43 ]。然而，還存在一個(gè)障礙，許多通用結(jié)構(gòu)基本上是人為策劃的，并且大規(guī)模獲取成本高昂，而自動(dòng)誘發(fā)的結(jié)構(gòu)大多限于一項(xiàng)任務(wù)。

圖 1：傳統(tǒng)遷移學(xué)習(xí)與新遷移學(xué)習(xí)框架的對(duì)比。GLoMo 不是遷移特征，而是遷移網(wǎng)絡(luò)輸出的圖形。圖形與任務(wù)特定的特征（例如嵌入或隱藏狀態(tài)）相乘，以產(chǎn)生結(jié)構(gòu)感知特征。

在本文中，我們?cè)噲D解決兩個(gè)挑戰(zhàn): 1）打破基于特征的深度遷移學(xué)習(xí)的標(biāo)準(zhǔn)化規(guī)范；2）以數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)數(shù)據(jù)中的通用結(jié)構(gòu)。我們對(duì)學(xué)習(xí)可遷移隱藏關(guān)系圖感興趣，其中隱藏圖的節(jié)點(diǎn)是輸入單元，例如句子中的所有單詞。隱藏關(guān)系圖學(xué)習(xí)的任務(wù)是學(xué)習(xí)一個(gè)相似矩陣，其中權(quán)重（可能為零）捕獲任意一對(duì)輸入單元之間的依賴關(guān)系。

為了實(shí)現(xiàn)上述目標(biāo)，我們提出了一種新的無(wú)監(jiān)督隱藏圖學(xué)習(xí)框架，稱之為 GLoMo（Graphs from LOw-level unit MOdeling，低級(jí)單位建模圖）。具體來(lái)說(shuō)，我們從大規(guī)模的未標(biāo)記數(shù)據(jù)中訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)輸出隱藏圖型，并將該網(wǎng)絡(luò)遷移到提取下游任務(wù)的圖結(jié)構(gòu)來(lái)加強(qiáng)對(duì)它的訓(xùn)練。這種方法可以讓我們把表示每個(gè)單元語(yǔ)義含義的特征和反映單元如何交互的圖形分開(kāi)。理想情況下，圖形捕捉數(shù)據(jù)背后的任務(wù)無(wú)關(guān)結(jié)構(gòu)，從而適用于不同的功能集。圖 1 突出了傳統(tǒng)的基于特征的遷移學(xué)習(xí)和新框架之間的差異。

實(shí)驗(yàn)結(jié)果表明，GLoMo 提高了問(wèn)答、自然語(yǔ)言推理和情感分析等各種語(yǔ)言任務(wù)的性能。我們還證實(shí)，學(xué)習(xí)到的圖形是通用的，可以用于未經(jīng)過(guò)圖形訓(xùn)練的各種特征集任務(wù)，包括 GloVe 嵌入 [28]、ELMo 嵌入 [ 29 ] 和任務(wù)特定的 RNN 狀態(tài)。我們還確定了學(xué)習(xí)成功通用圖的關(guān)鍵因素：解耦圖和特征、分層圖表征、稀疏性、單位級(jí)目標(biāo)和序列預(yù)測(cè)。為了證明該框架的通用性，我們應(yīng)用 GLoMo 來(lái)建模像素之間的關(guān)系依賴性，結(jié)果表明圖像分類任務(wù)的性能獲得改進(jìn)。

圖 2：GLoMo 方法概述。

在無(wú)監(jiān)督學(xué)習(xí)階段，特征預(yù)測(cè)器和圖形預(yù)測(cè)器被一起訓(xùn)練以執(zhí)行上下文預(yù)測(cè)。在遷移階段，圖形預(yù)測(cè)器被凍結(jié)并用于提取下游任務(wù)的圖形。RNN 解碼器應(yīng)用于特征預(yù)測(cè)器中的所有位置，但是簡(jiǎn)單起見(jiàn)，我們僅指出了位置「A」處的一個(gè)?！窼elect one」表示圖形可以遷移到下游任務(wù)模型中的任何層。「FF」指前饋網(wǎng)絡(luò)。圖形預(yù)測(cè)器輸出的圖用作「weighted sum」操作中的權(quán)重（參見(jiàn)等式 2）。

表 2：自然語(yǔ)言處理任務(wù)中的模型簡(jiǎn)化測(cè)試。

表 3：計(jì)算機(jī)視覺(jué)任務(wù)：CIFAR - 10 的分類結(jié)果。我們采用一個(gè) 42000 / 8000 的訓(xùn)練/驗(yàn)證拆分——一旦根據(jù)驗(yàn)證誤差選擇了較佳模型，我們就直接將其轉(zhuǎn)發(fā)到測(cè)試集，而不進(jìn)行任何驗(yàn)證集退回再訓(xùn)練。我們僅使用水平翻轉(zhuǎn)來(lái)增加數(shù)據(jù)。上表中的結(jié)果是 5 輪實(shí)驗(yàn)的平均結(jié)果。

論文：GLoMo: Unsupervisedly Learned Relational Graphs as Transferable Representations

論文鏈接：https://arxiv.org/abs/1806.05662

摘要：現(xiàn)代深度遷移學(xué)習(xí)方法主要側(cè)重于從一個(gè)任務(wù)中學(xué)習(xí)可遷移到其他任務(wù)的通用特征向量，例如語(yǔ)言中的單詞嵌入和視覺(jué)中的預(yù)訓(xùn)練卷積特征。然而，這些方法通常遷移一元特征，卻很大程度上忽略了更結(jié)構(gòu)化的圖形表征。本論文探索了從大規(guī)模未標(biāo)記數(shù)據(jù)中學(xué)習(xí)捕獲數(shù)據(jù)單元對(duì)（例如單詞或像素）之間依賴關(guān)系的通用隱藏關(guān)系圖，并將這些圖傳遞給下游任務(wù)的可能性。我們提出的遷移學(xué)習(xí)框架提高了各種任務(wù)的性能，包括問(wèn)答、自然語(yǔ)言推理、情感分析和圖像分類。我們的測(cè)試還表明，學(xué)習(xí)到的圖形是通用的，可以遷移到未經(jīng)過(guò)圖形訓(xùn)練的不同嵌入（包括 GloVe 嵌入、ELMo 嵌入和任務(wù)特定的 RNN 隱藏單元）或無(wú)嵌入單元（如圖形像素）。?

歡迎加入本站公開(kāi)興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法，實(shí)際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉(cāng)庫(kù)，數(shù)據(jù)挖掘工具，報(bào)表系統(tǒng)等全方位知識(shí)

QQ群：81035754

云服務(wù)器 GPU云服務(wù)器云計(jì)算與服務(wù)器共同點(diǎn) 深度學(xué)習(xí)提出深度學(xué)習(xí)的提出誰(shuí)提出深度學(xué)習(xí)

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/4796.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

phoenixsky

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

tensorflow1.12.0

閱讀 3464·2023-04-25 19:39
#黑色#ITLDC：KVM VPS年付5折 €16.49/年起，100M不限流量，多國(guó)機(jī)房可選

閱讀 3817·2021-11-18 13:12
怎么云主機(jī)里開(kāi)網(wǎng)站-云主機(jī)怎么使用？

閱讀 3642·2021-09-22 15:45
分銷主機(jī)是什么-代理主機(jī)名是什么？

閱讀 2441·2021-09-22 15:32
如何管理你下載的一大堆Python包【??win環(huán)境及l(fā)inux環(huán)境下創(chuàng)建虛擬環(huán)境詳解??】

閱讀 726·2021-09-04 16:40
前端面試資源整理（一）

閱讀 3739·2019-08-30 14:11
javascript新手實(shí)例1-DOM基本操作

閱讀 1893·2019-08-30 13:46
6.18快要來(lái)臨--家具電商大戰(zhàn)一觸即發(fā)

閱讀 1574·2019-08-29 15:43

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

CMU、NYU與FAIR共同提出GLoMo：遷移學(xué)習(xí)新范式

相關(guān)文章

回顧Deep Learning三劍客的艱難歷程，30年的不悔堅(jiān)持

**ICML 2015壓軸討論總結(jié)：6大神暢談深度學(xué)習(xí)的未來(lái)**

吃了這些數(shù)據(jù)集和模型，跟 AI 學(xué)跳舞，做 TensorFlowBoys

**Yann Lecun自監(jiān)督學(xué)習(xí)指南（附114頁(yè)Slides全文）**

LeCun推薦：最新PyTorch圖神經(jīng)網(wǎng)絡(luò)庫(kù)，速度快15倍

發(fā)表評(píng)論

0條評(píng)論

phoenixsky

男|高級(jí)講師

TA的文章

tensorflow1.12.0

#黑色#ITLDC：KVM VPS年付5折 €16.49/年起，100M不限流量，多國(guó)機(jī)房可選

怎么云主機(jī)里開(kāi)網(wǎng)站-云主機(jī)怎么使用？

分銷主機(jī)是什么-代理主機(jī)名是什么？

如何管理你下載的一大堆Python包【??win環(huán)境及l(fā)inux環(huán)境下創(chuàng)建虛擬環(huán)境詳解??】

前端面試資源整理（一）

javascript新手實(shí)例1-DOM基本操作

6.18快要來(lái)臨--家具電商大戰(zhàn)一觸即發(fā)

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

CMU、NYU與FAIR共同提出GLoMo：遷移學(xué)習(xí)新范式

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！