摘要:深度學(xué)習(xí)現(xiàn)在被視為能夠超越那些更加直接的機(jī)器學(xué)習(xí)的關(guān)鍵一步。的加入只是谷歌那一季一系列重大聘任之一。當(dāng)下谷歌醉心于深度學(xué)習(xí),顯然是認(rèn)為這將引發(fā)下一代搜索的重大突破。移動(dòng)計(jì)算的出現(xiàn)已經(jīng)迫使谷歌改變搜索引擎的本質(zhì)特征。
Geoffrey Hiton說(shuō):“我需要了解一下你的背景,你有理科學(xué)位嗎?”
Hiton站在位于加利福尼亞山景城谷歌園區(qū)辦公室的一塊白板前,2013年他以杰出研究者身份加入這家公司。Hiton也許是全世界研究神經(jīng)網(wǎng)絡(luò)系統(tǒng)最早的專家,在1980年代中期,他就是人工智能技術(shù)的先驅(qū)(他提到在16歲時(shí)就開(kāi)始思考神經(jīng)網(wǎng)絡(luò))。自那時(shí)起,以模擬人腦為原理的神經(jīng)網(wǎng)絡(luò)被認(rèn)為是一種在處理計(jì)算機(jī)視覺(jué)和自然語(yǔ)言等棘手問(wèn)題方面很有前途的方法。但漸漸有人失去了等待的耐心,人們開(kāi)始質(zhì)疑是否應(yīng)該繼續(xù)下去。
Geoff Hinton. Photo: Michelle Siu/Backchannel
大約十年前,在多倫多大學(xué)Hinton的實(shí)驗(yàn)室,他和其他研究者取得了一項(xiàng)突破性進(jìn)展,突然使神經(jīng)網(wǎng)絡(luò)成為人工智能領(lǐng)域最熱門(mén)的話題。不僅是谷歌,還有一些其他公司,比如,F(xiàn)acebook、Microsoft和IBM都開(kāi)始瘋狂追求這個(gè)領(lǐng)域中為數(shù)不多的科學(xué)家,他們精通于建立多層模擬神經(jīng)元結(jié)構(gòu)以使整個(gè)系統(tǒng)能夠被訓(xùn)練,或者進(jìn)行自我訓(xùn)練,然后來(lái)預(yù)測(cè)隨機(jī)輸入值的相干性。這更像是一個(gè)嬰兒,他學(xué)著對(duì)那些涌入到其初始感官的數(shù)據(jù)進(jìn)行組織。這種新的、有效的處理方式被稱作深度學(xué)習(xí),一些長(zhǎng)期計(jì)算難題(比如說(shuō)計(jì)算機(jī)“觀看”和“聽(tīng)到”的能力等)得以解決。我們翹首期盼的擁有智能的計(jì)算機(jī)系統(tǒng)突然出現(xiàn)在我們面前,此后谷歌搜索將會(huì)變得更加好用。
深度學(xué)習(xí)的突破對(duì)谷歌搜索的下一次跨越式發(fā)展極其關(guān)鍵:理解真實(shí)世界,在為用戶提供準(zhǔn)確答案和信息方面向前邁出一大步。為保持搜索的活力,谷歌必須變得更加聰明。
Here’s Dr. Hinton’s explanation for English majors. Photo: Steven Levy
這正中谷歌下懷。在公司早些年,創(chuàng)始人就認(rèn)定谷歌是一家人工智能公司。它不僅將人工智能用于搜索——盡管它的搜索引擎與人工智能正相關(guān)——還用于廣告系統(tǒng)、自動(dòng)駕駛汽車,以及將納米顆粒注入人體血管來(lái)進(jìn)行早期疾病監(jiān)測(cè)的計(jì)劃中。正如Larry Page在2002年告訴我的:
“我們不總是生產(chǎn)人們想要的東西,這才是我們工作的難點(diǎn)所在。要實(shí)現(xiàn)這個(gè)目標(biāo),你必須足夠聰明,你要了解世界萬(wàn)物,你必須懂得去質(zhì)疑。我們正在嘗試的就是人工智能——最終搜索引擎會(huì)很聰明,因此,我們正在努力接近這個(gè)目標(biāo)。”
當(dāng)Geoffrey Hiton實(shí)現(xiàn)這個(gè)突破時(shí),谷歌已經(jīng)做好準(zhǔn)備走上這條道路。多年以來(lái),公司一直通過(guò)使用機(jī)器學(xué)習(xí)這種更傳統(tǒng)的方式來(lái)使搜索引擎變得更加強(qiáng)大,而且在這方面遙遙領(lǐng)先。曾經(jīng)有幾年,公司雇傭了一群人工智能工程師和科學(xué)家,他們使搜索引擎像synonyms一樣學(xué)習(xí)。當(dāng)數(shù)百萬(wàn)用戶用到一個(gè)可以進(jìn)行替換的詞語(yǔ)(比如,dog和puppy)時(shí),谷歌能迅速利用知識(shí)來(lái)更好的理解問(wèn)題。當(dāng)谷歌承擔(dān)網(wǎng)站翻譯工作時(shí),它的科學(xué)家們會(huì)將儲(chǔ)備的大量翻譯過(guò)的文檔和來(lái)源放入系統(tǒng)。這樣,谷歌搜索引擎就“學(xué)會(huì)”了如何將一種語(yǔ)言匹配到另一種。
深度學(xué)習(xí)現(xiàn)在被視為能夠超越那些更加直接的機(jī)器學(xué)習(xí)的關(guān)鍵一步。它基于人腦結(jié)構(gòu),它的追隨者聲稱,之前基于計(jì)算機(jī)特性實(shí)現(xiàn)智能幾乎是不可能的——至少非常難,但深度學(xué)習(xí)為其提供了發(fā)射臺(tái)。這就是為什么Hinton的突破會(huì)對(duì)谷歌如此重要,對(duì)于其他有搜索或類似業(yè)務(wù)的公司也是如此。過(guò)去幾年,谷歌一直努力將搜索引擎塑造成吸引討論的話題。但真正使計(jì)算機(jī)獲得初級(jí)的、人類般的智能還是需要對(duì)人工智能的前沿研究進(jìn)行擴(kuò)展,深度學(xué)習(xí)就是這樣一個(gè)能夠完成這項(xiàng)任務(wù)的當(dāng)下最流行的工具。
神經(jīng)網(wǎng)絡(luò)是對(duì)生物上大腦學(xué)習(xí)方式進(jìn)行建模。當(dāng)你嘗試進(jìn)行一個(gè)新任務(wù)時(shí),一系列特定的神經(jīng)元集合會(huì)被激活。你觀察到結(jié)果,接下來(lái)利用反饋來(lái)調(diào)整哪些神經(jīng)元應(yīng)該被激活,以此來(lái)訓(xùn)練大腦。多次之后,一些神經(jīng)元之間的聯(lián)系將變強(qiáng)而另外一些則變?nèi)酰@就形成了記憶的基礎(chǔ)。
模擬神經(jīng)網(wǎng)絡(luò)以編碼方式在本質(zhì)上復(fù)制了這一過(guò)程。但比起復(fù)制人腦復(fù)雜的神經(jīng)元結(jié)構(gòu),模擬神經(jīng)網(wǎng)絡(luò)更小,神經(jīng)元也是整齊的分層排列。第一層(或者最初基層)是特征探測(cè),一種人類感官的計(jì)算形態(tài)。當(dāng)計(jì)算機(jī)將數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)——比如說(shuō)圖像、語(yǔ)言或文本文件的數(shù)據(jù)庫(kù)——系統(tǒng)通過(guò)檢測(cè)其中的特征值來(lái)進(jìn)行學(xué)習(xí)。例如,如果任務(wù)是識(shí)別垃圾郵件,神經(jīng)網(wǎng)絡(luò)研究者可能會(huì)將許多信息輸入到系統(tǒng),同時(shí)貼上“垃圾郵件”及“非垃圾郵件”標(biāo)簽。神經(jīng)網(wǎng)絡(luò)將自動(dòng)察覺(jué)到一些單詞的復(fù)雜特征、模式,以及能夠確定該郵件是否為垃圾郵件的標(biāo)題信息。
在早期神經(jīng)網(wǎng)絡(luò)實(shí)驗(yàn)中,計(jì)算機(jī)不能自己設(shè)計(jì)特征,因此這些特征需要人工添加。Hinton的開(kāi)創(chuàng)性貢獻(xiàn)是開(kāi)發(fā)了一種被稱作“Back Propagation(反向傳播算法)”的技術(shù),這是一種反饋機(jī)制,它允許系統(tǒng)更加有效的從錯(cuò)誤中學(xué)習(xí)以及自己定義特征。“追溯到1986年,我們首次開(kāi)發(fā)出Back Propagation算法,我們因其能學(xué)習(xí)到多層的特征探測(cè)而感到興奮,我們認(rèn)為我們解決了這個(gè)問(wèn)題?!?Hinton說(shuō),“但在解決實(shí)際問(wèn)題中卻沒(méi)有出現(xiàn)大的突破,這非常令人失望,我們完全猜錯(cuò)了需要的計(jì)算資源和標(biāo)記案例數(shù)量?!?/p>
但是,即使多年來(lái)許多研究員不再信仰神經(jīng)網(wǎng)絡(luò),但Hinton依然強(qiáng)烈感覺(jué)到它們會(huì)有實(shí)用價(jià)值。1995年,他和他的學(xué)生嘗試著放棄手動(dòng)添加標(biāo)簽,至少是學(xué)習(xí)過(guò)程的早期階段,這項(xiàng)技術(shù)被稱作“unsupervised pre-training”,是指該系統(tǒng)可以計(jì)算出如何自行組織輸入值。但Hinton說(shuō)完成這項(xiàng)工作的核心是數(shù)學(xué)技巧,一種節(jié)約計(jì)算時(shí)間的近似法,當(dāng)信息通過(guò)各層神經(jīng)元時(shí)將會(huì)引發(fā)更多次迭代來(lái)改善網(wǎng)絡(luò)。如經(jīng)常遇到的,速度能夠變化,這使得之前神經(jīng)網(wǎng)絡(luò)無(wú)法完成的“學(xué)習(xí)”行為成為可能。就像是一個(gè)人突然冷靜下來(lái)說(shuō),我能用10分鐘完成5個(gè)小時(shí)的滑雪練習(xí)。
伴隨著無(wú)監(jiān)控學(xué)習(xí)的出現(xiàn),人類專家只需要在更加后面的階段對(duì)機(jī)器進(jìn)行干預(yù),他們是為更想要的結(jié)果添加標(biāo)簽并為成功的結(jié)果提供獎(jiǎng)勵(lì)。Hinton說(shuō):“想象一下小孩子,當(dāng)他們學(xué)著辨認(rèn)牛時(shí),并并需要去看幾百萬(wàn)張媽媽們標(biāo)記上‘牛’的圖片,他們僅僅是學(xué)習(xí)牛的樣子,然后問(wèn)到:‘這是什么?’ 媽媽會(huì)說(shuō):‘這是一頭牛’,他們就學(xué)會(huì)了。深度學(xué)習(xí)就類似于這樣。
等到Hinton團(tuán)隊(duì)對(duì)這一模型進(jìn)行測(cè)試時(shí),他們恰好收益于神經(jīng)網(wǎng)絡(luò)初創(chuàng)時(shí)尚不具備的條件——超高速圖形處理器(GPU)。盡管這些芯片設(shè)計(jì)之初是用于推導(dǎo)高級(jí)圖像的計(jì)算公式,但它們也非常適用于神經(jīng)網(wǎng)絡(luò)的計(jì)算需求。Hinton為實(shí)驗(yàn)室購(gòu)置了一堆圖形處理器,讓兩個(gè)學(xué)生來(lái)操作該系統(tǒng)。他們進(jìn)行了一項(xiàng)測(cè)試來(lái)觀察是否能讓神經(jīng)網(wǎng)絡(luò)識(shí)別講話中的音素。這自然是許多科技公司——當(dāng)然,也包括谷歌——試圖掌握的技術(shù)。因?yàn)檎Z(yǔ)音會(huì)成為即將到來(lái)的移動(dòng)時(shí)代的輸入方式,電腦必須學(xué)會(huì)更好地傾聽(tīng)。
Geoff Hinton. Photo: Michelle Siu/Backchannel
系統(tǒng)表現(xiàn)如何呢?
“他們?nèi)〉昧肆钊思?dòng)的結(jié)果,” 辛頓表示,“最初結(jié)果幾乎和當(dāng)時(shí)技術(shù)一樣出色,而后者已經(jīng)調(diào)試發(fā)展了近30年,很顯然,如果在最開(kāi)始嘗試中我們?nèi)〉媚敲春玫慕Y(jié)果,我們最終的結(jié)果會(huì)更好?!?在接下來(lái)幾年中,Hinton團(tuán)隊(duì)進(jìn)行了更多嚴(yán)肅的嘗試。等到結(jié)果發(fā)布時(shí),Hinton稱系統(tǒng)已經(jīng)能與現(xiàn)存商用模型的較佳表現(xiàn)比肩。“關(guān)鍵是,這是實(shí)驗(yàn)室兩個(gè)學(xué)生做出來(lái)的?!彼f(shuō)。
深度學(xué)習(xí)就此誕生。
2007年,項(xiàng)目進(jìn)行過(guò)程中,Hinton在山景城進(jìn)行了關(guān)于深度學(xué)習(xí)的谷歌技術(shù)演講,極客們踴躍出席,這一演講在YouTube上也大受歡迎。這有助于傳播這樣的理念,即神經(jīng)網(wǎng)絡(luò)將成為一個(gè)強(qiáng)大工具。這還掀起了一波爭(zhēng)先恐后雇傭該領(lǐng)域技術(shù)專業(yè)的浪潮。Hinton的學(xué)生去了IBM、微軟,當(dāng)然還有谷歌。這可是攻堅(jiān)該領(lǐng)域的四大公司中的三家(還有一家是Nuance,它是蘋(píng)果的技術(shù)供應(yīng)商)。所有人都能自由使用Hinton實(shí)驗(yàn)室的成果用以完善各自系統(tǒng)?!拔覀兓旧蠈?duì)此毫無(wú)保留,因?yàn)槲覀冎塾谧C明我們技術(shù)的優(yōu)勢(shì)?!?Hinton表示,“有趣的是,微軟研究院和IBM先于谷歌得到這項(xiàng)技術(shù),但是在將技術(shù)轉(zhuǎn)變成產(chǎn)品方面谷歌卻比任何人都迅速?!?/p>
Hinton的加入只是谷歌那一季一系列重大聘任之一。就在幾個(gè)月前,人工智能的樂(lè)觀主義哲學(xué)家Ray Kurzweil剛剛加入包括Peter Norvig(編寫(xiě)了人工智能課程的標(biāo)準(zhǔn)教科書(shū))、Sebastian Thrun (自動(dòng)駕駛汽車的主要發(fā)明者)等人工智能傳奇人物在內(nèi)的團(tuán)隊(duì)。
當(dāng)下谷歌醉心于深度學(xué)習(xí),顯然是認(rèn)為這將引發(fā)下一代搜索的重大突破。移動(dòng)計(jì)算的出現(xiàn)已經(jīng)迫使谷歌改變搜索引擎的本質(zhì)特征。為了更進(jìn)一步,它必須采取和人類認(rèn)知世界相一致的方式——當(dāng)然另一方面也要執(zhí)行知曉世間一切并且在不到半秒鐘找到這些的非凡任務(wù)。所以, Jeff Dean參與進(jìn)來(lái)是遲早的事情。
Dean是谷歌的傳奇人物。早在1999年加入谷歌時(shí),他在計(jì)算機(jī)科學(xué)圈子里就已經(jīng)聲名遠(yuǎn)揚(yáng),聘任Dean是谷歌的一個(gè)里程碑,彼時(shí)谷歌還是個(gè)員工只有兩位數(shù)相對(duì)默默無(wú)聞的互聯(lián)網(wǎng)公司。在接下來(lái)的幾年里,Dean成為構(gòu)建谷歌軟件基礎(chǔ)構(gòu)架的領(lǐng)軍人物。在這一過(guò)程中,Dean粉們組建了一個(gè)極客團(tuán)體,他們用惡惡搞來(lái)表達(dá)對(duì)Dean耀眼才華的崇敬,叫「關(guān)于 Jeff Dean的真相」。其中大多數(shù)都涉及超級(jí)極客的編碼奧秘,但也有些相對(duì)容易理解的,比如:
Jeff Dean能在四子連珠中打敗你。只需要三步。
某天 Jeff Dean出門(mén)時(shí)誤將Etch-a-Sketch(一種畫(huà)板,使用者通過(guò)控制兩個(gè)旋鈕來(lái)控制畫(huà)筆在畫(huà)板上的移動(dòng))當(dāng)做筆記本電腦了。在他回家取筆記本電腦的路上,他對(duì)畫(huà)板進(jìn)行了編程用其來(lái)玩俄羅斯方塊。
Jeff Dean仍在等待數(shù)學(xué)家們解開(kāi)他藏在數(shù)字π中的笑話。
現(xiàn)年46歲的Dean早已知曉神經(jīng)網(wǎng)絡(luò),他在本科論文項(xiàng)目就曾應(yīng)用過(guò)它。然而在隨后的幾年,他和大部分同行得出了相似的結(jié)論:神經(jīng)網(wǎng)絡(luò)的黃金時(shí)期尚未到來(lái)?!吧窠?jīng)網(wǎng)絡(luò)前途無(wú)量,但因?yàn)槲覀兩袥](méi)有足夠的計(jì)算能力使其一鳴驚人,神經(jīng)網(wǎng)絡(luò)一度銷聲匿跡。" Dean說(shuō)到。不過(guò)在2011年, Jeff Dean在谷歌一間茶水間遇見(jiàn)了吳恩達(dá)(Andrew Ng)。吳恩達(dá)是斯坦福的人工智能教授,人工智能領(lǐng)域的巨擘,他每周會(huì)花上一天時(shí)間呆在這家搜索引擎公司。Dean問(wèn)吳恩達(dá)在忙些什么,吳恩達(dá)的回答令他大吃一驚——“我們?cè)谠噲D訓(xùn)練神經(jīng)網(wǎng)絡(luò)”。吳恩達(dá)告訴Dean,風(fēng)頭已變,伴隨著深度學(xué)習(xí)領(lǐng)域的突破,神經(jīng)網(wǎng)絡(luò)表現(xiàn)頗佳,如果谷歌能掌握訓(xùn)練大型網(wǎng)絡(luò)的技巧,會(huì)發(fā)生奇跡。
Jeff Dean. Photo: Talia Herman/Backchannel
Dean認(rèn)為這聽(tīng)上去很有意思,在“涉足”六個(gè)月后開(kāi)始相信,建立一個(gè)龐大神經(jīng)網(wǎng)絡(luò)系統(tǒng)能夠很快取得實(shí)質(zhì)性成果。因此他和吳恩達(dá)將其變成了一個(gè)獨(dú)立項(xiàng)目。(吳恩達(dá)已經(jīng)離開(kāi)谷歌,就在最近加入了百度,以發(fā)展中國(guó)搜索引擎領(lǐng)導(dǎo)者——百度自己的人工智能項(xiàng)目。)
大約用了一年時(shí)間,該項(xiàng)目俗稱為“谷歌大腦”,立項(xiàng)于Google X——谷歌公司高瞻遠(yuǎn)矚的研究部門(mén)?!斑@是我們內(nèi)部開(kāi)玩笑的叫法,我們盡量不這么對(duì)外宣稱,畢竟聽(tīng)起來(lái)有點(diǎn)奇怪”,Dean說(shuō)。2012年,研究積累了一定成果后,項(xiàng)目組走出了純?cè)囼?yàn)部門(mén)——Google X ,轉(zhuǎn)移到搜索部門(mén)。項(xiàng)目組也開(kāi)始避免使用“大腦”一詞。在對(duì)外宣傳中,他們更青睞“谷歌深度學(xué)習(xí)項(xiàng)目”這個(gè)名字,雖然這個(gè)名稱聽(tīng)起來(lái)沒(méi)有“大腦”有深意,但這也不太可能導(dǎo)致有人在Googleplex(谷歌總部)門(mén)前示威抗議。
Dean表示,項(xiàng)目組最開(kāi)始嘗試的是無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning),因?yàn)椤斑@個(gè)世界上監(jiān)控外的數(shù)據(jù)遠(yuǎn)多于監(jiān)控下的數(shù)據(jù)”。這反映在Dean項(xiàng)目組的第一篇論文中,在這項(xiàng)實(shí)驗(yàn)中谷歌大腦(覆蓋了1.6萬(wàn)個(gè)多個(gè)微處理器,創(chuàng)建了一個(gè)有數(shù)十億連接的神經(jīng)網(wǎng)絡(luò))觀看了千萬(wàn)數(shù)量級(jí)的YouTube圖像,以試圖觀察該系統(tǒng)能否學(xué)會(huì)將其所見(jiàn)到的定義出來(lái)。沒(méi)有發(fā)生意外,有賴于YouTube的內(nèi)容,該系統(tǒng)自發(fā)辨識(shí)出了貓,并且相當(dāng)擅長(zhǎng)于許多普通用戶通常會(huì)做的事情——搜索貓科動(dòng)物明星的視頻?!霸谟?xùn)練中,我們從未告訴它(谷歌大腦)‘這是一只貓’”,Dean告訴《紐約時(shí)報(bào)》,“基本上可以說(shuō),它發(fā)明了貓這個(gè)概念?!?/p>
而這只是觀察系統(tǒng)能做些什么的測(cè)試之一。很快,深度學(xué)習(xí)項(xiàng)目組建了一個(gè)更加強(qiáng)大的神經(jīng)網(wǎng)絡(luò),并且開(kāi)始承擔(dān)類似語(yǔ)音識(shí)別的任務(wù)?!拔覀兊难芯宽?xiàng)目集合相當(dāng)棒,在一些中短期項(xiàng)目中,系統(tǒng)對(duì)事物的超凡理解能力能迅速提升產(chǎn)品性能。還有一些中長(zhǎng)期目標(biāo),對(duì)此我們腦海里沒(méi)有一個(gè)具體的產(chǎn)品,但是我們知道這些將會(huì)非常有用?!?/p>
在我訪談Dean后不久,一個(gè)例子就出現(xiàn)了,4位谷歌深度學(xué)習(xí)科學(xué)家發(fā)表了一篇名為《展示與講述》的論文。這不僅標(biāo)志著一個(gè)科學(xué)突破,更催生了谷歌搜索旗下的一個(gè)應(yīng)用。這篇論文介紹了“神經(jīng)圖片標(biāo)題生成器”(neural image caption generator,NIC ),旨在沒(méi)有人類介入的情況下為圖片列示標(biāo)題??梢哉f(shuō)這個(gè)系統(tǒng)充當(dāng)了報(bào)紙的圖片編輯。這是一項(xiàng)包含視覺(jué)和語(yǔ)言的大型實(shí)驗(yàn)。這個(gè)系統(tǒng)的非凡之處在于,它將可視化圖片的學(xué)習(xí)系統(tǒng)建立在能夠用自然語(yǔ)言造句的神經(jīng)網(wǎng)絡(luò)基礎(chǔ)之上。
沒(méi)有人會(huì)說(shuō)這個(gè)系統(tǒng)已經(jīng)擁有了優(yōu)于人類的照片分類能力。事實(shí)上,如果雇一個(gè)基于該神經(jīng)網(wǎng)絡(luò)的人為照片寫(xiě)標(biāo)題的話,這個(gè)網(wǎng)絡(luò)新手可能都堅(jiān)持不到午餐時(shí)間。可是這個(gè)系統(tǒng)在機(jī)器上卻運(yùn)行的出奇出色。其中一些無(wú)比準(zhǔn)確的例子包括:一群正在玩飛盤(pán)游戲的年輕人;一個(gè)正在泥濘路上騎著摩托的人;一群正穿過(guò)干旱草地的大象。系統(tǒng)可以對(duì)飛盤(pán)、馬路和一群大象生成自己的概念,這足以令人印象深刻。所以,當(dāng)這個(gè)系統(tǒng)錯(cuò)把極限運(yùn)動(dòng)的單車騎士當(dāng)成滑板者;或者錯(cuò)把淡黃色的跑車認(rèn)成了校車,也是無(wú)可厚非的。畢竟這個(gè)系統(tǒng)還處于認(rèn)識(shí)繁雜世界的萌芽期。
這只是“谷歌大腦”的起始階段,Dean不打算對(duì)外宣稱說(shuō)谷歌已經(jīng)擁有了世界上較大的神經(jīng)網(wǎng)絡(luò)系統(tǒng),但是他承認(rèn),這是他所知道的這個(gè)領(lǐng)域里面的領(lǐng)先者。
Hinton的被雇傭以及Dean的聰明才智是公司推進(jìn)深度學(xué)習(xí)的重要舉措之一,而其中最重要的非2013年谷歌花費(fèi)4億美元收購(gòu)Deepmind莫屬,這是一家倫敦的人工智能公司?;趯?duì)大腦的深度研究,這家公司對(duì)于深度學(xué)習(xí)有著自己的獨(dú)到見(jiàn)解。谷歌擊敗了它的主要競(jìng)爭(zhēng)對(duì)手完成此次收購(gòu)。正如谷歌當(dāng)年花17億美元買下YouTube,和曾經(jīng)花5000萬(wàn)美元買下羽翼未豐的開(kāi)源移動(dòng)操作系統(tǒng)安卓,我們有充分理由相信Deepmind是谷歌撿的另一個(gè)大便宜。
CEO和創(chuàng)始人之一的Demis Hassabis是一個(gè)滿頭黑發(fā),矮小結(jié)實(shí)的38歲男人。思路敏捷,語(yǔ)速之快就像播客以兩倍速快進(jìn)播放。“我整個(gè)事業(yè)都是在為人工智能做準(zhǔn)備和鋪墊,”他在倫敦市中心高聳的總部大樓里休息時(shí)說(shuō)到,總部大樓坐落在St Pancras火車站旁。Deepmind剛剛從Bloomsbury的一幢不起眼的寫(xiě)字樓入駐這棟新大樓。這棟大樓之不尋常是因?yàn)樗ぶ患依厢t(yī)院的副樓而建,有點(diǎn)時(shí)空穿越的不和諧感。大樓里的會(huì)議廳都是以一些著名哲學(xué)家、作家和畫(huà)家命名,因?yàn)檫@些他們代表著是人類智慧的巨大飛躍,比如達(dá)芬奇、哥德?tīng)枴旣?雪萊。這個(gè)團(tuán)隊(duì)最近開(kāi)始接手兩家由Deepmind收購(gòu)的以牛津大學(xué)作為實(shí)驗(yàn)基地的公司。一個(gè)是Dark Blue Labs,運(yùn)用深度學(xué)習(xí)來(lái)解決自然語(yǔ)言理解問(wèn)題;另外一家Vision Factory,其開(kāi)發(fā)物體識(shí)別技術(shù)。
Hassabis 在14歲時(shí)就是個(gè)狂熱的電腦游戲程序設(shè)計(jì)者,同時(shí)也是象棋天才,師從游戲大師Peter Molyneux,在《黑與白》和《主題公園》里程碑作品中起到了重要作用。隨后在二十幾歲時(shí)開(kāi)始運(yùn)營(yíng)自己的游戲公司,有大約60名員工。但是他說(shuō)游戲是一種達(dá)到目的的方式,而這個(gè)目的是一個(gè)擁有通用智能的人工智能機(jī)器的發(fā)展。直到2004年,他覺(jué)得他已經(jīng)把游戲智能做到極致了,可是建立人工智能公司還是有些操之過(guò)急,因?yàn)樗枰挠?jì)算能力既不充足,也不劃算。所以他在英國(guó)倫敦大學(xué)學(xué)院修了一個(gè)認(rèn)知神經(jīng)科學(xué)的博士學(xué)位。
2007年,有一篇關(guān)于記憶神經(jīng)基礎(chǔ)的論文被《Science》評(píng)為年度十大突破之一,他是作者之一。他成為倫敦大學(xué)學(xué)院Gatsby Computational Neuroscience Unit的一員,并與UCL,MIT和Harvard展開(kāi)合作。但在2010年,他覺(jué)得是時(shí)候成立一個(gè)做高級(jí)人工智能的公司了,他和蓋茨比計(jì)算神經(jīng)科學(xué)組的同事Shane Legg以及19歲就從劍橋輟學(xué)的連續(xù)創(chuàng)業(yè)家Mustafa Suleyman一起著手創(chuàng)立。投資者還包括Peter Theil的Founders Fund和Elon Musk(他對(duì)后來(lái)對(duì)人工智能的不足表示過(guò)擔(dān)憂),Geoffrey Hinton也是顧問(wèn)之一。
DeepMind一直秘密運(yùn)行,在谷歌收購(gòu)之前只有一次公開(kāi)的結(jié)果發(fā)布。這足以引發(fā)一場(chǎng)炒作狂潮,同時(shí)也伴隨著一些無(wú)知的嘲笑。論文表述了DeepMind在通過(guò)被動(dòng)訓(xùn)練神經(jīng)網(wǎng)絡(luò)來(lái)玩Atari游戲方面的成功。神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過(guò)自身深度學(xué)習(xí)來(lái)學(xué)習(xí)游戲規(guī)則——系統(tǒng)直接嘗試百萬(wàn)遍Pong, Space Invaders, Beam Rider和其他經(jīng)典游戲,通過(guò)自學(xué)達(dá)到甚至超越了一個(gè)精通游戲的青少年。更有趣的是,它許多成功的策略都是人類無(wú)法想象的?!斑@就是此類技術(shù)的一個(gè)特殊潛能,” Hassabis說(shuō),“我們灌輸給它一種能力使它像人類一樣從經(jīng)驗(yàn)中自我學(xué)習(xí),因此,它就能自行處理那些我們都不知道該如何編程的事情??吹剿氤隽顺绦蛑獾腁tari游戲的新策略,這非常令人激動(dòng)?!?/p>
這朝著Hassabis的偉大目標(biāo)又前進(jìn)了一小步,他想象中的模擬大腦不僅知道大量事實(shí),還知道接下來(lái)該怎么做。DeepMind絕不滿足于開(kāi)發(fā)一種只能應(yīng)用在有限領(lǐng)域的工具,就像Atari游戲、通勤或者處理約會(huì)。他們想創(chuàng)造一種通行的人工智能機(jī)器,可以隨時(shí)隨地處理信息,并將每件事情都完成的非常漂亮?!拔覀儸F(xiàn)在所研究的通行人工智能是指將非結(jié)構(gòu)化信息轉(zhuǎn)化成有用的、可行動(dòng)的知識(shí),” 他說(shuō),“我們有模板——人類大腦。我們會(huì)系鞋帶、騎自行車、會(huì)處理建筑的物理學(xué)問(wèn)題。所以我們知道這是可能的,并且我們研究項(xiàng)目的理念正在慢慢的拓寬現(xiàn)有的應(yīng)用領(lǐng)域?!边@聽(tīng)起來(lái)是否令人害怕?Hassabis正在展望一種超級(jí)人工大腦,它能夠吸收全世界的信息并將其構(gòu)造成它能理解的形式,然后采取行動(dòng)?至少他承認(rèn),他們團(tuán)隊(duì)所引領(lǐng)的這項(xiàng)先進(jìn)技術(shù)可能會(huì)導(dǎo)致一個(gè)問(wèn)題——人工智能脫離人類控制,或至少會(huì)變得足夠強(qiáng)大,以至于它的某些功能會(huì)被限制。這就是為什么在谷歌收購(gòu)DeepMind之后,Hassabis和其他創(chuàng)始人要求谷歌設(shè)立一個(gè)外部咨詢委員會(huì)來(lái)監(jiān)控公司在人工智能方面的進(jìn)步。DeepMind早已決定永遠(yuǎn)不會(huì)將自己的技術(shù)授權(quán)給軍方和間諜組織,他們也讓谷歌同意了這一點(diǎn)。
遺憾的是Hassabis并沒(méi)有透露委員會(huì)的組成人員,他只提到“由計(jì)算機(jī)、神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的較高級(jí)教授組成?!?因?yàn)镈eepMind的工作依然處于早期——離所謂的“奇點(diǎn)”還早——他告訴我們現(xiàn)在沒(méi)有必要把委員會(huì)成員公布出來(lái)。他說(shuō):“當(dāng)前不存在的議題有可能會(huì)在未來(lái)5年或者10年出現(xiàn)。因此,事實(shí)上,游戲剛剛開(kāi)始?!?/p>
但游戲進(jìn)展飛快。去年秋天,DeepMind公布的另一篇論文描述了他們的一個(gè)新項(xiàng)目,通過(guò)綜合一些神經(jīng)科學(xué)里的記憶理論來(lái)構(gòu)建一個(gè)配備圖靈機(jī)性能的神經(jīng)網(wǎng)絡(luò),就像是通用計(jì)算設(shè)備。這意味著該系統(tǒng)在足夠的時(shí)間和內(nèi)存下能夠計(jì)算任何事情。論文重點(diǎn)關(guān)注實(shí)際應(yīng)用:記錄信息并隨后提取的能力——就像是對(duì)人類大腦“工作記憶”的人工模擬——“神經(jīng)網(wǎng)絡(luò)圖靈機(jī)”比此前的神經(jīng)網(wǎng)絡(luò)有更快的學(xué)習(xí)能力,能夠處理更加復(fù)雜的任務(wù),更重要是是“擁有在訓(xùn)練制度之外的良好的概括能力”。這不經(jīng)讓我們感到,向著Hassabis那個(gè)夢(mèng)想中的通用人工智能工具又邁出了關(guān)鍵一步。
事實(shí)上,到目前為止,谷歌深度學(xué)習(xí)的成果都還未在搜索及其他產(chǎn)品上大展拳腳。但這一點(diǎn)即將改變。
自從Jeff Dean深度學(xué)習(xí)項(xiàng)目的研究方向從Google X轉(zhuǎn)移到Knowledge部門(mén)(包括搜索)之后,他的小組就一直和一些相關(guān)的搜索團(tuán)隊(duì)進(jìn)行著密切合作,包括語(yǔ)言和圖像識(shí)別。谷歌大腦已經(jīng)成為該公司的一個(gè)人工智能工具。Dean說(shuō)道,這就像一個(gè)內(nèi)部服務(wù),如果小組的人對(duì)某個(gè)特定問(wèn)題感興趣,他們會(huì)通過(guò)它找到正確的解決方法。他接著說(shuō)到,谷歌現(xiàn)在有35到40個(gè)小組在使用它,除了搜索和語(yǔ)言,這項(xiàng)技術(shù)在廣告、街景和自動(dòng)駕駛方面都有應(yīng)用。
Jeff Dean. Photo: Talia Herman/Backchannel
至于遠(yuǎn)期項(xiàng)目,Dean談到他們正嘗試做一個(gè)更好的實(shí)時(shí)翻譯軟件,這是近段時(shí)間的熱點(diǎn),除了當(dāng)前谷歌獲得高度關(guān)注的系統(tǒng)外,微軟的Skype同樣使觀察者印象深刻,這一系統(tǒng)通過(guò)遠(yuǎn)程聲音完成翻譯。但是Dean還是為自己團(tuán)隊(duì)通過(guò)努力推動(dòng)項(xiàng)目向前發(fā)展感到興奮。他說(shuō),這是一個(gè)僅通過(guò)神經(jīng)網(wǎng)絡(luò)就可以實(shí)現(xiàn)首尾相連語(yǔ)言翻譯的模型,你可以訓(xùn)練一對(duì)用兩種語(yǔ)言表達(dá)但意義一致的句子。拿英語(yǔ)和法語(yǔ)來(lái)說(shuō),你一個(gè)詞一個(gè)詞的輸入英語(yǔ)句子,然后通過(guò)一個(gè)“英語(yǔ)結(jié)束”的標(biāo)記,這個(gè)模型會(huì)馬上將其翻譯成法語(yǔ)。
Dean在神經(jīng)模型和谷歌現(xiàn)有系統(tǒng)之間進(jìn)行了深入比較,結(jié)果表明他的新的深度學(xué)習(xí)系統(tǒng)在識(shí)別語(yǔ)音細(xì)節(jié)方面更勝一籌,而這被認(rèn)為是語(yǔ)義表達(dá)的關(guān)鍵。Dean表示:“如果對(duì)這項(xiàng)技術(shù)進(jìn)行擴(kuò)展,未來(lái)可以做更震撼的事情?!?/p>
DeepMind同樣為產(chǎn)品化做好了準(zhǔn)備。Hassabis說(shuō)大概需要六個(gè)月左右的時(shí)間,他們的技術(shù)就可以找到和谷歌產(chǎn)品實(shí)現(xiàn)對(duì)接的途徑。他的組織被分成了幾部門(mén),其中一個(gè)和谷歌緊密合作,致力于人工智能的實(shí)際應(yīng)用,該部門(mén)由它的聯(lián)合創(chuàng)始人Mustafa Suleyman負(fù)責(zé)。
Hassabis希望DeepMind的技術(shù)能幫助人們提高生活水平。他相信一個(gè)更具積極主動(dòng)性的搜索引擎——不只為人們提供答案,更能幫人們做決定——可能成為價(jià)值的提供者,它將為人們提供更為寶貴和稀缺的商品——時(shí)間。Hassabis舉例說(shuō)世界上可能找到的有趣的書(shū)與人有限的一生中能夠讀完的書(shū)相比要多很多,既然如此,為什么每次在一個(gè)漫長(zhǎng)的飛行途中或在某地的難得度假當(dāng)中都要去想該讀哪本書(shū)?這將永遠(yuǎn)不會(huì)發(fā)生,因?yàn)楹芏囝愃频氖虑閷⒏玫膶?shí)現(xiàn)自動(dòng)化。
沿著這個(gè)思路,Hassabis設(shè)想DeepMind能夠通過(guò)自己的方式涉足谷歌更多有開(kāi)創(chuàng)性意義的項(xiàng)目,比如自動(dòng)駕駛汽車,甚至Calico---一個(gè)致力于延長(zhǎng)人類壽命的公司。
最終,Deepmind、谷歌大腦連同Hinton的深度學(xué)習(xí)小組將共同組成谷歌搜索,這才是最重要的。許多年前,Larry Page 和Sergey Brin曾經(jīng)半開(kāi)玩笑的說(shuō),語(yǔ)音將被植入我們的大腦,然而現(xiàn)在已經(jīng)沒(méi)人再討論植入了。谷歌并不是通過(guò)開(kāi)發(fā)人類大腦來(lái)讓搜索變的更好,他們是在建造一個(gè)只屬于它自身的、獨(dú)一無(wú)二的大腦。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/4295.html
摘要:幾乎沒(méi)有人比歲的更能與深度學(xué)習(xí)緊密地聯(lián)系在一起。他于年成為紐約大學(xué)教授,并從此引領(lǐng)了深度學(xué)習(xí)的發(fā)展。最近,深度學(xué)習(xí)及其相關(guān)領(lǐng)域已然成為最活躍的計(jì)算機(jī)研究領(lǐng)域之一。 本文原載IEEE,作者Lee Gomes,由機(jī)器之心翻譯出品,參與成員:電子羊、翬、泥泥劉、赤龍飛、鄭勞蕾、流明。人工智能經(jīng)歷了幾次低潮時(shí)期,這些灰暗時(shí)光被稱作「AI寒冬」。這里說(shuō)的不是那段時(shí)期,事實(shí)上,人工智能如今變得異?;馃幔?..
摘要:生成式對(duì)抗網(wǎng)絡(luò)簡(jiǎn)稱將成為深度學(xué)習(xí)的下一個(gè)熱點(diǎn),它將改變我們認(rèn)知世界的方式。配圖針對(duì)三年級(jí)學(xué)生的對(duì)抗式訓(xùn)練屬于你的最嚴(yán)厲的批評(píng)家五年前,我在哥倫比亞大學(xué)舉行的一場(chǎng)橄欖球比賽中傷到了自己的頭部,導(dǎo)致我右半身腰部以上癱瘓。 本文作者 Nikolai Yakovenko 畢業(yè)于哥倫比亞大學(xué),目前是 Google 的工程師,致力于構(gòu)建人工智能系統(tǒng),專注于語(yǔ)言處理、文本分類、解析與生成。生成式對(duì)抗網(wǎng)絡(luò)—...
摘要:我仍然用了一些時(shí)間才從神經(jīng)科學(xué)轉(zhuǎn)向機(jī)器學(xué)習(xí)。當(dāng)我到了該讀博的時(shí)候,我很難在的神經(jīng)科學(xué)和的機(jī)器學(xué)習(xí)之間做出選擇。 1.你學(xué)習(xí)機(jī)器學(xué)習(xí)的歷程是什么?在學(xué)習(xí)機(jī)器學(xué)習(xí)時(shí)你最喜歡的書(shū)是什么?你遇到過(guò)什么死胡同嗎?我學(xué)習(xí)機(jī)器學(xué)習(xí)的道路是漫長(zhǎng)而曲折的。讀高中時(shí),我興趣廣泛,大部分和數(shù)學(xué)或科學(xué)沒(méi)有太多關(guān)系。我用語(yǔ)音字母表編造了我自己的語(yǔ)言,我參加了很多創(chuàng)意寫(xiě)作和文學(xué)課程。高中畢業(yè)后,我進(jìn)了大學(xué),盡管我不想去...
摘要:有幾次,人工智能死在人工神經(jīng)網(wǎng)絡(luò)上。在過(guò)去十年中,他一直在舉辦為期一周的有關(guān)神經(jīng)網(wǎng)絡(luò)的暑期學(xué)校,我曾經(jīng)拜訪過(guò)。神經(jīng)網(wǎng)絡(luò)壓縮信息之后,這些信息無(wú)法復(fù)原。 魔法已經(jīng)進(jìn)入這個(gè)世界。如今,許多美國(guó)人口袋里裝著薄薄的黑色平板,這些機(jī)器接入遙遠(yuǎn)的數(shù)字云和衛(wèi)星,它們解碼語(yǔ)言、通過(guò)攝像頭觀察并標(biāo)記現(xiàn)實(shí),挖掘個(gè)人數(shù)據(jù),它們以某種方式理解、預(yù)測(cè)著我們的心愿。傾聽(tīng)、幫助著人類。因?yàn)榕c多倫多大學(xué)有個(gè)約會(huì),這個(gè)夏天,...
摘要:年實(shí)驗(yàn)室團(tuán)隊(duì)采用了深度學(xué)習(xí)獲勝,失敗率僅。許多其他參賽選手也紛紛采用這一技術(shù)年,所有選手都使用了深度學(xué)習(xí)。和他的同事運(yùn)用深度學(xué)習(xí)系統(tǒng)贏得了美元。深度學(xué)習(xí),似乎是解決 三年前,在山景城(加利福尼亞州)秘密的谷歌X實(shí)驗(yàn)室里,研究者從YouTube視頻中選取了大約一千萬(wàn)張靜態(tài)圖片,并且導(dǎo)入到Google Brain —— 一個(gè)由1000臺(tái)電腦組成的像幼兒大腦一樣的神經(jīng)網(wǎng)絡(luò)。花費(fèi)了三天時(shí)間尋找模式之...
閱讀 2432·2021-10-11 10:57
閱讀 1283·2021-10-09 09:59
閱讀 1998·2019-08-30 15:53
閱讀 3215·2019-08-30 15:53
閱讀 1013·2019-08-30 15:45
閱讀 741·2019-08-30 15:44
閱讀 3447·2019-08-30 14:24
閱讀 955·2019-08-30 14:21