成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

圖文并茂揭開(kāi)深度學(xué)習(xí)神秘面紗,兼談人工智能狂熱的荒誕

jimhs / 2413人閱讀

摘要:對(duì)深度學(xué)習(xí)模型而言,水就是海量的數(shù)據(jù)。就拿機(jī)器識(shí)別物體這樣的任務(wù)來(lái)說(shuō),通過(guò)數(shù)百萬(wàn)副圖片的訓(xùn)練,深度學(xué)習(xí)模型甚至可以超過(guò)人的肉眼的識(shí)別能力,這確實(shí)是人工智能在感知類(lèi)問(wèn)題上重要的里程碑。關(guān)于深度學(xué)習(xí),還有一個(gè)有趣的現(xiàn)象。

說(shuō)到人工智能和機(jī)器人,上點(diǎn)兒歲數(shù)的碼農(nóng)們可能對(duì)封面這張圖有點(diǎn)印象。不明就里的朋友,可以回去補(bǔ)習(xí)一下《編輯部的故事》。

我是個(gè)二手的人工智能表演藝術(shù)家:從博士畢業(yè)開(kāi)始,就在MSRA做了幾年語(yǔ)音識(shí)別項(xiàng)目的研究。雖然我們的兩任院長(zhǎng)——李開(kāi)復(fù)老師和洪小文老師都是語(yǔ)音研究出身,卻絲毫不能改變當(dāng)年這一項(xiàng)目在全院最雞肋的地位。

為什么雞肋呢?因?yàn)樵诋?dāng)年,各種各樣的人工智能應(yīng)用能真刀真槍上陣的并不多。就拿語(yǔ)音識(shí)別來(lái)說(shuō),從幾十年前IBM和AT&T提出人類(lèi)用語(yǔ)音與機(jī)器交互這一偉大的設(shè)想以來(lái),就有無(wú)數(shù)的業(yè)內(nèi)業(yè)外人士為之激動(dòng)、為之奮斗,也為之失望。我們都知道新技術(shù)的發(fā)展有條Gartner曲線,先被炒得大熱,再跌下來(lái),又慢慢爬坡到穩(wěn)定的狀態(tài)。語(yǔ)音識(shí)別或人工自然則不然:它被爆炒了好幾次,也深深地摔下來(lái)好幾次。這一方面反映了人工智能問(wèn)題的巨大吸引力,也體現(xiàn)了它巨大的難度。在我從事語(yǔ)音的那幾年,恰逢一個(gè)谷底時(shí)期,那是有無(wú)數(shù)的“有識(shí)之士”紛紛站出來(lái)表達(dá)對(duì)互聯(lián)網(wǎng)糙快猛的膜拜,并夾槍帶棒地表達(dá)對(duì)人工智能的鄙夷,認(rèn)為我們不過(guò)是馬勺上的蒼蠅——混飯吃的。我們要是向互聯(lián)網(wǎng)界提起自己是做“語(yǔ)音識(shí)別”的,也放佛在兩會(huì)會(huì)場(chǎng)上上偷看了毛片那樣無(wú)地自容。

然而不得不說(shuō),在真正從事人工智能的那幾年里,我接觸到了到目前為止看來(lái)最嚴(yán)謹(jǐn)、最具學(xué)者風(fēng)范的幾位良師和益友。比如我第一任的老板,Bell Labs來(lái)的資深科學(xué)家宋謌平老師、第二任的老板,原港大教授霍強(qiáng)老師、以及多年的好友,現(xiàn)科大訊飛執(zhí)行總裁胡郁等。這些人工智能專(zhuān)家身上都有一種共同的特質(zhì):思維深邃又有獨(dú)立見(jiàn)解,長(zhǎng)期甘守寂寞,在人工智能的低潮期從未放棄探索與研究。

那么事情是什么時(shí)候發(fā)生轉(zhuǎn)折的呢?2010年前后,我以前微軟的同事俞棟老師、鄧力老師等,將深度學(xué)習(xí)在圖像領(lǐng)域的突破移植到語(yǔ)音識(shí)別領(lǐng)域,一下子把識(shí)別錯(cuò)誤率降低了20%以上,這讓原來(lái)感覺(jué)總是差點(diǎn)兒火候的語(yǔ)音識(shí)別突然看到了在某些場(chǎng)景下實(shí)用的希望。從圖像、語(yǔ)音等領(lǐng)域的突破開(kāi)始,人工智能的一個(gè)新春天又悄然來(lái)臨,同時(shí)也火了“深度學(xué)習(xí)”這個(gè)詞。

“深度學(xué)習(xí)”這個(gè)詞兒,實(shí)在是太美妙了,不是有鄧麗君的一句歌詞么?“你問(wèn)我愛(ài)你有多深?我愛(ài)你八公分!”深,就意味著莫測(cè),意味著正常人的智商大概難以企及。正常人不明白的事兒從我嘴里說(shuō)出來(lái),那我不牛逼誰(shuí)牛逼?就是因?yàn)檫@樣一個(gè)逼格甚高的詞兒(有點(diǎn)兒像廣告領(lǐng)域的“程序化交易”),再加上若干人工智能應(yīng)用確實(shí)有了一定的突破,在今天,人工智能已經(jīng)替代大數(shù)據(jù)、O2O,成為互聯(lián)網(wǎng)各位賣(mài)野藥的、開(kāi)秀場(chǎng)的、搞劫持的、做流氓軟件的諸企業(yè)家們較好的春藥。

在春藥的加持下,大佬們紛紛把自己滿肚子的互聯(lián)網(wǎng)思維嘔吐出來(lái),擺出一副智能仁波切的嘴臉,像念“嗡嘛呢叭咪吽”那樣把“人工智能、深度學(xué)習(xí)、機(jī)器人、無(wú)人駕駛”等詞匯擺在嘴邊,并且具備了時(shí)刻達(dá)到高潮的能力。我曾經(jīng)有幸聽(tīng)過(guò)幾位大佬有關(guān)人工智能的論述和演講,據(jù)說(shuō)他們都已經(jīng)成為人工智能先驅(qū)者一個(gè)多禮拜了。就內(nèi)容而言,有一種郭德綱做政府工作報(bào)告的莫名喜感,只不過(guò)沒(méi)有那么密集的包袱罷了。

在智商不夠的人看來(lái),一切都是智能的。于是乎,一些充滿了邪教氣息的論斷,在互聯(lián)網(wǎng)界開(kāi)始甚囂塵上,例如:

“機(jī)器學(xué)習(xí)模型依靠左右互搏,可以迅速達(dá)到很高的智能水準(zhǔn)?!保ㄕf(shuō)他們智商低,是因?yàn)檫@一點(diǎn)他們真信了。)

“人工智能毀滅人類(lèi)的奇點(diǎn)即將來(lái)到!”(我認(rèn)為機(jī)器早就能毀滅人類(lèi)了,不過(guò)這跟人工智能并沒(méi)有關(guān)系。)

“只有人工智能才能拯救人類(lèi)!”(潛臺(tái)詞是:只有我這樣人工智能的使者才能拯救你們?。?/p>

“我們的產(chǎn)品融合了大數(shù)據(jù)和人工智能技術(shù)?!保ㄆ鋵?shí)多數(shù)情況下不過(guò)是用Hadoop跑了個(gè)腳本。)

實(shí)際上,到今天為止,無(wú)論什么樣的機(jī)器學(xué)習(xí),本質(zhì)上都是在統(tǒng)計(jì)數(shù)據(jù),從中歸納出模型。實(shí)際上,很早以前大家就認(rèn)識(shí)到,深層的神經(jīng)網(wǎng)絡(luò)比起淺層的模型,在參數(shù)數(shù)量相同的情形下,深層模型具有更強(qiáng)的表達(dá)能力。這個(gè)概念說(shuō)起來(lái)也好理解:用同樣的面積的鐵皮,做個(gè)桶比做個(gè)盤(pán)子盛的水要多一些。對(duì)此,馬三立大師早有論述:碗比盤(pán)深,盆比碗深,缸比盆深,最淺的是碟子,最深的是缸。而盤(pán)子或桶里的水,則類(lèi)比于模型可以接納并總結(jié)的數(shù)據(jù):太淺層的模型,其實(shí)很容易自滿,即使有大量的數(shù)據(jù)灌進(jìn)去,也并沒(méi)有什么卵用。

既然很早就知道深層模型的表達(dá)能力更強(qiáng),那么為什么近年來(lái)深度學(xué)習(xí)才大放異彩呢?那是因?yàn)橥半m然盛水多,我們以前卻沒(méi)有掌握將它高效率地灌滿的辦法。也就是說(shuō),以前對(duì)深度神經(jīng)網(wǎng)絡(luò),沒(méi)有太有效的工程優(yōu)化方法。一個(gè)大桶擺在那兒,卻只能用耳挖勺一勺勺往里灌水,多怎才能灌滿???直到本世紀(jì),Geoffrey Hilton和他的學(xué)生發(fā)明了用GPU來(lái)優(yōu)化深度神經(jīng)網(wǎng)絡(luò)的工程方法,這就好比灌水時(shí)發(fā)明了水管,極大地提高了效率。這樣的工程方法產(chǎn)生后,深度神經(jīng)網(wǎng)絡(luò)才變成工業(yè)界實(shí)用的武器,并且在若干領(lǐng)域都帶來(lái)了里程碑式的變化。

桶有了,水管也有了,還缺什么呢?當(dāng)然就是水了。對(duì)深度學(xué)習(xí)模型而言,水就是海量的數(shù)據(jù)。比方說(shuō)原來(lái)用淺層的模型做人臉識(shí)別,訓(xùn)練樣本到了一定的規(guī)模,再多就沒(méi)有用了,因?yàn)楸P(pán)子已經(jīng)灌滿了,再灌就盛不了了??墒?,改用深度學(xué)習(xí),再加上有了水管以后,數(shù)據(jù)一直往里面灌,模型還是可以繼續(xù)學(xué)習(xí)和提高。就拿機(jī)器識(shí)別物體這樣的任務(wù)來(lái)說(shuō),通過(guò)數(shù)百萬(wàn)副圖片的訓(xùn)練,深度學(xué)習(xí)模型甚至可以超過(guò)人的肉眼的識(shí)別能力,這確實(shí)是人工智能在感知類(lèi)問(wèn)題上重要的里程碑。

然而,上面的例子提醒我們:人工智能和人的智能,還真的不是一回事。幾歲的小孩子,大人給他指過(guò)一次貓,下次他十有八九就能認(rèn)出來(lái)。然而不論是多強(qiáng)的人工智能模型,也不可能看幾張貓的圖片,就能準(zhǔn)確地認(rèn)識(shí)貓。也就是說(shuō),深度神經(jīng)網(wǎng)絡(luò)的“智能”,是建立在海量數(shù)據(jù)基礎(chǔ)之上的,因此,深度學(xué)習(xí)與大數(shù)據(jù),有著非常緊密的內(nèi)在聯(lián)系。

關(guān)于深度學(xué)習(xí),還有一個(gè)有趣的現(xiàn)象。就目前情況來(lái)看,深度學(xué)習(xí)技術(shù)在互聯(lián)網(wǎng)應(yīng)用(例如廣告、推薦等)上取得的提高,沒(méi)有語(yǔ)音圖像這些領(lǐng)域那樣顯著。這里面有什么規(guī)律性的解釋么?個(gè)人認(rèn)為,自然現(xiàn)象的數(shù)據(jù)處理,例如語(yǔ)音識(shí)別,我們完全可以通過(guò)主動(dòng)的語(yǔ)料采集,讓各個(gè)phoneme甚至biphone、triphone都挺有充分的覆蓋;而互聯(lián)網(wǎng)收集的社會(huì)行為,例如廣告點(diǎn)擊、新聞閱讀這些數(shù)據(jù),Ground truth并不清晰:即使對(duì)于同一個(gè)人、同一則廣告、同一個(gè)廣告位,點(diǎn)擊與否也是個(gè)很不確定的事件,而這樣的不確定性即使引入再多的上下文信息,也不可能消除。而引入了大量的上下文信息(即模型需要的feature)后,在每個(gè)片段上的數(shù)據(jù)實(shí)際上非常稀少,并不能滿足深度學(xué)習(xí)模型徹底進(jìn)化的需要。怎么解決這個(gè)問(wèn)題呢?最近爆火的Alphago采用的deep reinforcement learning方法論,或有是個(gè)啟發(fā)。

以上種種人工智能技術(shù)經(jīng)歷的磨難與輝煌,乃至更加波瀾壯闊的未來(lái),都需要參與者們抱定一顆平常心,以十年磨一劍的決心和毅力去攻克一個(gè)個(gè)產(chǎn)品與技術(shù)難關(guān)。同時(shí),這需要對(duì)于科學(xué)技術(shù)真正的信仰與堅(jiān)持,因?yàn)槿斯ぶ悄懿煌谫u(mài)盒飯或者搞劫持,凡小學(xué)肄業(yè)以上文化程度,對(duì)手段之道德底線無(wú)特殊要求者皆可以勝任,它需要對(duì)于科學(xué)技術(shù)真正的信仰與堅(jiān)持,對(duì)于背景理論多年的修養(yǎng)與磨練,遠(yuǎn)非看上去那樣簡(jiǎn)單美好。

資本與大佬們對(duì)于人工智能的追捧,當(dāng)然不能說(shuō)是壞事。不過(guò)說(shuō)實(shí)話,在里面確實(shí)也能多少嗅出一些單純追逐風(fēng)口、順風(fēng)接屁的惡趣味。這個(gè)領(lǐng)域已經(jīng)被捧殺了好幾回,好不容易有些轉(zhuǎn)機(jī),還是給大家正確的普及、合理的預(yù)期比較重要。就拿語(yǔ)音識(shí)別來(lái)說(shuō),Benchmark集合上詞正確率的提升,其實(shí)并不意味著人機(jī)直接用語(yǔ)言進(jìn)行交流已經(jīng)可以暢通無(wú)阻:各種復(fù)雜噪音環(huán)境下的魯棒性問(wèn)題、自然語(yǔ)言理解的巨大挑戰(zhàn)、找到適合語(yǔ)音交流的殺手級(jí)應(yīng)用場(chǎng)景,這些都是當(dāng)我們推門(mén)以為豁然開(kāi)朗時(shí),又發(fā)現(xiàn)橫亙?cè)诿媲暗耐跷菖c太行。理性的人工智能從業(yè)者,不要輕信各種花色品種的大佬們場(chǎng)外吃了春藥后的搖旗吶喊——因?yàn)槟悴⒎钦蚪K點(diǎn)沖刺,而是剛剛踏上跑道。

(圖片來(lái)自@南大周志華 老師微博)

春藥吃下去,High是能High一陣,但精盡人亡就不好了。那些把人工智能捧成耶和華一般的行業(yè)分析師與大佬,是十分值得警惕的:我敢斷言,當(dāng)此領(lǐng)域再遇波折,將“人工智能”這四個(gè)字踩在腳下、惡狠狠淬上一口的,還會(huì)是這一撥人。而其中有些個(gè)別人惡俗的熱捧,則可以說(shuō)是人工智能的恥辱——西施長(zhǎng)得好不好,是不需要八大胡同的選美比賽來(lái)品頭論足的。

作者介紹

北冥乘海生 ,360商業(yè)產(chǎn)品首席架構(gòu)師,前MediaV首席科學(xué)家

歡迎加入本站公開(kāi)興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)

QQ群:81035754

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/4357.html

相關(guān)文章

  • 揭開(kāi)多重身份神秘面紗

    摘要:解開(kāi)多云戰(zhàn)略的神秘面紗組織今天需要采取的關(guān)鍵步驟是云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。在多云環(huán)境中,規(guī)模和復(fù)雜性的挑戰(zhàn)只會(huì)增加。當(dāng)一個(gè)組織缺乏對(duì)其多云基礎(chǔ)設(shè)施的可視性時(shí),會(huì)出現(xiàn)許多問(wèn)題。解開(kāi)多云戰(zhàn)略的神秘面紗:組織今天需要采取的關(guān)鍵步驟是:云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。Gartner預(yù)測(cè),到...

    付倫 評(píng)論0 收藏0
  • 用大白話揭開(kāi)Ajax長(zhǎng)輪詢(long polling)神秘面紗

    摘要:在看這篇長(zhǎng)輪詢之前可以先看看輪詢技術(shù)沒(méi)有長(zhǎng),有助于理解長(zhǎng)輪詢屬于輪詢的升級(jí)版,在客戶端和服務(wù)端都進(jìn)行了一些改造,使得消耗更低,速度更快。不間斷的通過(guò)查詢服務(wù)端。然后客戶端不間斷繼續(xù)發(fā)起請(qǐng)求數(shù)據(jù)不存在,繼續(xù)循環(huán)。 在看這篇Ajax長(zhǎng)輪詢之前可以先看看Ajax輪詢技術(shù)(沒(méi)有長(zhǎng)),有助于理解: Ajax長(zhǎng)輪詢屬于Ajax輪詢的升級(jí)版,在客戶端和服務(wù)端都進(jìn)行了一些改造,使得消耗更低,速度更快。...

    AlphaGooo 評(píng)論0 收藏0
  • 揭開(kāi)多重身份神秘面紗

    摘要:解開(kāi)多云戰(zhàn)略的神秘面紗組織今天需要采取的關(guān)鍵步驟是云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。在多云環(huán)境中,規(guī)模和復(fù)雜性的挑戰(zhàn)只會(huì)增加。當(dāng)一個(gè)組織缺乏對(duì)其多云基礎(chǔ)設(shè)施的可視性時(shí),會(huì)出現(xiàn)許多問(wèn)題。解開(kāi)多云戰(zhàn)略的神秘面紗:組織今天需要采取的關(guān)鍵步驟是:云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。Gartner預(yù)測(cè),到...

    lscho 評(píng)論0 收藏0
  • 揭開(kāi)多重身份神秘面紗

    摘要:解開(kāi)多云戰(zhàn)略的神秘面紗組織今天需要采取的關(guān)鍵步驟是云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。在多云環(huán)境中,規(guī)模和復(fù)雜性的挑戰(zhàn)只會(huì)增加。當(dāng)一個(gè)組織缺乏對(duì)其多云基礎(chǔ)設(shè)施的可視性時(shí),會(huì)出現(xiàn)許多問(wèn)題。解開(kāi)多云戰(zhàn)略的神秘面紗:組織今天需要采取的關(guān)鍵步驟是:云行業(yè)正以閃電般的速度發(fā)展,企業(yè)采用多云技術(shù)由于需要更快的數(shù)字化轉(zhuǎn)型而日益成為主流。Gartner預(yù)測(cè),到...

    zhangke3016 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

jimhs

|高級(jí)講師

TA的文章

閱讀更多
最新活動(dòng)
閱讀需要支付1元查看
<