摘要:當我的妻子在年前懷孕時,我們進行了超聲波檢查。她進一步告訴我們,他們可以通過羊膜穿刺術查看胎兒實際上是否具有唐氏綜合征的基因改變。但是羊膜穿刺術風險很大,在手術中殺死胎兒的風險大約為。
摘要: Michael Jordan認真的解讀當下的AI到底是什么?
人工智能(AI)是未來的趨勢,這句話是技術人員、學者、記者和風險投資家一致贊同的。如同從技術學術領域跨越到普遍行業(yè)的許多詞語一樣,在使用這些詞語的時候都存在很大的誤解。我們這個時代的最想在某種程度上看到了硅片中的智能的出現(xiàn),它與我們自己的娛樂相媲美,激勵我們并以同樣的方式恐嚇我們。
關于當今的時代,有一種不同的敘述??紤]下面的故事,它涉及人類、計算機、數(shù)據(jù)和生死決定,但這個故事的重點不在于硅片中的幻想。當我的妻子在14年前懷孕時,我們進行了超聲波檢查。房間里有一位遺傳學家,她指出胎兒心臟周圍有一些白色斑點。這些是唐氏綜合征的標志,她指出,現(xiàn)在你的患病風險已經(jīng)上升到了1/20。她進一步告訴我們,他們可以通過羊膜穿刺術查看胎兒實際上是否具有唐氏綜合征的基因改變。但是羊膜穿刺術風險很大,在手術中殺死胎兒的風險大約為1/300。作為統(tǒng)計學家,我決定找出這些數(shù)字來自哪里。在研究的過程中,我發(fā)現(xiàn)一個統(tǒng)計分析,它在英國已經(jīng)進行了十年,這些反映鈣積聚的白色斑點確實是唐氏綜合癥的預測指標。但我也注意到,在我們的測試中使用的成像機器比英國研究中使用的機器每平方英寸多幾百個像素。我回過頭來告訴遺傳學家,我相信這些白斑可能是假陽性,它們實際上是“白噪聲”。她說:啊,這就解釋了為什么我們這幾年唐氏綜合征診斷的增加了。
我們沒有做羊膜穿刺術,幾個月后出生了一個健康的女孩。但是這一事件讓我感到困擾,我確信全世界每天有成千上萬的人得到這種診斷結果,其中許多人選擇了羊膜穿刺手術,而且一些嬰兒可能也因此造成不必要的死亡。其實這個問題不僅僅與數(shù)據(jù)分析本身有關,而且與數(shù)據(jù)庫研究人員稱之為“來源”的問題有關。
作為一名計算機科學家,我首先想到的是建立一種推理和決策系統(tǒng)所需的原則,將計算機科學與統(tǒng)計學相結合,來解決一些現(xiàn)實中存在的問題。不僅在醫(yī)療領域,而且要在商業(yè)、交通和教育等領域,這些原則的發(fā)展至少與建立AI系統(tǒng)的原理一樣重要。
無論我們是否能夠接受“智能”,我們??都面臨著一個現(xiàn)實:人工智能正在改變我們的生活。盡管有些人認為這是屈從于“人工智能”的創(chuàng)造,但也可以用更溫和的方式去看待它,把它當稱一個新的工程分支一樣。就像過去幾十年的土木工程和化學工程一樣,這門新學科的目標是收集幾個關鍵思想的力量,為人們帶來新的能力,并且安全地做到這一點。鑒于土木工程和化學工程建立在物理和化學之上,相應的這個人工智能是建立在過去的給予的基礎上-——“算法”、“數(shù)據(jù)”等等。
不幸的是,我們并不善于預測下一個正在出現(xiàn)的嚴重缺陷。我們?nèi)鄙俚氖且粋€具有分析和設計原理的工程學科。
目前關于這些問題的公開對話過于頻繁地使用“AI”作為智能通配符,這使得很難推斷新興技術的范圍和后果。所以請讓我們從更仔細地考慮最近和歷史上用“AI”來指稱什么。
今天大多數(shù)被稱為“AI”的東西,特別是在公共領域,都被稱為“機器學習”(ML)。在過去的幾十年里,ML是一個算法領域,它將來自統(tǒng)計學、計算機科學和許多其他學科的想法融合在一起,設計算法來處理數(shù)據(jù),做出預測并幫助做出決定。就對現(xiàn)實世界的影響而言,ML是真實的。事實上,ML在20世紀90年代初期就變得非常清晰了,到世紀之交,亞馬遜等具有前瞻性的公司已經(jīng)在他們的業(yè)務中使用了ML,從而解決了欺詐行為中的關鍵任務:后端問題檢測和物流鏈預測以及建立創(chuàng)新的面向消費者的服務,如推薦系統(tǒng)。隨著數(shù)據(jù)集和計算資源在接下來的二十年中快速增長,很明顯,ML不僅為亞馬遜服務,任何公司的決策都開始與ML相關聯(lián)?!皵?shù)據(jù)科學”這個短語開始被用來指代這種模型,反映了ML算法專家需要與數(shù)據(jù)庫和分布式系統(tǒng)專家合作建立可擴展的、強大的ML系統(tǒng)。
從歷史上看,“人工智能”這個詞在1950年代后期被創(chuàng)造出來,指的是在軟件和硬件中實現(xiàn)具有人類智能的實體的強烈愿望。我們使用“模仿人類智能”一詞來指代這一愿望,強調(diào)人工智能實體似乎應該是我們中的一員,至少是在精神上或者身體上。雖然運籌學,統(tǒng)計學,模式識別,信息論和控制論等相關學術領域已經(jīng)存在,并且常常受到人工智能的啟發(fā),但這些領域可以說是集中在“低層次”信號和決策上。比如松鼠能夠感知它所居住的森林的三維結構,并在其分支之間跳躍,對這些領域是鼓舞人心的?!叭斯ぶ悄堋敝荚诩芯τ诓煌氖挛?,例如:人類“理性”和“思考”的“高級”或“認知”能力。然而,60年后,高級推理和思想仍然難以捉摸。目前被稱為“人工智能”的發(fā)展主要出現(xiàn)在與較低級別模式識別和運動控制相關的工程領域以及統(tǒng)計學領域,主要側(cè)重于找到數(shù)據(jù)模式并進行有根據(jù)的預測,假設和決定的測試。
事實上,20世紀80年代早期由David Rumelhart發(fā)現(xiàn)的著名的“反向傳播”算法,現(xiàn)在被視為所謂“AI革命”的核心,最早出現(xiàn)在20世紀50年代的控制理論領域和20世紀60年代,其早期應用之一是優(yōu)化阿波羅太空船在朝向月球時的推力。
自20世紀60年代以來,人工智能取得了很大進展,但它可以說并不是來自追求人性化模擬人工智能。相反,就像阿波羅太空船一樣,這些想法常常隱藏在幕后,盡管對公眾不可見,但文檔檢索、文本分類、欺詐檢測、推薦系統(tǒng)、個性化搜索、社交網(wǎng)絡分析、診斷A / B測試等領域的研究和系統(tǒng)建設取得了重大成功。
人們可以簡單地同意將所有這些稱為“AI”,但這樣的標簽可能會讓統(tǒng)計學研究人員感到意外,這些研究人員醒來時發(fā)現(xiàn)自己突然被稱為“人工智能研究人員”。過去二十年間,訓練AI的愿望通常被稱為“智能增強”(IA),主要是使用計算和數(shù)據(jù)來創(chuàng)建增強人類智慧和創(chuàng)造力的服務。搜索引擎可以被看作是IA的一個例子(它增加了人類的記憶和事實的知識),自然語言翻譯(它增強了人類溝通的能力)也是如此?;谟嬎愕穆曇艉蛨D像生成可以作為藝術家的調(diào)色板和創(chuàng)意增強器。雖然這種服務可能涉及高層次的推理和思想,但目前他們不這樣做,相反他們大多執(zhí)行各種字符串匹配和數(shù)字操作,捕獲人類可以使用的模式。
讓我們廣泛構思“智能基礎設施”(II)學科,即存在一個計算,連接數(shù)據(jù)和物理實體網(wǎng)絡,使人類環(huán)境更具有支持性、趣味性和安全性。這種基礎設施開始在交通,醫(yī)藥,商業(yè)和金融等領域出現(xiàn),對個人和社會有著巨大的影響。它有時出現(xiàn)在關于“物聯(lián)網(wǎng)”的討論中,但是這種想象通常指的是僅僅是將“事物”帶到互聯(lián)網(wǎng)上的過程,而不是與能夠分析這些“事物”。
例如,我們可以想象將我們的生活置于一個“社會規(guī)模的醫(yī)療系統(tǒng)”中,它建立數(shù)據(jù)流和數(shù)據(jù)分析流程,位于人體內(nèi)和周圍的醫(yī)生和設備之間,從而能夠幫助人類診斷和提供護理。該系統(tǒng)將納入身體細胞、DNA、血液檢測、環(huán)境、群體遺傳學和關于藥物和治療的大量科學文獻的信息。它不僅僅關注單個病人和醫(yī)生,還關注所有人類之間的關系 ,就像現(xiàn)在的醫(yī)學檢測允許在一組人類(或動物)上進行的實驗。這將有助于保持相關性、可靠性。而且,人們還可以預見到這樣一個系統(tǒng)出現(xiàn)的許多問題:涉及隱私問題、責任問題、安全問題等,這些問題應該被視為挑戰(zhàn),而不是阻礙者。
我們現(xiàn)在遇到了一個關鍵問題:模擬古典人性化人工智能是面臨這些更大挑戰(zhàn)的最佳選擇還是唯一方法?事實上,最近最受歡迎的ML的成功案例就是人類模仿AI相關的領域,如計算機視覺、語音識別、機器人等。這里有兩點需要說明,首先,盡管人們不會從閱讀報紙中得知它,但人造模擬人工智能的成功實際上是有限的,我們距離實現(xiàn)人性化模擬AI還很遙遠。不幸的是,在仿人工智能AI方面進展甚微的情況下,出現(xiàn)過度夸贊和媒體關注的水平,這在其他工程領域并未出現(xiàn)。
其次,更重要的是,這些領域的成功既不足以解決重要的IA和II問題。為了實現(xiàn)自動駕駛汽車這樣的技術,需要解決一系列工程問題,這些問題可能與人力資源關系不大。整個交通系統(tǒng)(一個II系統(tǒng))可能會更像目前的空中交通管制系統(tǒng),而不是目前收集的松散耦合的、不具有前瞻性的人類駕駛員技能信息。因為它比當前的空中交通管制系統(tǒng)復雜得多,特別是在使用大量數(shù)據(jù)和自適應統(tǒng)計建模來決策時。(地面交通的情況要比空中更負責)
我們不難確定II系統(tǒng)中的算法和基礎設施挑戰(zhàn),這些并不是人類模仿AI研究的核心主題。II系統(tǒng)需要管理分布式知識庫,這些而且知識庫正在迅速變化,并且可能會在全球范圍內(nèi)不連貫。這些系統(tǒng)必須在做出及時的分布式?jīng)Q策時應對云端相互作用,并且他們必須處理長尾現(xiàn)象,因為我們不具有大量的個人數(shù)據(jù)。他們必須解決跨行業(yè)和競爭性界限分享數(shù)據(jù)的困難。最后,特別重要的是,II系統(tǒng)必須將諸如激勵和獎勵之類的經(jīng)濟理念帶入統(tǒng)計和計算基礎設施領域,這些基礎設施將人與對方以及有價物品聯(lián)系起來。諸如音樂,文學和新聞等領域正在呼吁出現(xiàn)這樣的市場,數(shù)據(jù)分析將生產(chǎn)者和消費者聯(lián)系起來。這一切都必須在不斷演變的社會,道德和法律規(guī)范的背景下完成。
當然,經(jīng)典的人造仿真AI問題仍然值得關注。然而,目前的重點是通過收集數(shù)據(jù)進行人工智能研究,部署“深度學習”的基礎設施,以及模仿某些狹義定義的人類技能的系統(tǒng)演示問題。這些問題包括:需要將意義和推理引入進行自然語言處理的系統(tǒng)中,需要推斷和表示因果關系,需要開發(fā)計算上易于處理的不確定表示,以及需要開發(fā)制定并追求長期目標的系統(tǒng)。
IA也是相當重要的,因為在可預見的將來,計算機將無法與人類相匹配地抽象描述現(xiàn)實世界的情況。我們需要經(jīng)過深思熟慮的思考和計算機互動來解決我們最緊迫的問題。我們希望計算機能夠觸發(fā)新的人類創(chuàng)造力水平,而不是取代人類的創(chuàng)造力。
John McCarthy創(chuàng)造了“人工智能”一詞,顯然是為了區(qū)分他的新興研究議題與諾伯特維納的研究議題。維納創(chuàng)造了“控制論”來指代他自己的智能系統(tǒng)愿景,這一愿景與運籌學、統(tǒng)計學、模式識別、信息論和控制理論密切相關。很顯然,今天的“人工智能”的熱度遠遠超過了“控制論”。但我們需要超越麥卡錫和維納的特定歷史觀點。
我們需要認識到,目前關于人工智能的公眾對話(側(cè)重于狹隘的行業(yè)子集和狹窄的學術子集),可能使我們面臨AI、IA和II所帶來的挑戰(zhàn)和機遇的風險。
這個風險不是關于實現(xiàn)科幻夢想或超人類機器的噩夢,更多是關于人類理解和塑造技術的需求,因為它在日常生活中變得更加現(xiàn)實和有影響力。此外,在這種理解和塑造中,需要來自各行各業(yè)的不同聲音,而不僅僅是技術上的對話。
雖然行業(yè)將繼續(xù)推動技術發(fā)展,但學術界也將繼續(xù)發(fā)揮重要作用,不僅在提供一些最具創(chuàng)新性的技術理念時,而且來自其他學科的研究人員的觀點也非常重要,特別是社會科學、認知科學和人文科學。
而且,我們應該接受這樣的事實:我們正在創(chuàng)建一個新的工程分支?!肮こ虒W”這個術語通常在狹義上被引用,在學術界它通常指的是帶有冷酷無情的機器的泛指,以及人類失去控制的消極內(nèi)涵。
但,在當今時代,我們有一個真正的機會來設想一些歷史上的新事物 - 一個以人為中心的工程學科。
本文由@阿里云云棲社區(qū)組織翻譯。
文章原標題《the-fall-of-rnn-lstm》,
譯者:虎說八道,審校:袁虎。
詳情請閱讀原文
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19732.html
摘要:近期,機器學習領域?qū)<覀冴P于深度學習的一些言論引起了極大的轟動。近來,深度學習由于其在模式識別方面的巨大作用激起了人們的廣泛興趣。綜上所述,當前的深度學習主要完成的是對大數(shù)據(jù)的分類和預測。 近期,機器學習領域?qū)<覀冴P于深度學習的一些言論引起了極大的轟動。同時,關于深度學習的開創(chuàng)性和整體架構也在學術界引發(fā)了相當?shù)挠懻摗0殡S著人工智能開始進入進一步開發(fā)應用階段,人們意識到它的成功與否完全取決于其...
摘要:同為美股,百度截至月日的第一季度財報顯示,第一季度百度總營收億元約合億美元,營業(yè)利潤億元約合億美元。這樣一來,難怪此前有言論說京東和螞蟻金服要超過百度的市值,百度對比阿里和騰訊確實符合掉隊論的邏輯。而關于百度的掉隊原因,我認為主要有兩點。當中國互聯(lián)網(wǎng)的增速逐漸放緩,BAT 三巨頭也受到越來越多人的質(zhì)疑。前段時間,因質(zhì)疑騰訊的持續(xù)增長能力,騰訊股價大跌。僅過去一年內(nèi),騰訊就已經(jīng)跌掉超過一萬億元...
摘要:而平心而論,多數(shù)程序員是沒有時間和精力再去拿起數(shù)學概率,再去看全英文的業(yè)界論文,然后研究三五年,出一個成果,因為產(chǎn)出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業(yè)界成熟算法,結合行業(yè)產(chǎn)業(yè)需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
摘要:而平心而論,多數(shù)程序員是沒有時間和精力再去拿起數(shù)學概率,再去看全英文的業(yè)界論文,然后研究三五年,出一個成果,因為產(chǎn)出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業(yè)界成熟算法,結合行業(yè)產(chǎn)業(yè)需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
摘要:而平心而論,多數(shù)程序員是沒有時間和精力再去拿起數(shù)學概率,再去看全英文的業(yè)界論文,然后研究三五年,出一個成果,因為產(chǎn)出比不劃算,但有不能對身邊的變革充耳不聞,不去關注和跟隨變化與趨勢。 AI工程化 AI Engineering,定義如下:不涉及AI、算法、前沿分支的深入研究和探索,而是基于業(yè)界成熟算法,結合行業(yè)產(chǎn)業(yè)需求,形成可落地的可實施的工程方案,稱為AI工程化 當下最熱的是AI,機...
閱讀 1182·2021-11-24 09:39
閱讀 3652·2021-09-02 15:21
閱讀 2191·2021-08-24 10:01
閱讀 749·2021-08-19 10:55
閱讀 2474·2019-08-30 15:55
閱讀 1239·2019-08-30 14:16
閱讀 3019·2019-08-29 15:17
閱讀 3267·2019-08-29 13:53