摘要:機(jī)器視覺背后得深卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和大腦負(fù)責(zé)視覺得結(jié)構(gòu)之間有著驚人的相似之處。這結(jié)果顯示了使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)幫助探測(cè)人類認(rèn)知過(guò)程的可能性。
深卷積神經(jīng)網(wǎng)絡(luò)浪潮席卷人工智能領(lǐng)域。這些程序在某些方面能比人類做得更好,從面部和物體識(shí)別到玩古老的游戲--圍棋等。
神經(jīng)網(wǎng)絡(luò)受到了由大腦結(jié)構(gòu)的啟發(fā)。機(jī)器視覺背后得深卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和大腦負(fù)責(zé)視覺得結(jié)構(gòu)之間有著驚人的相似之處。其中的一個(gè)進(jìn)化了數(shù)百萬(wàn)年,另一個(gè)是僅發(fā)展了短短幾十年。但似乎都以同樣的方式工作。
這引發(fā)了一個(gè)有趣的問(wèn)題,如果機(jī)器視覺和人類視覺用類似的方式工作,他們是否也有同樣的不足?人類和機(jī)器是否不能解決同樣的視覺挑戰(zhàn)?
首先是一些背景信息。在腦中負(fù)責(zé)視力的神經(jīng)在有很多層,他們被認(rèn)為從圖像中提取逐步的詳細(xì)信息,如運(yùn)動(dòng),形狀,顏色,等等。每一層是一個(gè)龐大的神經(jīng)元網(wǎng)絡(luò)。
深卷積神經(jīng)網(wǎng)絡(luò)具有類似的結(jié)構(gòu)。他們也有層的結(jié)構(gòu),并且每個(gè)層由模仿大腦神經(jīng)元的電路結(jié)構(gòu)組成,神經(jīng)網(wǎng)絡(luò)的術(shù)語(yǔ)就是這么來(lái)的。
經(jīng)過(guò)多次試驗(yàn),計(jì)算機(jī)科學(xué)家們發(fā)現(xiàn),這些神經(jīng)網(wǎng)絡(luò)層識(shí)別圖像最好的時(shí)候,每個(gè)層逐步地提取更多信息。而且當(dāng)他們看每個(gè)層的多帶帶行為時(shí),他們發(fā)現(xiàn)和大腦神經(jīng)層有顯著的相似性。
為了找到答案,Kheradpisheh 教授和他的合作人員用了四種物件的識(shí)別難度各異的圖片,然后測(cè)試人類和深卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別能力。
該團(tuán)隊(duì)讓 89 個(gè)人每人識(shí)別 960 個(gè)圖像。研究人員使用每個(gè)實(shí)驗(yàn)者反應(yīng)的速度和準(zhǔn)確性作為他們識(shí)別圖片的測(cè)量。
該小組還在兩個(gè)用于物體識(shí)別的最強(qiáng)大的深度卷積網(wǎng)絡(luò)進(jìn)行了等效試驗(yàn),一個(gè)在加拿大多倫多大學(xué)開發(fā),另一個(gè)在牛津大學(xué)開發(fā)。
結(jié)果是非常有趣的。 “我們發(fā)現(xiàn),人類和深卷積神經(jīng)網(wǎng)絡(luò)很大程度上每一種變化的相對(duì)困難程度詳細(xì),” Kheradpisheh教授說(shuō) “3d旋轉(zhuǎn)是迄今為止最難識(shí)別的,其次是放大縮小,然后在平面內(nèi)旋轉(zhuǎn)?!?/p>
這結(jié)果顯示了使用卷積神經(jīng)網(wǎng)絡(luò)來(lái)幫助探測(cè)人類認(rèn)知過(guò)程的可能性。這項(xiàng)技術(shù)或許可以在某些圖像的設(shè)計(jì)中應(yīng)用,如空中交通管制,緊急出口,使用救生設(shè)備等的指令等。
原文連接: https://www.technologyreview.com/s/601387/why-machine-vision-is-flawed-in-the-same-way-as-human-vision/
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/19603.html
摘要:近年來(lái)機(jī)器學(xué)習(xí)領(lǐng)域隨著深度神經(jīng)網(wǎng)絡(luò)的崛起而迎來(lái)新一波的春天,尤其最近兩年無(wú)論學(xué)界還是業(yè)界,或是各大媒體,甚至文盲老百姓都言必稱智能。 近年來(lái)機(jī)器學(xué)習(xí)、AI領(lǐng)域隨著深度神經(jīng)網(wǎng)絡(luò)(DNN)的崛起而迎來(lái)新一波的春天,尤其最近兩年無(wú)論學(xué)界還是業(yè)界,或是各大媒體,甚至文盲老百姓都言必稱智能。關(guān)于這方面,可討論的東西實(shí)在太多太多,我不想寫成一本厚厚的書,所以在此僅以機(jī)器學(xué)習(xí)在計(jì)算機(jī)視覺和圖像領(lǐng)域的人臉識(shí)...
摘要:本文以機(jī)器翻譯為例,深入淺出地介紹了深度學(xué)習(xí)中注意力機(jī)制的原理及關(guān)鍵計(jì)算機(jī)制,同時(shí)也抽象出其本質(zhì)思想,并介紹了注意力模型在圖像及語(yǔ)音等領(lǐng)域的典型應(yīng)用場(chǎng)景。 最近兩年,注意力模型(Attention Model)被廣泛使用在自然語(yǔ)言處理、圖像識(shí)別及語(yǔ)音識(shí)別等各種不同類型的深度學(xué)習(xí)任務(wù)中,是深度學(xué)習(xí)技術(shù)中最值得關(guān)注與深入了解的核心技術(shù)之一。本文以機(jī)器翻譯為例,深入淺出地介紹了深度學(xué)習(xí)中注意力機(jī)制...
摘要:研究證明,用于加工聽覺信號(hào)的腦區(qū)可用于視覺任務(wù)。我們已經(jīng)發(fā)現(xiàn)為計(jì)算機(jī)圖像視覺通道開發(fā)出來(lái)的圖形處理單元,也可以用于加快語(yǔ)音和語(yǔ)言的機(jī)器學(xué)習(xí)任務(wù)。 最初針對(duì)視覺信號(hào)設(shè)計(jì)出來(lái)的 CNN 也能處理聽覺信號(hào),最終幫助機(jī)器傾聽和更好地理解我們。 CNN 在某些程度上能遷移學(xué)習(xí),掌握多種模式的共同特征。有一系列神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)方法不只是「有深度的」。在這段時(shí)間,針對(duì)先進(jìn)的語(yǔ)音技術(shù)和人工智能的神經(jīng)網(wǎng)絡(luò)變得...
摘要:列車高速撞上來(lái),壓碎了這輛自動(dòng)駕駛汽車,乘客當(dāng)場(chǎng)死亡。的計(jì)算機(jī)科學(xué)家阿塔利表示我們可以把這些東西看作是人工智能網(wǎng)絡(luò)會(huì)以某種方式處理的輸入信息,但機(jī)器在看到這些輸入信息后會(huì)做出一些意想不到的反應(yīng)。谷歌大腦正在研發(fā)智能機(jī)器。 簡(jiǎn)評(píng):如果人工智能犯了錯(cuò)怎么辦? 乘客看到了停車標(biāo)志,突然感到一陣恐慌,因?yàn)樗畛说淖詣?dòng)駕駛汽車反而開始加速。 當(dāng)他看到前面的鐵軌上一列火車向他們疾馳而來(lái)時(shí),他張開嘴...
摘要:深度學(xué)習(xí)推動(dòng)領(lǐng)域發(fā)展的新引擎圖擁有記憶能力最早是提出用來(lái)解決圖像識(shí)別的問(wèn)題的一種深度神經(jīng)網(wǎng)絡(luò)。深度學(xué)習(xí)推動(dòng)領(lǐng)域發(fā)展的新引擎圖深度神經(jīng)網(wǎng)絡(luò)最近相關(guān)的改進(jìn)模型也被用于領(lǐng)域。 從2015年ACL會(huì)議的論文可以看出,目前NLP最流行的方法還是機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí),所以本文會(huì)從深度神經(jīng)網(wǎng)絡(luò)的角度分析目前NLP研究的熱點(diǎn)和未來(lái)的發(fā)展方向。我們主要關(guān)注Word Embedding、RNN/LSTM/CN...
閱讀 1248·2023-04-25 17:05
閱讀 3046·2021-11-19 09:40
閱讀 3678·2021-11-18 10:02
閱讀 1778·2021-09-23 11:45
閱讀 3059·2021-08-20 09:36
閱讀 2817·2021-08-13 15:07
閱讀 1166·2019-08-30 15:55
閱讀 2497·2019-08-30 14:11