摘要:關(guān)于公司公司是一個(gè)全球性的自然語(yǔ)言理解公司,成立于年。該公司的目標(biāo)是創(chuàng)造出智能的機(jī)器,與人類(lèi)攜手共進(jìn),一同推動(dòng)人類(lèi)智慧的發(fā)展。
MALUUBA是一家深度學(xué)習(xí)公司,位于加拿大魁北克省蒙特利爾市,致力于從事促進(jìn)機(jī)器人像人類(lèi)一樣思考、推理和交流的事業(yè)。該公司今天宣布即將公開(kāi)發(fā)行兩個(gè)復(fù)雜的自然語(yǔ)言理解數(shù)據(jù)集。在資源的可利用化過(guò)程中,MALUUBA公司旨在進(jìn)一步推動(dòng)和促進(jìn)人工智能領(lǐng)域的研究,以取得突破性創(chuàng)新成果。
Maluuba公司的新數(shù)據(jù)集是自然產(chǎn)生的,而不是人工生成的,它探索了人類(lèi)在讀寫(xiě)和對(duì)話方面的基本能力。這些數(shù)據(jù)集具有一定的復(fù)雜性,目前已經(jīng)應(yīng)用于開(kāi)發(fā)機(jī)器的閱讀理解能力、面向目標(biāo)的對(duì)話系統(tǒng)和對(duì)話接口領(lǐng)域的研究。
“我們相信,語(yǔ)言的理解能力是人工智能最基本的能力。” Maluuba公司的合伙人兼首席技術(shù)官卡希爾·蘇勒曼(KaheerSuleman)表示,“我們由衷地希望,Maluuba公司的數(shù)據(jù)集能夠推動(dòng)人工智能和自然語(yǔ)言領(lǐng)域的發(fā)展,希望全世界能一起實(shí)現(xiàn)我們的目標(biāo)——機(jī)器與人類(lèi)直接交流?!?/p>
Maluuba公司研發(fā)的第一個(gè)數(shù)據(jù)集是NewsQA,主要用于訓(xùn)練可以回答復(fù)雜問(wèn)題的算法,它需要具備人類(lèi)級(jí)別的理解能力和推理技巧。利用來(lái)自DeepMind問(wèn)答數(shù)據(jù)集中的CNN文章,Maluuba公司準(zhǔn)備了一個(gè)基于眾包的機(jī)器閱讀語(yǔ)料庫(kù),包含120000個(gè)問(wèn)答對(duì)。集合方法論的基礎(chǔ)是不完全信息和好奇心理。這些問(wèn)題需要通過(guò)推理才能總結(jié)出答案,比如綜合法、推理法和模糊處理法,這與那些只專(zhuān)注于量而處理簡(jiǎn)單問(wèn)題的數(shù)據(jù)集不同。最終,只有穩(wěn)定的數(shù)據(jù)集才能進(jìn)一步推動(dòng)自然語(yǔ)言研究的進(jìn)步。
蒙特利爾大學(xué)計(jì)算機(jī)科學(xué)和運(yùn)籌學(xué)學(xué)院(DIRO)的助理教授亞倫·考維爾(AaronCourville)博士表示:“開(kāi)發(fā)此數(shù)據(jù)集的過(guò)程中,我們付出很多努力,這些努力將推動(dòng)機(jī)器閱讀理解的發(fā)展?!?/p>
Maluuba公司的第二個(gè)數(shù)據(jù)集是Frames,它包含19986個(gè)問(wèn)答對(duì),可以用來(lái)訓(xùn)練自然會(huì)話過(guò)程中的深度學(xué)習(xí)算法。以上眾多基于文本的對(duì)話記錄,來(lái)源于兩個(gè)人之間的模擬對(duì)話,這兩個(gè)人一個(gè)是度假咨詢者,另一個(gè)是旅行社代理。其中,從一個(gè)話題過(guò)度到另一個(gè)話題的過(guò)程輕松而流暢,比如航班、日期、住宿以及其它等問(wèn)題能在對(duì)話中自然出現(xiàn)。對(duì)于其它的對(duì)話數(shù)據(jù)集,我們一般假設(shè)該對(duì)話沒(méi)有記憶性,只考慮并記錄每步對(duì)話中一組用戶的約束條件。與第一個(gè)數(shù)據(jù)集NewsQA不同,F(xiàn)rames數(shù)據(jù)集需要開(kāi)發(fā)全新的狀態(tài)跟蹤模型。
“這個(gè)新的數(shù)據(jù)集非常重要,它讓標(biāo)準(zhǔn)對(duì)話任務(wù)所涉及的領(lǐng)域得到了擴(kuò)展,例如,比較和探索不同用戶的選擇?!焙杖?瓦特大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院(MACS)的教授奧利弗·萊蒙(Oliver Lemon)博士表示,“搭建支持這些任務(wù)的會(huì)話系統(tǒng)是一個(gè)極具吸引力的挑戰(zhàn)過(guò)程,F(xiàn)rames數(shù)據(jù)集將會(huì)幫助實(shí)現(xiàn)這一過(guò)程?!?/p>
“對(duì)于人工智能研究員來(lái)說(shuō),諸如Maluuba公司開(kāi)發(fā)的Frames數(shù)據(jù)集等相關(guān)內(nèi)容,將會(huì)在面向目標(biāo)的對(duì)話研究中發(fā)揮至關(guān)重要的作用。”赫瑞-瓦特大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院(MACS)的副教授韋雷娜·里斯(Verena Rieser)博士表示,“在MACS交互實(shí)驗(yàn)室,我們正在開(kāi)展口語(yǔ)對(duì)話和響應(yīng)生成方面的學(xué)術(shù)研究,而Frames數(shù)據(jù)集將對(duì)我們的研究十分有幫助?!?/p>
研究社群可以訪問(wèn) https://datasets.maluuba.com 來(lái)獲取Maluuba公司的數(shù)據(jù)集。
關(guān)于Maluuba公司
Maluuba 公司是一個(gè)全球性的自然語(yǔ)言理解公司,成立于2011年。該公司的目標(biāo)是創(chuàng)造出智能的機(jī)器,與人類(lèi)攜手共進(jìn),一同推動(dòng)人類(lèi)智慧的發(fā)展。2016年,Maluuba公司在蒙特利爾開(kāi)設(shè)了一個(gè)研究實(shí)驗(yàn)室, 致力于解決創(chuàng)新產(chǎn)品在語(yǔ)言理解方面面臨的基本問(wèn)題,這將進(jìn)一步推動(dòng)人工智能系統(tǒng)的發(fā)展。
歡迎加入本站公開(kāi)興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法,實(shí)際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘工具,報(bào)表系統(tǒng)等全方位知識(shí)
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/4446.html
摘要:年的深度學(xué)習(xí)研討會(huì),壓軸大戲是關(guān)于深度學(xué)習(xí)未來(lái)的討論。他認(rèn)為,有潛力成為深度學(xué)習(xí)的下一個(gè)重點(diǎn)。認(rèn)為這樣的人工智能恐懼和奇點(diǎn)的討論是一個(gè)巨大的牽引。 2015年ICML的深度學(xué)習(xí)研討會(huì),壓軸大戲是關(guān)于深度學(xué)習(xí)未來(lái)的討論?;谄胶饪紤],組織方分別邀請(qǐng)了來(lái)自工業(yè)界和學(xué)術(shù)界的六位專(zhuān)家開(kāi)展這次圓桌討論。組織者之一Kyunghyun Cho(Bengio的博士后)在飛機(jī)上憑記憶寫(xiě)下本文總結(jié)了討論的內(nèi)容,...
摘要:排名第二位的是微軟,同比大增第三是,增幅為以的增長(zhǎng)速度位居第四,這是在增速方面唯一位於落後於亞馬遜網(wǎng)絡(luò)服務(wù)的主要服務(wù)提供商。這些最新發(fā)布的數(shù)據(jù)與近期發(fā)布的預(yù)測(cè)數(shù)據(jù)相一致,表明云計(jì)算和軟體即服務(wù)全球收入將在年突破億美元大關(guān)。據(jù)國(guó)外媒體報(bào)道,Canalys在2017年第二季度業(yè)績(jī)報(bào)告中指出,云計(jì)算基礎(chǔ)設(shè)施市場(chǎng)同比增長(zhǎng)47%,達(dá)140億美元。分析顯示,總體來(lái)說(shuō),四大云服務(wù)提供商占整個(gè)云基礎(chǔ)設(shè)施服務(wù)...
摘要:月日,各項(xiàng)競(jìng)賽的排名將決定最終的成績(jī)排名。選手通過(guò)訓(xùn)練模型,對(duì)虛擬股票走勢(shì)進(jìn)行預(yù)測(cè)。冠軍將獲得萬(wàn)元人民幣的獎(jiǎng)勵(lì)。 showImg(https://segmentfault.com/img/bVUzA7?w=477&h=317); 2017年9月4日,AI challenger全球AI挑戰(zhàn)賽正式開(kāi)賽,來(lái)自世界各地的AI高手,將展開(kāi)為期三個(gè)多月的比拼,獲勝團(tuán)隊(duì)將分享總額超過(guò)200萬(wàn)人民幣的...
閱讀 1932·2021-11-22 09:34
閱讀 1163·2021-10-09 09:44
閱讀 3053·2021-09-29 09:35
閱讀 3630·2021-09-14 18:01
閱讀 1499·2021-08-16 10:49
閱讀 1099·2019-08-29 14:11
閱讀 863·2019-08-29 12:47
閱讀 3085·2019-08-26 13:47