摘要:摘要本文以過來人的身份將自身年的研究經(jīng)驗做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。此外,還有各種會議也值得關(guān)注。三大會議分別是以及。此外,當(dāng)演講者向現(xiàn)場觀眾演講時,他們往往優(yōu)先考慮的是清晰度而不是簡潔性。
摘要: 本文以過來人的身份將自身2年的研究經(jīng)驗做了一下分享,希望本文對于即將開始從事人工智能研究的朋友有所幫助。
人工智能研究這個領(lǐng)域是有一定門檻的。對于初學(xué)者來說,一般通常的做法是直接購買一些熱門的書籍,比如“西瓜書”、“花書”、“xx天從入門到精通”、“xx天從入門到放棄”等等,但大多數(shù)書籍都是講的基礎(chǔ)知識,稍顯乏味和枯燥,此外內(nèi)容太深奧,初學(xué)者可能看一段時間就想放棄了。本文以過來人的身份將自身2年的研究經(jīng)驗毫無保留地分享給大家,希望對即將開始從事人工智能研究的朋友有所幫助。
起步找一個你隨時方便提問的人
剛進入公司時,常常會對一些基本問題猶豫不決,這些問題可能會暴露出自身缺乏專業(yè)知識。但是過了幾個月后,我的提問才慢慢感到自然,提問都是精心擬定的。在此之前,我會積累大量的問題,但現(xiàn)在只要遇到一個問題,我就會立馬提問,這樣不會造成問題積壓以至于越來越困惑。
尋找不同領(lǐng)域的研究靈感
現(xiàn)在不是單打獨斗的時代,講究合作。知識也不例外,多學(xué)科交流。對于每個人而言,決定從事什么方向可能是研究中最困難的部分,以下是我所看到的一些具有長期記錄的研究人員所采用的策略:
與不同領(lǐng)域的研究人員交流。咨詢他們感興趣的問題,詢問是否有想要分析的數(shù)據(jù)集、現(xiàn)有技術(shù)存在哪些不足。機器學(xué)習(xí)中最有效的工作是與生物學(xué)、化學(xué)、物理、社會科學(xué)或純數(shù)學(xué)的碰撞。例如,我正在思考Matthew
Johnson 在2016年NIPS的文章以及Justin
Gilmer在2017年ICML的文章,兩篇文章分別是關(guān)于鼠標(biāo)行為數(shù)據(jù)集的分析以及量子化學(xué)的應(yīng)用;
編寫一個簡單的基線以獲得對問題的感覺。比如,嘗試編寫一些用于控制倒立擺的校準代碼。在寫基線代碼時,會遇到很多情況、各種問題或者一些臨時產(chǎn)生的想法,這些都能夠加深對問題的理解。
擴展喜歡的某篇論文的實驗部分。仔細閱讀一篇論文,了解其采用的方法和獲得的實驗結(jié)果,設(shè)法找到一些可以完善的地方。首先考慮最簡單的擴展,然后思考下論文的方法是否合理,實驗結(jié)果有沒有不完善的地方。
重視可視化工具和技能
運行可視化腳本允許我們快速驗證代碼是否與想法匹配。更重要的是,良好的可視化往往使得想法和代碼中的錯誤變得更加明顯以及可解釋性。
對于一個實際任務(wù),想出解決問題的正確方法是很困難的。如果采用的是迭代優(yōu)化模型(比如深度學(xué)習(xí)),那么繪制出損失函數(shù)會是一個好的開端。此外,對于深度學(xué)習(xí)這個“黑匣子”方法,可視化也能夠部分解釋其學(xué)習(xí)到的神經(jīng)網(wǎng)絡(luò)參數(shù)。比如,當(dāng)處理圖形模型事,可視化其一維或二維變量的分布,當(dāng)它改變時,可以推斷出很多信息。可視化是技術(shù)有效性的晴雨表,每次可視化分析結(jié)果都能對所采用的的方法或代碼起到一定的反饋。
TensorFlow可視化工具Tensorboard
分布圖
Q值學(xué)習(xí)圖
弄清楚研究者和論文的最初動機
在學(xué)術(shù)界可以發(fā)現(xiàn)很好玩的現(xiàn)象,研究人員在同一個會議上發(fā)表論文,使用相同的技術(shù)行話,但兩個人的研究動機可以是完全相反的。動機分為以下三個動機——“數(shù)學(xué)”動機、“工程”動機和“認知”動機:
“數(shù)學(xué)”動機:智能系統(tǒng)的基本屬性和局限性是什么?
“工程”動機:如何開發(fā)比其它方法更好地解決實際問題的智能系統(tǒng)?
“認知”動機:如何模擬像人類或其它動物那樣的自然智能?
有些論文不止一個動機,此外,每個研究者的動機不可能一直保持不變,這和工程師的興趣有關(guān)。優(yōu)秀的論文和研究人員將在一開始就說明其研究動機,但有些論文往往表述的不是很清楚,這就需要讀者們仔細閱讀,此外,在自己寫作時也要注意這一點,以防動機不明顯而被退稿或退修。
深入研究學(xué)會找論文
網(wǎng)絡(luò)上充斥著大量的人工智能論文,大多數(shù)人首先會發(fā)表在arXiv上,由于該平臺可以先發(fā)表再經(jīng)過審稿,因此需要學(xué)會從中辨別。另外,建議在社交軟件上跟蹤你最喜歡的研究人員的動態(tài)。此外,還有各種會議也值得關(guān)注。三大會議分別是NIPS、ICML以及ICRL。其它著名的一般會議包括AAAI、IJCAI和UAI。對于每一個分支學(xué)科而言,都有更加具體的會議。比如計算機視覺領(lǐng)域有CVPR、ECCV和ICCV;自然語言領(lǐng)域有ACL、EMNLP和NAACL;機器人學(xué)領(lǐng)域有CoRL、ICAPS、ICRA、IROS和RSS;與理論工作相關(guān)的會議有AISTAS、COLT和KDD。此外還有一些期刊也值得關(guān)注,JAIR和JMLR是人工智能領(lǐng)域最突出的兩個期刊,不過在Nature和Science期刊中也會有很好的論文。
對于一些早期論文的查找也是非常重要的,那些被奉為“經(jīng)典論文”的論文往往會在參考論文中出現(xiàn)。另外一種發(fā)現(xiàn)早期論文的方法是從資深教授的個人主頁開始查找,其成名作一般會掛在上面。此外還可以通過一些搜索助手,比如谷歌學(xué)術(shù)、百度學(xué)術(shù)等查詢關(guān)鍵詞。
讀論文要花多少時間?
關(guān)于如何讀論文,人們經(jīng)常給出兩個建議。第一個就是在研究生的第一學(xué)期或者第一年度把所有相關(guān)的論文都讀一遍;第二個是當(dāng)讀了大量論文后,不要再泛讀,而是找到突破口,想出創(chuàng)新的辦法。
我個人同意第一個建議,但不同意第二個建議。只要有足夠的時間用于原始研究,那么就應(yīng)該盡可能多地閱讀論文。對于專業(yè)研究員而言,不可能總依靠個人幸運來發(fā)現(xiàn)創(chuàng)新的解決辦法,有時候你想到的方法別人可能已經(jīng)嘗試過,只是你不知道而已。絕大多數(shù)的研究者都是耐心的跟蹤研究方向的進展以及發(fā)展趨勢,有條不紊地思考并解決問題。閱讀相關(guān)論文也是弄清楚目前所處的階段以及接下來需要做什么的一個好方法。
關(guān)于盡可能多地閱讀論文有一個重要的提示:花時間理解消化一篇論文和閱讀一篇論文同樣重要,閱讀的時候可以做些筆記,而不是囫圇吞棗,只求數(shù)量,不求質(zhì)量。
對話 >> 視頻 >> 論文 >> 會談
論文無疑是了解不熟悉的研究理論最容易獲取的來源,但是什么路徑是最有效的呢?不同的人可能感受不一樣。對我而言,我發(fā)現(xiàn)對話(與那些已經(jīng)理解的人)是迄今為止最快且最有效的理解途徑。如果找不到和這樣的人對話的機會,可以找下關(guān)于問題的相關(guān)視頻,例如論文作者訪談視頻,這樣的視頻可以提供很好的觀點。此外,當(dāng)演講者向現(xiàn)場觀眾演講時,他們往往優(yōu)先考慮的是清晰度而不是簡潔性。在大多數(shù)論文寫作中,作者將優(yōu)先權(quán)順序互換了,其中詞數(shù)為王,背景知識解釋得太多反而顯得作者對該領(lǐng)域不熟悉。排在最后的是會談,簡單的會談往往顯得比較正式,與主持人的談話內(nèi)容可能會非常有價值。
謹防炒作
人工智能取得一系列的成果吸引了公眾的關(guān)注,使得更多的人投入這個領(lǐng)域,進而促使人工智能取得更多突破性的進展。整個循環(huán)是良性的,但有一個副作用就是存在大量的炒作。視圖獲得點擊量的記者、熱錢投資者、創(chuàng)業(yè)型公司都是夸大炒作泡沫的罪魁禍首。因此,在我們閱讀新聞或論文時,要注意“標(biāo)題黨”,以免被誤導(dǎo)。
在2017年的NIPS的問答環(huán)節(jié),一位著名的教授拿著麥克風(fēng)(代表炒作警察)告誡作者在論文標(biāo)題中慎重使用“想象”一詞。這和我們看新聞時一樣,標(biāo)題很吸引人,但里面的內(nèi)容卻跟標(biāo)題關(guān)系不大,使得閱讀者大失所望。閱讀論文同樣如此,嚴防炒作,我們需要做的是根據(jù)實驗方法和結(jié)果來評估一篇論文是否對自己有所幫助。
總是在不斷進步
在早期探索研究項目時,一般我會花幾個小時開展頭腦風(fēng)暴,希望一些模糊的直接能夠指引一個具體的方向。有時候項目沒有任何進展,但在黑暗中摸索也算是整個研究過程中的一部分。當(dāng)不知道下一步應(yīng)該做什么時,可以基于目前已有的情況將最模糊的想法寫下來,并在寫的過程中進行一一排除(寫出排除的原因)。在沒有任何想法的情況下, 可以采取閱讀或與同事交流的形式以獲得靈感。
從死胡同中學(xué)會判別和止損
大牛們一般花更多的時間在好的想法上,能夠區(qū)分想法的好與壞在很大程度上依賴于個人的經(jīng)驗。盡管如此,任何水平的研究人員都會不斷遭遇以下決定:研究思路是否有缺陷、是否應(yīng)該挽救或進一步支持所提出的想法、是否完全放棄所提出的想法?尤其是在早期時,研究人員踏入死胡同后會停留很長一段時間,而不愿放棄。雖然放棄意味著之前的花費的時間白費了,但有的時候要懂得及時止損。
寫作
一些大牛給出的早期職業(yè)建議是:寫作。平時可以寫寫博客和論文,但更重要的是把自己的想法記錄下來。因為寫作有助于我們理解與思考相關(guān)知識。
心理健康和身體健康是科研的先決條件
學(xué)術(shù)研究者在追求科學(xué)發(fā)現(xiàn)的過程中經(jīng)常會遇到熬夜、顧不上吃飯等問題,這些都不是好習(xí)慣。很多博士都開始禿頭,甚至碩士就開始掉頭發(fā)。鍛煉身體并放空自己內(nèi)心也是對科研的投資,并不是阻礙科研。睡8個小時后再工作4個小時,其效率比睡4個小時工作8個小時要高得多。有的時候會遇到卡殼,即使使出渾身解數(shù)也無法取得一絲進步,這個時候建議離開工作崗位,稍微活動一下并做長呼吸,放空下自己。
作者信息
Tom Silver,專注于計算科學(xué)與數(shù)學(xué)、人工智能
本文由阿里云云棲社區(qū)組織翻譯。
文章原標(biāo)題《Lessons from My First Two Years of AI Research》
詳情請閱讀原文
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19733.html
摘要:本屆工作坊,我們邀請到了擁有年資深設(shè)計經(jīng)驗的高級體驗設(shè)計專家朱斌,他將作為產(chǎn)品場講師為我們分享如何有效的管理用戶注意力的話題。美國設(shè)計同行對創(chuàng)新的追求和包容是最能體現(xiàn)設(shè)計魅力的地方。 導(dǎo)讀:7月6-7日,由msup主辦的第43屆MPD工作坊將于北京召開。MPD工作坊是一個圍繞崗位角色發(fā)展的實踐課堂,按照軟件研發(fā)中心的崗位職能劃分,以產(chǎn)品經(jīng)理、團隊經(jīng)理、 架構(gòu)師、開發(fā)經(jīng)理、測試經(jīng)理作為五...
摘要:近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗,具有構(gòu)建基于大數(shù)據(jù)平臺的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗。的哈勃多維監(jiān)控平臺在完成大數(shù)據(jù)架構(gòu)改造后,嘗試引入能力,多維根因分析是其中一試點,用于摸索的應(yīng)用經(jīng)驗。 作者丨吳樹生:騰訊高級工程師,負責(zé)SNG大數(shù)據(jù)監(jiān)控平臺建設(shè)。近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗,具有構(gòu)建基于大數(shù)據(jù)平臺的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗。 導(dǎo)語:監(jiān)控數(shù)據(jù)多維化后,帶來新的應(yīng)用場景。SNG的哈勃多...
摘要:近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗,具有構(gòu)建基于大數(shù)據(jù)平臺的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗。監(jiān)控多維數(shù)據(jù)特點監(jiān)控的核心是對監(jiān)控對象的指標(biāo)采集處理檢測和分析。通過單一對象的指標(biāo)反映的狀態(tài)已不能滿足業(yè)務(wù)監(jiān)控需求。 吳樹生:騰訊高級工程師,負責(zé)SNG大數(shù)據(jù)監(jiān)控平臺建設(shè)。近十年監(jiān)控系統(tǒng)開發(fā)經(jīng)驗,具有構(gòu)建基于大數(shù)據(jù)平臺的海量高可用分布式監(jiān)控系統(tǒng)研發(fā)經(jīng)驗。前言在2015年構(gòu)建多維監(jiān)控平臺時用kmeans做了異常點...
閱讀 797·2019-08-30 15:55
閱讀 1542·2019-08-30 15:52
閱讀 2702·2019-08-30 15:44
閱讀 2124·2019-08-30 11:14
閱讀 2632·2019-08-29 13:59
閱讀 1835·2019-08-29 13:45
閱讀 1022·2019-08-29 13:21
閱讀 3384·2019-08-26 13:31