摘要:既然這么好,為什么就一直沒火起來呢我看周圍基本上沒人用,比較好的論文開源出的代碼也沒見到。這次不遺余力的宣傳,連帶推動了整個的火熱?,F(xiàn)狀是散修小團體一起合力做出來的平臺。這個是較大的特色。根據(jù)作者的平臺排名,目前屬于第四,前三分別是,,。
看了下mxnet,覺得很厲害的,支持各個流行的平臺,支持多種語言,支持多機多GPU并行。相比起來,caffe就沒這么好的支持的。既然這么好,為什么mxnet就一直沒火起來呢?我看周圍基本上沒人用,比較好的論文開源出的代碼也沒見到mxnet。有什么深層次的原因嗎?
簡單來說就是我們沒有足夠的人手能夠在短時間內(nèi)同時技術(shù)上做出足夠的深度而且大規(guī)模推廣,所以我們前期是舍推廣保技術(shù)。
詳細來說我稍微發(fā)散下,可以把當(dāng)下的深度學(xué)習(xí)(DL)比作修真世界(傳統(tǒng)武俠也類似)。學(xué)術(shù)界是各個門派,公司是世家,不過這個世界里世家比較強勢。目前是盛世,各個流派之爭,新人和技術(shù)層出不窮,各大擂臺(例如imagenet)和大會(據(jù)說今年nips 8k人參加,一個月前就把票賣光了)熱火朝天。平臺作為修真練級法寶,自然也是各家PK重要之地。
各個平臺是怎么“火”起來的
簡單的來吧DL分三個階段來看,前DL時代就是Alexnet沒有刷出imagenet第一的時候,當(dāng)時候主流算是torch和theano,從上一個神經(jīng)網(wǎng)絡(luò)的時代的兩大修正大門流傳下來,還是有堅實的用戶基礎(chǔ)。之后魔界(kernel)入侵,神經(jīng)網(wǎng)絡(luò)衰敗。但10年后Alexnet橫空出世,借著大數(shù)據(jù)和GPU的重劍無鋒,橫掃三界。同時也促使了很多新的平臺的出現(xiàn),caffe是之一,很多公司也有做自己的,例如百度的paddle,G的distbelief,我們也有做一個類似的項目叫cxxnet。大體上這些平臺使用體驗差不多,給一個configure就能跑。這里面caffe是最成功,我覺得重要兩點是時間點很好,就是dl在cv爆發(fā)的那段時間,然后caffe有在imagenet pretrain的模型,這個很方便大家的研究。畢竟大部分工作要么是改改operator重新跑一下,要么是基于pretrained的模型來finetune一個別的任務(wù)。
之后出來的比較成功的平臺主要是靠提供更加靈活的開發(fā)環(huán)境來吸引新人。例如tensorflow和keras。
tf作為當(dāng)下修真界較大門的平臺,成功沒有什么意外(1)G brain在這個領(lǐng)域上耕耘了5,6年,做為第二代產(chǎn)品在質(zhì)量確實很優(yōu)秀。(2)在jeff dean的號召下brain網(wǎng)羅了一大幫人,跟他們團隊接觸過很多次,整體人員質(zhì)量甩出其他家很遠,以至于經(jīng)常是好幾個我覺得能獨當(dāng)一面的大牛一起在做一些很小的事情。例如我在cmu系統(tǒng)方向的老板dave在brain好長一段時間就是debug為什么inception v3從distbelief移植到tf老是跑不出想要的精度。(另,類似的坑我們也踩過,我還笑過dave你如果問我們一下可以省下你大筆時間,dave回我們?nèi)硕嗳涡圆磺笕?。)?)G的宣傳機器如果稱第二,那業(yè)界估計沒人敢說第一。這次G不遺余力的宣傳tf,連帶推動了整個DL的火熱。
keras比較有意思,基本是Fran?ois Chollet一人之力做的,有點是散修自己折騰出來的(他人現(xiàn)在在G,不過他去G之前就開始keras了)。它的優(yōu)勢就是簡單,底層靠theano或者tensorflow,上層提供一個非常簡單的接口,非常適合新用戶使用。修真界新人練氣的不二法寶。
MXNet現(xiàn)狀
mxnetet是散修小團體一起合力做出來的平臺。如果去看排名前20的開發(fā)者,基本都是出自不同的門派和世家。這個是mxnet較大的特色。我對此表示很自豪,這里匯聚了一大幫跑得出實驗寫得出代碼的小伙伴。
不論是開始時間還是平臺特性,mxnet最靠近tensorflow。有完整的多語言前端,后端類似編譯器,做這種內(nèi)存和執(zhí)行優(yōu)化。應(yīng)用場景從分布式訓(xùn)練到移動端部署都覆蓋。整個系統(tǒng)全部模塊化,有極小的編譯依賴,非常適合快速開發(fā)。相對于tf這種重量型的后端,mxnet的輕量化路線使得可以我們在花費G brain 1/10的人力的情況下做到類似tf技術(shù)深度的系統(tǒng)。
從推廣的角度來說,需要的是清晰的文檔,大量的樣例,媒體曝光,和客服。這個對于散修團體而說前期比較困難。不過最近也慢慢趕上了。
根據(jù)keras作者的平臺排名,目前mxnet屬于第四,前三分別是tf,caffe,keras。因為dl也是剛興起不久,目前的用戶可能一大半是剛?cè)腴T不久,選擇tf/keras很符合情理。對于學(xué)術(shù)界而言,通常性能不是很關(guān)鍵,最重要是開發(fā)成本,如果前面的工作用了caffe/torch,那基本會一直用下去。
我們也回訪過我們用戶,很多都是工業(yè)界用戶,基本都是屬于有很強的技術(shù)能力,他們關(guān)心性能,開發(fā)和移植的便利性,和是不是能在開發(fā)社區(qū)里獲得一定的話語權(quán)。事實上,mxnet離人也很近,例如
- 某占有率很高手機利用mx處理圖片
- 好幾個常見的app云端利用mx處理數(shù)據(jù)
- aws/azure都寫了好幾篇blog普及在云上面運行mxnet
- 國內(nèi)幾個技術(shù)能力很強的ai創(chuàng)業(yè)公司內(nèi)部用mx
整體而言,不管是dl技術(shù),應(yīng)用,還是平臺,目前說什么都尚早。技術(shù)和潮流都是日新月異,修仙之路也剛開始。我覺得最核心的是,有一群有最求的人,一起合力做一件事情,不斷往前。
PS. 我在考慮要不要寫一個關(guān)于DL/ML的修仙系列。例如“魔界小王子,譽為最有希望帶領(lǐng)魔界重殺回來領(lǐng)袖的叛逃心路歷程”,“我跟修真界第一門掌門的故事”,“如何利用入門道具組裝小型陣法加速修煉”,“解析為什么大門長老屢屢逃奔世家”。。。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/4429.html
摘要:被稱為亞馬遜的新服務(wù)提供了強大的功能,如圖像分析,文本到語音轉(zhuǎn)換和自然語言處理。換句話說,其任務(wù)是將谷歌的機器學(xué)習(xí)功能產(chǎn)品化。亞馬遜平臺推出的這些新服務(wù)中的第一個是名為的圖像識別服務(wù)。 亞馬遜一直在其零售業(yè)務(wù)中使用深度學(xué)習(xí)和人工智能來提高客戶體驗。該公司聲稱,它有數(shù)千名工程師專門從事人工智能相關(guān)開發(fā),以改善搜索、物流、產(chǎn)品推薦和庫存管理。亞馬遜現(xiàn)在正在將相同的專業(yè)知識帶給云,展示了開發(fā)人員可...
摘要:深度學(xué)習(xí)在過去的幾年里取得了許多驚人的成果,均與息息相關(guān)。機器學(xué)習(xí)進階筆記之一安裝與入門是基于進行研發(fā)的第二代人工智能學(xué)習(xí)系統(tǒng),被廣泛用于語音識別或圖像識別等多項機器深度學(xué)習(xí)領(lǐng)域。零基礎(chǔ)入門深度學(xué)習(xí)長短時記憶網(wǎng)絡(luò)。 多圖|入門必看:萬字長文帶你輕松了解LSTM全貌 作者 | Edwin Chen編譯 | AI100第一次接觸長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)時,我驚呆了。原來,LSTM是神...
摘要:中國有自己研發(fā)的游戲主機嗎是什么樣的水準(zhǔn)這個問題蠻有意思的,中國是有自己研發(fā)的游戲機的,早期是以仿制任天堂的為主。以上只是一個國內(nèi)主機游戲市場冷淡一個小插曲而已,真正的還是國產(chǎn)網(wǎng)游在中國游戲史上的根深蒂固。中國有自己研發(fā)的游戲主機嗎?是什么樣的水準(zhǔn)?這個問題蠻有意思的,中國是有自己研發(fā)的游戲機的,早期是以仿制任天堂的FC為主。小霸王這個名字相信大部分80后都不陌生。下面具體分析一下。早期的小...
閱讀 2097·2021-10-08 10:21
閱讀 2490·2021-09-29 09:34
閱讀 3504·2021-09-22 15:51
閱讀 4946·2021-09-22 15:46
閱讀 2323·2021-08-09 13:42
閱讀 3445·2019-08-30 15:52
閱讀 2733·2019-08-29 17:13
閱讀 1564·2019-08-29 11:30