摘要:我們對種用于數(shù)據(jù)科學(xué)的開源深度學(xué)習(xí)庫作了排名。于年月發(fā)布了第名,已經(jīng)躋身于深度學(xué)習(xí)庫的上半部分。是最流行的深度學(xué)習(xí)前端第位是排名較高的非框架庫。頗受對數(shù)據(jù)集使用深度學(xué)習(xí)的數(shù)據(jù)科學(xué)家的青睞。深度學(xué)習(xí)庫的完整列表來自幾個來源。
我們對23種用于數(shù)據(jù)科學(xué)的開源深度學(xué)習(xí)庫作了排名。這番排名基于權(quán)重一樣大小的三個指標(biāo):Github上的活動、Stack Overflow上的活動以及谷歌搜索結(jié)果。
排名結(jié)果
下面是23種用于數(shù)據(jù)科學(xué)的開源深度學(xué)習(xí)庫的排名,按照Github上的活動、Stack Overflow上的活動以及谷歌搜索結(jié)果來衡量。該表顯示了標(biāo)準(zhǔn)化分?jǐn)?shù),1這個值表示高于平均值(平均值=0)一個標(biāo)準(zhǔn)偏差。比如說,Caffe高于Github活動方面的平均值一個標(biāo)準(zhǔn)偏差,而deeplearning4j接近平均值。
方法詳見如下
結(jié)果和討論
排名基于權(quán)重一樣大小的三個指標(biāo):Github(星標(biāo)和分支)、Stack Overflow(標(biāo)簽和問題)以及谷歌結(jié)果(總體增長率和季度增長率)。這些是使用可用的API獲得的。制作一個全面的深度學(xué)習(xí)工具包列表很棘手——最后,我們列出了我們認(rèn)為有代表性的五個不同的列表(參閱下面介紹的方法,可了解詳細(xì)信息)。計算每個度量指標(biāo)的標(biāo)準(zhǔn)化分?jǐn)?shù)后,我們就能看到哪些軟件包在每個類別中脫穎而出。完整排名在這里(https://github.com/thedataincubator/data-science-blogs/blob/master/output/DL_libraries_final_Rankings.csv),原始數(shù)據(jù)在這里(https://github.com/thedataincubator/data-science-blogs/blob/master/output/deep_learning_data.csv)。
TensorFlow憑較大的活躍社區(qū)一路領(lǐng)跑
在所有衡量指標(biāo)中,TensorFlow比平均值高出至少兩個標(biāo)準(zhǔn)偏差。相比第二大流行框架:Caffe,TensorFlow的Github分支數(shù)量幾乎是其三倍,Stack Overflow問題更是其六倍以上。TensorFlow最初由谷歌Brain團(tuán)隊于2015年開源,發(fā)展勢頭已超過歷史更悠久的庫,比如Theano(第4位)和Torch(第8位),躍居我們榜單的首位。雖然TensorFlow附帶在C++引擎上運行的Python API,但本榜單上的幾種庫可以使用TensorFlow作為后端,提供各自的接口。這些庫包括Keras(第2位,很快將成為核心TensorFlow的一部分)和Sonnet(第6位)。TensorFlow之所以人氣這么高,可能是由于它結(jié)合了通用深度學(xué)習(xí)框架、靈活的接口、外觀整潔的計算圖形可視化以及谷歌龐大的開發(fā)者和社區(qū)資源。
Caffe尚未被Caffe2所取代
Caffe在本榜單上排名第三,Github上的活動比其所有競爭對手(TensorFlow除外)都要多。Caffe歷來被認(rèn)為比Tensorflow更專門化,當(dāng)初專注于圖像處理、對象識別和預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)。Facebook于2017年4月發(fā)布了Caffe2(第11名),Caffe2已經(jīng)躋身于深度學(xué)習(xí)庫的上半部分。Caffe2是一種更輕量級、模塊化、可擴(kuò)展的Caffe,它包括循環(huán)神經(jīng)網(wǎng)絡(luò)。Caffe和Caffe2是獨立的代碼庫,所以數(shù)據(jù)科學(xué)家可以繼續(xù)使用原來的Caffe。然而,一些遷移工具(比如Caffe Translator)為使用Caffe2來驅(qū)動現(xiàn)有的Caffe模型提供了一種手段。
Keras是最流行的深度學(xué)習(xí)前端
Keras(第2位)是排名較高的非框架庫。Keras可以用作TensorFlow(第1位)、Theano(第4位)、MXNet(第7位)、CNTK(第9位)或deeplearning4j(第14位)的前端。Keras在所有三個衡量指標(biāo)方面的表現(xiàn)均勝過平均值。Keras之所以人氣很旺,可能歸功于其簡單性和易用性。Keras允許用戶快速建立原型,代價是直接使用框架所帶來的靈活性和控制性方面欠缺一點。Keras頗受對數(shù)據(jù)集使用深度學(xué)習(xí)的數(shù)據(jù)科學(xué)家的青睞。由于R Studio最近發(fā)布了使用R的面向Keras的接口,Keras的發(fā)展和人氣指數(shù)不斷提升。
即便沒有行業(yè)的大力支持,Theano依然名列前茅
在眾多新的深度學(xué)習(xí)框架中,Theano(第4位)是本榜單上歷史最悠久的庫。Theano率先使用了計算圖,在整個深度學(xué)習(xí)和機(jī)器學(xué)習(xí)研究界當(dāng)中仍很受歡迎。Theano實際上就是面向Python的數(shù)值計算庫,但可以與像Lasagne(第15位)這樣的高級深度學(xué)習(xí)封裝庫一起使用。谷歌支持TensorFlow(第1位)和Keras(第2位),F(xiàn)acebook支持PyTorch(第5位)和Caffe2(第11位),而MXNet(第7位)是亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)的官方深度學(xué)習(xí)框架,微軟設(shè)計并維護(hù)CNTK(第9位),雖然沒有得到哪家技術(shù)行業(yè)巨頭的官方支持,但Theano依然頗受歡迎。
Sonnet是發(fā)展最快的庫
2017年年初,谷歌的DeepMind公開發(fā)布了Sonnet(第6位)的代碼,這是一種以TensorFlow為基礎(chǔ)的面向?qū)ο蟮母呒墡?。這個季度相比上個季度,Sonnet的谷歌搜索結(jié)果中返回的頁面數(shù)量增加了272%,這是我們排名的所有庫中增幅較大的。雖然谷歌在2014年收購了DeepMind這家英國人工智能公司,但DeepMind和谷歌Brain仍擁有基本上獨立的團(tuán)隊。DeepMind專注于強(qiáng)人工智能,Sonnet可以幫助用戶在特定的AI想法和研究的基礎(chǔ)上構(gòu)建神經(jīng)網(wǎng)絡(luò)。
Python是深度學(xué)習(xí)接口的推薦語言
PyTorch(第5位)是其單一接口使用Python的一種框架,它是本榜單上發(fā)展速度第二快的庫。與上季度相比,PyTorch的谷歌搜索結(jié)果多了236%。在我們排名的23種開源深度學(xué)習(xí)框架和封裝庫中,只有三種沒有使用Python的接口:Dlib(第10位)、MatConvNet(第20位)和OpenNN(第23位)。C++接口和R接口分別用于23種庫中的7種庫和6種庫。雖然數(shù)據(jù)科學(xué)界在使用Python方面幾乎趨于一致,但是深度學(xué)習(xí)庫方面還是有許多選擇。
限制
與任何分析一樣,我們一路上做出了決定。所有源代碼和數(shù)據(jù)都在我們的Github頁面上。深度學(xué)習(xí)庫的完整列表來自幾個來源。
當(dāng)然,一些歷史更悠久的庫會有更高的指標(biāo),因而排名更高??紤]到這一點的指標(biāo)是谷歌搜索季度增長率。
數(shù)據(jù)帶來了幾個難題:
Neural Designer和Wolfram Mathematica是專有的,已被剔除
cntk又叫微軟認(rèn)知工具包,但是我們只使用了原來的ctnk名字
neon改成了nervana neon
paddle改成了paddlepaddle
一些庫顯然是其他庫的衍生版,比如Caffe和Caffe2。如果這些庫有獨特的github代碼庫,我們決定將它們分開來對待。
方法
所有源代碼和數(shù)據(jù)都放在我們的Github頁面(https://github.com/thedataincubator/data-science-blogs)上。
我們先從五個不同的來源制作了23種開源深度學(xué)習(xí)庫列表,然后為所有庫收集了指標(biāo),以得出排名。Github數(shù)據(jù)基于星標(biāo)和分支,Stack Overflow數(shù)據(jù)基于含有軟件包名稱的標(biāo)簽和問題,谷歌結(jié)果基于過去五年的谷歌搜索結(jié)果總數(shù)和過去三個月較之前三個月計算出來的季度結(jié)果增長率。
其他一些注意事項:
幾個庫是常用詞(caffe、chainer和lasagne),因此用來確定谷歌搜索結(jié)果數(shù)量的搜索詞包括庫名和“deep learning”這個術(shù)語。
任何缺少的Stack Overflow計數(shù)一律轉(zhuǎn)換為零計數(shù)。
計數(shù)標(biāo)準(zhǔn)化,均值為0,偏差為1,然后求平均值,以獲得Github和Stack Overflow分?jǐn)?shù),最后結(jié)合搜索結(jié)果得出總分。
進(jìn)行一番手動檢查,確認(rèn)Github的代碼庫位置。
所有數(shù)據(jù)是在2017年9月14日下載的。
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/4661.html
摘要:但年月,宣布將在年終止的開發(fā)和維護(hù)。性能并非最優(yōu),為何如此受歡迎粉絲團(tuán)在過去的幾年里,出現(xiàn)了不同的開源深度學(xué)習(xí)框架,就屬于其中典型,由谷歌開發(fā)和支持,自然引發(fā)了很大的關(guān)注。 Keras作者Fran?ois Chollet剛剛在Twitter貼出一張圖片,是近三個月來arXiv上提到的深度學(xué)習(xí)開源框架排行:TensorFlow排名第一,這個或許并不出意外,Keras排名第二,隨后是Caffe、...
摘要:第一個深度學(xué)習(xí)框架該怎么選對于初學(xué)者而言一直是個頭疼的問題。簡介和是頗受數(shù)據(jù)科學(xué)家歡迎的深度學(xué)習(xí)開源框架。就訓(xùn)練速度而言,勝過對比總結(jié)和都是深度學(xué)習(xí)框架初學(xué)者非常棒的選擇。 「第一個深度學(xué)習(xí)框架該怎么選」對于初學(xué)者而言一直是個頭疼的問題。本文中,來自 deepsense.ai 的研究員給出了他們在高級框架上的答案。在 Keras 與 PyTorch 的對比中,作者還給出了相同神經(jīng)網(wǎng)絡(luò)在不同框...
摘要:在本節(jié)中,我們將看到一些最流行和最常用的庫,用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)是用于數(shù)據(jù)挖掘,分析和機(jī)器學(xué)習(xí)的最流行的庫。愿碼提示網(wǎng)址是一個基于的框架,用于使用多個或進(jìn)行有效的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。 showImg(https://segmentfault.com/img/remote/1460000018961827?w=999&h=562); 來源 | 愿碼(ChainDesk.CN)內(nèi)容編輯...
摘要:第一個主流產(chǎn)品級深度學(xué)習(xí)庫,于年由啟動。在年月日宣布,的開發(fā)將終止。張量中最基本的單位是常量變量和占位符。占位符并沒有初始值,它只會分配必要的內(nèi)存。是一個字典,在字典中需要給出每一個用到的占位符的取值。 為什么選擇 TensorFlow?在本文中,我們將對比當(dāng)前最流行的深度學(xué)習(xí)框架(包括 Caffe、Theano、PyTorch、TensorFlow 和 Keras),幫助你為應(yīng)用選擇最合適...
閱讀 2086·2021-09-29 09:35
閱讀 691·2021-09-08 09:36
閱讀 3399·2021-09-03 10:30
閱讀 2117·2019-08-30 14:21
閱讀 2914·2019-08-30 11:18
閱讀 3319·2019-08-29 17:31
閱讀 3146·2019-08-29 17:29
閱讀 1313·2019-08-29 17:13