SpeeDO —— 并行深度學(xué)習(xí)系統(tǒng)

baiy 發(fā)布于2019-04-25 18:02 / 2610人閱讀

摘要：最近，又帶起了一波深度學(xué)習(xí)的熱潮。因此需要并行的深度學(xué)習(xí)系統(tǒng)提高訓(xùn)練速度。各大公司在構(gòu)建并行深度學(xué)習(xí)系統(tǒng)上投入了大量的精力，包括谷歌微軟騰訊和百度等等。為了提高算法的并行效率，這些系統(tǒng)大部分使用了多機多的方式。

最近，AlphaGo又帶起了一波深度學(xué)習(xí)的熱潮。深度學(xué)習(xí)在很多領(lǐng)域都大幅提高了模型的精度，使得很多以前在實驗室中的技術(shù)得以運用到日常的生活之中。然而，大多數(shù)深度學(xué)習(xí)網(wǎng)絡(luò)非常復(fù)雜，需要大量的訓(xùn)練樣本進行訓(xùn)練，很多網(wǎng)絡(luò)需要一次訓(xùn)練，同時額外多次的訓(xùn)練來調(diào)參數(shù)。時間效率上遠遠無法滿足當(dāng)前的工業(yè)需求。因此需要并行的深度學(xué)習(xí)系統(tǒng)提高訓(xùn)練速度。

各大公司在構(gòu)建并行深度學(xué)習(xí)系統(tǒng)上投入了大量的精力，包括谷歌、Facebook、微軟、騰訊和百度等等。為了提高算法的并行效率，這些系統(tǒng)大部分使用了多機多GPU的方式。所謂多機，即是大量的機器通過網(wǎng)絡(luò)連接組成訓(xùn)練集群；多GPU即是集群內(nèi)部的每臺機器上包含多個GPU，通過數(shù)據(jù)并行（每個GPU訓(xùn)練部分?jǐn)?shù)據(jù)）、模型并行（每個GPU訓(xùn)練部分網(wǎng)絡(luò)）或者兩者混合的方式提高加快訓(xùn)練速度。GPU浮點運行效率很高，這導(dǎo)致了并行系統(tǒng)的主要瓶頸在于I/O效率，因此這些系統(tǒng)使用了諸如InfiniBand和RDMA(Remote Direct Memory Access,全稱遠程直接數(shù)據(jù)存取，專用于解決網(wǎng)絡(luò)傳輸中服務(wù)器端數(shù)據(jù)處理的延遲)等高性能技術(shù), 而這些技術(shù)需要昂貴的硬件支持，大大增加了系統(tǒng)構(gòu)建和維護的成本和難度，導(dǎo)致這些系統(tǒng)很難復(fù)制和普及到通用場景。

SpeeDO（Open DEEP learning System的逆序）是一個為通用硬件設(shè)計的并行深度學(xué)習(xí)系統(tǒng)。SpeeDO不需要特殊的I/O硬件，支持CPU/GPU集群，因此可以很方便地在各種云端環(huán)境上部署，如AWS、Google GCE、Microsoft Azure等等。

SpeeDO 采用了目前通用的參數(shù)服務(wù)器（parameter server）架構(gòu)，依賴一系列基于JVM的開源庫，使用Scala語言開發(fā)。

SpeeDO 的架構(gòu)圖如下圖所示：

流程圖如下圖所示:

SpeeDO 的主要組件及其功能如下：

Caffe：開源深度學(xué)習(xí)庫，基于C++，支持CPU/GPU。原版不支持多GPU/多機并行。

Akka：JVM上的消息隊列庫，負(fù)責(zé)參數(shù)服務(wù)器和工作節(jié)點之間的并發(fā)消息處理。

Redis：基于內(nèi)存的高效并行Key-Value數(shù)據(jù)庫。主要用于在參數(shù)服務(wù)器和工作節(jié)點之間傳遞訓(xùn)練的模型。這些模型一般比較大（幾十至上千MB不等），不適合直接通過Akka進行傳輸。

Yarn：Hadoop2的資源管理組件，實現(xiàn)在多臺機器上一鍵部署參數(shù)服務(wù)器和工作節(jié)點，實時監(jiān)控各節(jié)點的運行狀態(tài)，處理異常。

SpeeDO 提供docker鏡像（只支持CPU）以方便系統(tǒng)的快速構(gòu)建和測試，獲取鏡像：docker pull obdg/speedo:latest，使用方法請參考：https://github.com/openbigdatagroup/speedo。

關(guān)于SpeeDO 的更多細節(jié)，可以參閱發(fā)表在NIPS 2015 Machine Learning Systems Workshop上的論文：http://learningsys.org/papers/LearningSys_2015_paper_13.pdf。

SpeeDO的代碼在Github上開源：https://github.com/openbigdatagroup/speedo，并提供了詳細的安裝腳本和Docker文件。

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報表系統(tǒng)等全方位知識

QQ群：81035754

GPU云服務(wù)器云服務(wù)器并行存儲系統(tǒng) GPU云并行運算系統(tǒng) GPU并行運算主機系統(tǒng) GPU 云并行運算系統(tǒng)

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/4359.html

發(fā)表評論

登陸后可評論

0條評論

baiy

男|高級講師

我要關(guān)注我要私信

TA的文章

虛擬主機怎么上傳文件-虛擬主機怎么上傳文件？

閱讀 857·2021-09-22 16:01
Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

閱讀 2125·2021-08-20 09:37
CSS小技巧（一）：iconfont的使用

閱讀 1719·2019-08-30 15:54
小程序?qū)崿F(xiàn)橫向滑塊，超過10個則出現(xiàn)查看更多

閱讀 1718·2019-08-30 15:44
文檔合集

閱讀 869·2019-08-28 18:23
JavaScript學(xué)習(xí)第十天筆記（繼承）

閱讀 3041·2019-08-26 12:17
Node.js child_process模塊解讀

閱讀 1049·2019-08-26 11:56
vue-cli中怎么基于axios去封裝方法

閱讀 1564·2019-08-23 16:20

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

SpeeDO —— 并行深度學(xué)習(xí)系統(tǒng)

相關(guān)文章

**讓AI簡單且強大：深度學(xué)習(xí)引擎OneFlow技術(shù)實踐**

**如何為你的深度學(xué)習(xí)任務(wù)挑選最合適的 GPU?**

實現(xiàn) TensorFlow 多機并行線性加速

發(fā)表評論

0條評論

baiy

男|高級講師

TA的文章

虛擬主機怎么上傳文件-虛擬主機怎么上傳文件？

Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

CSS小技巧（一）：iconfont的使用

小程序?qū)崿F(xiàn)橫向滑塊，超過10個則出現(xiàn)查看更多

文檔合集

JavaScript學(xué)習(xí)第十天筆記（繼承）

Node.js child_process模塊解讀

vue-cli中怎么基于axios去封裝方法

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

SpeeDO —— 并行深度學(xué)習(xí)系統(tǒng)

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！