Mask R-CNN源代碼終于來了，還有它背后的物體檢測(cè)平臺(tái)

robin 發(fā)布于2019-04-25 18:23 / 2614人閱讀

摘要：現(xiàn)在，官方版開源代碼終于來了。同時(shí)發(fā)布的，是這項(xiàng)研究背后的一個(gè)基礎(chǔ)平臺(tái)。是的物體檢測(cè)平臺(tái)，今天宣布開源，它基于，用寫成，這次開放的代碼中就包含了的實(shí)現(xiàn)。說，將平臺(tái)開源出來，是想要加速世界各地實(shí)驗(yàn)室的研究，推動(dòng)物體檢測(cè)的進(jìn)展。

“等代碼吧?！?/p>

從Mask R-CNN論文亮相至今的10個(gè)月里，關(guān)于它的討論幾乎都會(huì)以這句話收尾。

現(xiàn)在，官方版開源代碼終于來了。同時(shí)發(fā)布的，是這項(xiàng)研究背后的一個(gè)基礎(chǔ)平臺(tái)：Detectron。

Detectron是Facebook的物體檢測(cè)平臺(tái)，今天宣布開源，它基于Caffe2，用Python寫成，這次開放的代碼中就包含了Mask R-CNN的實(shí)現(xiàn)。

除此之外，Detectron還包含了ICCV 2017較佳學(xué)生論文RetinaNet，Ross Girshick（RBG）此前的研究Faster R-CNN和RPN、Fast R-CNN、以及R-FCN的實(shí)現(xiàn)。

Detectron的基干（backbone）網(wǎng)絡(luò)架構(gòu)包括ResNeXt{50,101,152}、ResNet{50,101,152}、FPN和VGG16。

同時(shí)，F(xiàn)acebook還發(fā)布了70多種ImageNet-1k預(yù)訓(xùn)練模型的性能基準(zhǔn)，包括用用1、2塊GPU時(shí)，上述各種基干架構(gòu)和檢測(cè)算法相結(jié)合做區(qū)域建議、遮罩檢測(cè)以及人體關(guān)鍵點(diǎn)檢測(cè)的訓(xùn)練時(shí)間、推理時(shí)間等。

要使用Detectron，你需要先配置英偉達(dá)GPU（是的，它還不支持CPU）、Linux系統(tǒng)和Python2，還要安裝Caffe2和COCO API。然后，三步裝上Detectron：

Clone Detectron：

# DETECTRON=/path/to/clone/detectron

git clone https://github.com/facebookresearch/detectron $DETECTRON

設(shè)置Python模塊：

cd $DETECTRON/lib && make

檢查Detectron的測(cè)試通過：

python2 $DETECTRON/tests/test_spatial_narrow_as_op.py

這樣，就足夠用預(yù)訓(xùn)練模型做推理了。

如果要用Detectron來訓(xùn)練自己的檢測(cè)模型，就需要先確保能通過符號(hào)鏈接lib/datasets/data找到數(shù)據(jù)集，然后用CMake創(chuàng)建定制的運(yùn)算符庫：

cd $DETECTRON/lib && make ops

并檢查這些運(yùn)算符的測(cè)試通過：

python2 $DETECTRON/tests/test_zero_even_op.py

Facebook還貼心地寫了份上手教程，教你用預(yù)訓(xùn)練的Mask R-CNN來做物體檢測(cè)。

如果要在本地圖像上運(yùn)行，只需要使用infer_simple.py工具，運(yùn)行：

python2 tools/infer_simple.py

? ? --cfg configs/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml

? ? --output-dir /tmp/detectron-visualizations

? ? --image-ext jpg

? ? --wts https://s3-us-west-2.amazonaws.com/detectron/35861858/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml.02_32_51.SgT4y1cO/output/train/coco_2014_train:coco_2014_valminusminival/generalized_rcnn/model_final.pkl

? ? demo

就能得到如下圖所示的輸出。

如果要在COCO數(shù)據(jù)集上做推理，需要運(yùn)行：

python2 tools/test_net.py

? ? --cfg configs/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml

? ? TEST.WEIGHTS https://s3-us-west-2.amazonaws.com/detectron/35861858/12_2017_baselines/e2e_mask_rcnn_R-101-FPN_2x.yaml.02_32_51.SgT4y1cO/output/train/coco_2014_train:coco_2014_valminusminival/generalized_rcnn/model_final.pkl

? ? NUM_GPUS 1

上面這個(gè)例子，用了端到端預(yù)訓(xùn)練的Mask R-CNN，在一塊GPU上運(yùn)行。如果要使用多個(gè)GPU，需要在第二行之后添加 —multi-gpu-testing 并更改最后的NUM_GPUS數(shù)量。

截至量子位發(fā)稿，Detectron在GitHub上放出7小時(shí)，已經(jīng)收獲738顆星標(biāo)、101次Fork。

RBG在Facebook上發(fā)帖介紹說，這個(gè)項(xiàng)目2016年7月啟動(dòng)，想要基于Caffe 2構(gòu)建一個(gè)快速、靈活的物體檢測(cè)系統(tǒng)，至今已經(jīng)一年半的時(shí)間。Detectron系統(tǒng)本來是Facebook內(nèi)部使用的，我們前面提到的Mask R-CNN和RetinaNet背后，都由Detectron提供支持。

除了RBG之外，Ilija Radosavovic、Georgia Gkioxari、Piotr Dollar和何愷明也參與了Detectron項(xiàng)目。

在Facebook內(nèi)部，Detectron不僅用于研究，還用來為增強(qiáng)現(xiàn)實(shí)、商業(yè)誠(chéng)信等方面的應(yīng)用訓(xùn)練定制化的模型。這些模型訓(xùn)練完成后可以部署在云端或者移動(dòng)設(shè)備上，由Caffe2運(yùn)行時(shí)提供支持。

RBG說，F(xiàn)acebook將Detectron平臺(tái)開源出來，是想要加速世界各地實(shí)驗(yàn)室的研究，推動(dòng)物體檢測(cè)的進(jìn)展。

Now go forth and create algorithms to detect all of the things!

想用Detectron搞物體檢測(cè)算法，你可能要用到下面這些鏈接：

Detectron開源代碼：

https://github.com/facebookresearch/Detectron

相關(guān)物體檢測(cè)論文：

Mask R-CNN

https://arxiv.org/abs/1703.06870

RetinaNet

https://arxiv.org/abs/1708.02002

Faster R-CNN和RPN

https://arxiv.org/abs/1506.01497

Fast R-CNN

https://arxiv.org/abs/1504.08083

R-FCN

https://arxiv.org/abs/1605.06409

性能基準(zhǔn)和Model ZOO：

https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md

另外，你們可能還想去RBG大神的FB帖子底下表達(dá)一波感謝（以及質(zhì)問開源代碼為何拖了這么久）：

https://www.facebook.com/ross.girshick/posts/10159910213745261

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價(jià)值的辦法，實(shí)際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉(cāng)庫，數(shù)據(jù)挖掘工具，報(bào)表系統(tǒng)等全方位知識(shí)

QQ群：81035754

云服務(wù)器 GPU云服務(wù)器移動(dòng)物體檢測(cè) 雙11背后的云計(jì)算魅力大數(shù)據(jù)殺熟背后的定價(jià)思維阿里云怎么布置它的服務(wù)器的

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/4710.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

robin

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

主機(jī)采用什么表示數(shù)據(jù)-主機(jī)與外部設(shè)備之間的數(shù)據(jù)傳送方式有哪些?各有什么特點(diǎn)？

閱讀 2522·2021-09-22 15:15
樓下大媽看完廣場(chǎng)舞都想不跳了！C語言預(yù)處理（下）

閱讀 677·2021-09-02 15:11
Tudcloud：香港VPS月付7.2美元起,可選大帶寬或不限流量

閱讀 1817·2021-08-30 09:48
兼容移動(dòng)端 js彈出框?qū)崿F(xiàn)微信禁止h5禁止網(wǎng)頁下拉，滾動(dòng)穿透，禁止微信內(nèi)置瀏覽器下拉網(wǎng)頁

閱讀 1923·2019-08-30 15:56
一個(gè)超級(jí)詭異的 iOS Safari `position: fixed` 失效問題

閱讀 1543·2019-08-30 15:52
好看漂亮的html5網(wǎng)頁特效學(xué)習(xí)筆記(3)_猜猜下一個(gè)顏色是什么？

閱讀 2080·2019-08-30 15:44
登錄界面引入引入css問題

閱讀 465·2019-08-29 16:29
正在失業(yè)中的《課多周刊》(第3期)

閱讀 1568·2019-08-29 11:06

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

Mask R-CNN源代碼終于來了，還有它背后的物體檢測(cè)平臺(tái)

相關(guān)文章

**何愷明團(tuán)隊(duì)推出Mask^X R-CNN，將實(shí)例分割擴(kuò)展到3000類**

CNN 在圖像分割中的簡(jiǎn)史：從 R-CNN 到 Mask R-CNN

用于圖像分割的卷積神經(jīng)網(wǎng)絡(luò)：從R-CNN到Mark R-CNN

**深度學(xué)習(xí)時(shí)代的目標(biāo)檢測(cè)算法**

**ECCV 2018 | CornerNet：目標(biāo)檢測(cè)算法新思路**

發(fā)表評(píng)論

0條評(píng)論

robin

男|高級(jí)講師

TA的文章

主機(jī)采用什么表示數(shù)據(jù)-主機(jī)與外部設(shè)備之間的數(shù)據(jù)傳送方式有哪些?各有什么特點(diǎn)？

樓下大媽看完廣場(chǎng)舞都想不跳了！C語言預(yù)處理（下）

Tudcloud：香港VPS月付7.2美元起,可選大帶寬或不限流量

兼容移動(dòng)端 js彈出框?qū)崿F(xiàn)微信禁止h5禁止網(wǎng)頁下拉，滾動(dòng)穿透，禁止微信內(nèi)置瀏覽器下拉網(wǎng)頁

一個(gè)超級(jí)詭異的 iOS Safari `position: fixed` 失效問題

好看漂亮的html5網(wǎng)頁特效學(xué)習(xí)筆記(3)_猜猜下一個(gè)顏色是什么？

登錄界面引入引入css問題

正在失業(yè)中的《課多周刊》(第3期)

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

Mask R-CNN源代碼終于來了，還有它背后的物體檢測(cè)平臺(tái)

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

Mask R-CNN源代碼終于來了，還有它背后的物體檢測(cè)平臺(tái)