摘要:結(jié)論正確檢測(cè)小物體確實(shí)是一個(gè)挑戰(zhàn)。下載視覺(jué)實(shí)戰(zhàn)項(xiàng)目講在小白學(xué)視覺(jué)公眾號(hào)后臺(tái)回復(fù)視覺(jué)實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割口罩檢測(cè)車道線檢測(cè)車輛計(jì)數(shù)添加眼線車牌識(shí)別字符識(shí)別情緒檢測(cè)文本內(nèi)容提取面部識(shí)別等個(gè)視覺(jué)實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺(jué)。
點(diǎn)擊上方“小白學(xué)視覺(jué)”,選擇加"星標(biāo)"或“置頂”
重磅干貨,第一時(shí)間送達(dá)
為了提高模型在小物體上的性能,我們建議使用以下技術(shù):
提高圖像捕獲分辨率
提高模型的輸入分辨率
平鋪圖像
通過(guò)擴(kuò)充生成更多數(shù)據(jù)
自動(dòng)學(xué)習(xí)模型錨
過(guò)濾掉多余的類
為什么小目標(biāo)問(wèn)題很難?
小物體問(wèn)題困擾著全世界的物體檢測(cè)模型,查看最新模型YOLOv3、EfficientDet和YOLOv4的COCO評(píng)估結(jié)果:
查看 AP_S、AP_M、AP_L 以獲取最先進(jìn)的模型。
例如,在 EfficientDet 中,小物體的 AP 僅為 12%,而大物體的 AP 為 51%,這幾乎是五倍的差距!
那么為什么檢測(cè)小物體這么難呢?
這一切都取決于模型,目標(biāo)檢測(cè)模型通過(guò)聚合卷積層中的像素來(lái)形成特征。
PP-YOLO中目標(biāo)檢測(cè)的特征聚合
并且在網(wǎng)絡(luò)的末端,基于損失函數(shù)進(jìn)行預(yù)測(cè),該損失函數(shù)基于預(yù)測(cè)和地面真實(shí)情況之間的差異對(duì)像素進(jìn)行匯總。
YOLO中的損失函數(shù)
如果地面真值框不大,則在進(jìn)行訓(xùn)練時(shí)信號(hào)會(huì)很小。此外,小物體最有可能存在數(shù)據(jù)標(biāo)記錯(cuò)誤,因此它們的標(biāo)識(shí)可能會(huì)被省略,從經(jīng)驗(yàn)和理論上來(lái)說(shuō),小物體是難的。
提高圖像捕獲分辨率
非常小的物體在邊界框中可能只包含幾個(gè)像素——這意味著提高圖像的分辨率以增加檢測(cè)器可以從該小框中形成的特征的豐富度非常重要。因此,如果可能,我們建議盡可能捕獲高分辨率的圖像。
提高模型的輸入分辨率
一旦我們擁有更高分辨率的圖像,我們就可以擴(kuò)大模型的輸入分辨率。警告:這將導(dǎo)致大型模型需要更長(zhǎng)的訓(xùn)練時(shí)間,并且在開始部署時(shí)推斷速度會(huì)更慢。我們可能需要運(yùn)行實(shí)驗(yàn),來(lái)找出速度與性能之間的正確權(quán)衡。
在我們關(guān)于培訓(xùn)YOLOv4的教程中,我們可以通過(guò)更改配置文件中的圖像大小來(lái)輕松調(diào)整輸入分辨率。
[net] batch=64 subdivisions=36 width={YOUR RESOLUTION WIDTH HERE} height={YOUR RESOLUTION HEIGHT HERE} channels=3 momentum=0.949 decay=0.0005 angle=0 saturation = 1.5 exposure = 1.5 hue = .1 learning_rate=0.001 burn_in=1000 max_batches=6000 policy=steps steps=4800.0,5400.0 scales=.1,.1
在我們的教程中,小伙伴們還可以通過(guò)更改“訓(xùn)練”命令中的“圖像大小”參數(shù),輕松調(diào)整輸入分辨率,該教程介紹了如何訓(xùn)練YOLOv5:
!python train.py --img {YOUR RESOLUTON SIZE HERE} --batch 16 --epochs 10 --data "../data.yaml" --cfg ./models/custom_yolov5s.yaml --weights "" --name yolov5s_results --cache
注意:只有在達(dá)到訓(xùn)練數(shù)據(jù)的最大分辨率時(shí),才能看到改進(jìn)的結(jié)果。
平鋪圖像
檢測(cè)小圖像的另一種很好的策略是將圖像平鋪?zhàn)鳛轭A(yù)處理步驟。平鋪可以有效地將檢測(cè)器放大到小物體上,但允許我們保持所需的小輸入分辨率,以便能夠進(jìn)行快速推理。
平鋪圖像作為 Roboflow 中的預(yù)處理步驟
如果在訓(xùn)練期間使用平鋪,請(qǐng)務(wù)必記住,我們還需要在推理時(shí)平鋪圖像。
通過(guò)擴(kuò)充生成更多數(shù)據(jù)
數(shù)據(jù)擴(kuò)充會(huì)從我們的基本數(shù)據(jù)集生成新圖像,這對(duì)于防止模型過(guò)度擬合訓(xùn)練集非常有用。
一些特別有用的小物體檢測(cè)增強(qiáng)包括隨機(jī)裁剪、隨機(jī)旋轉(zhuǎn)和鑲嵌增強(qiáng)。
自動(dòng)學(xué)習(xí)模型錨
錨定框是模型學(xué)習(xí)預(yù)測(cè)的原型邊界框,也就是說(shuō),錨框可以預(yù)先設(shè)置,有時(shí)對(duì)于我們的訓(xùn)練數(shù)據(jù)來(lái)說(shuō)不是最理想的。自定義調(diào)整這些參數(shù)以適合我們即將完成的任務(wù)是很好的,YOLOv5 模型架構(gòu)會(huì)根據(jù)我們的自定義數(shù)據(jù)自動(dòng)為我們執(zhí)行此操作,我們所要做的就是開始訓(xùn)練。
Analyzing anchors... anchors/target = 4.66, Best Possible Recall (BPR) = 0.9675. Attempting to generate improved anchors, please wait... WARNING: Extremely small objects found. 35 of 1664 labels are < 3 pixels in width or height. Running kmeans for 9 anchors on 1664 points... thr=0.25: 0.9477 best possible recall, 4.95 anchors past thr n=9, img_size=416, metric_all=0.317/0.665-mean/best, past_thr=0.465-mean: 18,24, 65,37, 35,68, 46,135, 152,54, 99,109, 66,218, 220,128, 169,228 Evolving anchors with Genetic Algorithm: fitness = 0.6825: 100%|██████████| 1000/1000 [00:00<00:00, 1081.71it/s] thr=0.25: 0.9627 best possible recall, 5.32 anchors past thr n=9, img_size=416, metric_all=0.338/0.688-mean/best, past_thr=0.476-mean: 13,20, 41,32, 26,55, 46,72, 122,57, 86,102, 58,152, 161,120, 165,20
過(guò)濾掉多余的類
類管理是提高數(shù)據(jù)集質(zhì)量的一項(xiàng)重要技術(shù),如果我們的一個(gè)類與另一個(gè)類明顯重疊,則應(yīng)從數(shù)據(jù)集中過(guò)濾該類。也許,我們認(rèn)為數(shù)據(jù)集中的小對(duì)象不值得檢測(cè),因此我們可能想要將其取出。通過(guò)Roboflow Pro中的高級(jí)數(shù)據(jù)集進(jìn)行狀況檢查,我們可以快速識(shí)別所有這些問(wèn)題。
可以通過(guò)Roboflow 的本體管理工具來(lái)實(shí)現(xiàn)類遺漏和類重命名。
結(jié)論
正確檢測(cè)小物體確實(shí)是一個(gè)挑戰(zhàn)。在這篇文章中,我們討論了一些改進(jìn)小物體檢測(cè)器的策略,即:
提高圖像捕獲分辨率
提高模型的輸入分辨率
平鋪圖像
通過(guò)擴(kuò)充生成更多數(shù)據(jù)
自動(dòng)學(xué)習(xí)模型錨
過(guò)濾掉多余的類
好消息,小白學(xué)視覺(jué)團(tuán)隊(duì)的知識(shí)星球開通啦,為了感謝大家的支持與厚愛(ài),團(tuán)隊(duì)決定將價(jià)值149元的知識(shí)星球現(xiàn)時(shí)免費(fèi)加入。各位小伙伴們要抓住機(jī)會(huì)哦!
下載1:OpenCV-Contrib擴(kuò)展模塊中文版教程
在「小白學(xué)視覺(jué)」公眾號(hào)后臺(tái)回復(fù):擴(kuò)展模塊中文教程,即可下載全網(wǎng)第一份OpenCV擴(kuò)展模塊教程中文版,涵蓋擴(kuò)展模塊安裝、SFM算法、立體視覺(jué)、目標(biāo)跟蹤、生物視覺(jué)、超分辨率處理等二十多章內(nèi)容。
下載2:Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目52講
在「小白學(xué)視覺(jué)」公眾號(hào)后臺(tái)回復(fù):Python視覺(jué)實(shí)戰(zhàn)項(xiàng)目,即可下載包括圖像分割、口罩檢測(cè)、車道線檢測(cè)、車輛計(jì)數(shù)、添加眼線、車牌識(shí)別、字符識(shí)別、情緒檢測(cè)、文本內(nèi)容提取、面部識(shí)別等31個(gè)視覺(jué)實(shí)戰(zhàn)項(xiàng)目,助力快速學(xué)校計(jì)算機(jī)視覺(jué)。
下載3:OpenCV實(shí)戰(zhàn)項(xiàng)目20講
在「小白學(xué)視覺(jué)」公眾號(hào)后臺(tái)回復(fù):OpenCV實(shí)戰(zhàn)項(xiàng)目20講,即可下載含有20個(gè)基于OpenCV實(shí)現(xiàn)20個(gè)實(shí)戰(zhàn)項(xiàng)目,實(shí)現(xiàn)OpenCV學(xué)習(xí)進(jìn)階。
交流群
歡迎加入公眾號(hào)讀者群一起和同行交流,目前有SLAM、三維視覺(jué)、傳感器、自動(dòng)駕駛、計(jì)算攝影、檢測(cè)、分割、識(shí)別、醫(yī)學(xué)影像、GAN、算法競(jìng)賽等微信群(以后會(huì)逐漸細(xì)分),請(qǐng)掃描下面微信號(hào)加群,備注:”昵稱+學(xué)校/公司+研究方向“,例如:”張三?+?上海交大?+?視覺(jué)SLAM“。請(qǐng)按照格式備注,否則不予通過(guò)。添加成功后會(huì)根據(jù)研究方向邀請(qǐng)進(jìn)入相關(guān)微信群。請(qǐng)勿在群內(nèi)發(fā)送廣告,否則會(huì)請(qǐng)出群,謝謝理解~
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/119988.html
摘要:目前目標(biāo)檢測(cè)領(lǐng)域的深度學(xué)習(xí)方法主要分為兩類的目標(biāo)檢測(cè)算法的目標(biāo)檢測(cè)算法。原來(lái)多數(shù)的目標(biāo)檢測(cè)算法都是只采用深層特征做預(yù)測(cè),低層的特征語(yǔ)義信息比較少,但是目標(biāo)位置準(zhǔn)確高層的特征語(yǔ)義信息比較豐富,但是目標(biāo)位置比較粗略。 目前目標(biāo)檢測(cè)領(lǐng)域的深度學(xué)習(xí)方法主要分為兩類:two stage的目標(biāo)檢測(cè)算法;one stage的目標(biāo)檢測(cè)算法。前者是先由算法生成一系列作為樣本的候選框,再通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行樣本...
摘要:從標(biāo)題上可以看出,這是一篇在實(shí)例分割問(wèn)題中研究擴(kuò)展分割物體類別數(shù)量的論文。試驗(yàn)結(jié)果表明,這個(gè)擴(kuò)展可以改進(jìn)基準(zhǔn)和權(quán)重傳遞方法。 今年10月,何愷明的論文Mask R-CNN摘下ICCV 2017的較佳論文獎(jiǎng)(Best Paper Award),如今,何愷明團(tuán)隊(duì)在Mask R-CNN的基礎(chǔ)上更近一步,推出了(以下稱Mask^X R-CNN)。這篇論文的第一作者是伯克利大學(xué)的在讀博士生胡戎航(清華...
摘要:雖說(shuō)都是些量少易懂的知識(shí)點(diǎn),卻主角般地貫穿著整個(gè)學(xué)習(xí)過(guò)程,而且作為從小白到學(xué)習(xí)者思維轉(zhuǎn)換的橋梁,其必要性是肯定的。所以對(duì)于從未接觸過(guò)深度學(xué)習(xí)的小白,強(qiáng)烈推薦了解,非小白可跳過(guò)圖像分類首先來(lái)了解在計(jì)算機(jī)視覺(jué)領(lǐng)域上的圖像指的是什么。 【DL-CV】【深度學(xué)習(xí)-計(jì)算機(jī)視覺(jué)】系列簡(jiǎn)介及入門推薦【DL-CV】線性分類器 在初次進(jìn)入坑,接觸高深的算法環(huán)節(jié)之前,有必要對(duì)計(jì)算機(jī)視覺(jué)的目標(biāo)和實(shí)現(xiàn)有一個(gè)大...
閱讀 2003·2021-11-19 09:40
閱讀 1963·2021-09-28 09:36
閱讀 2296·2021-09-22 10:02
閱讀 2738·2019-08-30 14:00
閱讀 1967·2019-08-29 15:31
閱讀 2908·2019-08-29 15:11
閱讀 2916·2019-08-29 13:04
閱讀 1090·2019-08-27 10:55