成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

淺談AI視頻技術(shù)超分辨率

Towers / 2793人閱讀

摘要:在這種場(chǎng)景下網(wǎng)易云信可以在接收的終端上通過(guò)超分辨率技術(shù),恢復(fù)視頻質(zhì)量,極大地提升了移動(dòng)端用戶的體驗(yàn)。云信通過(guò)人工智能深度學(xué)習(xí)將低分辨率視頻重建成高分辨率視頻模糊圖像視頻瞬間變高清,為移動(dòng)端為用戶帶來(lái)極致視頻體驗(yàn)。

泛娛樂(lè)應(yīng)用成為主流,社交與互動(dòng)性強(qiáng)是共性,而具備這些特性的產(chǎn)品往往都集中在直播、短視頻、圖片分享社區(qū)等社交化娛樂(lè)產(chǎn)品,而在這些產(chǎn)品背后的黑科技持續(xù)成為關(guān)注重點(diǎn),網(wǎng)易云信在網(wǎng)易MCtalk 泛娛樂(lè)創(chuàng)新峰會(huì)上重點(diǎn)介紹了超越像素的AI視頻黑科技“超分”。
超分辨率(Super-Resolution)通過(guò)硬件或軟件方法提高原有圖像的分辨率,通過(guò)一幅或者多幅低分辨率的圖像來(lái)得到一幅高分辨率的圖像過(guò)程就是超分辨率重建,可以通過(guò)人工智能深度學(xué)習(xí)將低分辨率視頻重建成高分辨率視頻模糊圖像、視頻瞬間變高清,為移動(dòng)端為用戶帶來(lái)極致視頻體驗(yàn)。
什么是超分辨率
廣義的超分辨率 (SR, Super Resolution) 是指一類(lèi)用于提升圖像分辨率的技術(shù)。這類(lèi)技術(shù)已經(jīng)存在了很長(zhǎng)一段時(shí)間,應(yīng)用也非常廣泛。事實(shí)上,每當(dāng)我們需要以不同于原始分辨率的尺寸來(lái)顯示或存儲(chǔ)圖像時(shí),就已經(jīng)使用了SR,只不過(guò)使用的是其中最為簡(jiǎn)單的那類(lèi)算法而已。
隨著圖像處理理論的發(fā)展,以及機(jī)器學(xué)習(xí)的普及和更高性能的處理器的出現(xiàn),各類(lèi)更優(yōu)秀的SR算法陸續(xù)出現(xiàn)?,F(xiàn)在我們提及SR時(shí),往往是特指依靠機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)的圖像放大算法。下文提到SR時(shí)也均特指這類(lèi)算法。它能夠提供遠(yuǎn)超于傳統(tǒng)圖像放大算法的圖像質(zhì)量。當(dāng)然,運(yùn)算量也要高得多。

圖1. 將原始圖像縮小3倍后分別使用Bicubic (一種傳統(tǒng)圖像放大算法) 和SRCNN (一種基于CNN的圖像放大算法) 進(jìn)行放大[1]。
超分辨率理論描述
SR算法本質(zhì)上和傳統(tǒng)圖像放大算法沒(méi)什么不同,都是利用已有的圖像信息去預(yù)測(cè)需要的像素點(diǎn)。只不過(guò)傳統(tǒng)算法的預(yù)測(cè)模型非常簡(jiǎn)單,可以通過(guò)人工設(shè)計(jì)的方式實(shí)現(xiàn)。例如雙線性插值,就是利用目標(biāo)像素周?chē)乃膫€(gè)點(diǎn)來(lái)做預(yù)測(cè),離目標(biāo)位置越近的點(diǎn)權(quán)重越大,通過(guò)一個(gè)簡(jiǎn)單的公式就能得到結(jié)果: f(x,y)=f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy

圖2. 雙線性插值,通過(guò)Q11~Q22這四個(gè)點(diǎn)預(yù)測(cè)點(diǎn)P
而現(xiàn)代SR算法為了得到更精確的預(yù)測(cè)結(jié)果,其預(yù)測(cè)模型則復(fù)雜了很多。一般有多個(gè)卷積層和激活層,會(huì)利用到目標(biāo)像素周?chē)艽笠黄瑓^(qū)域的圖像信息,包含成千上萬(wàn)個(gè)模型參數(shù),純靠人工設(shè)計(jì)是不現(xiàn)實(shí)的。所以人們才會(huì)依靠機(jī)器學(xué)習(xí)的方式來(lái)決定參數(shù)。這種做法還附帶有不少好處。例如你無(wú)需對(duì)圖像處理有深厚的理解就可以訓(xùn)練模型,再比如你可以根據(jù)自己的應(yīng)用場(chǎng)景調(diào)整訓(xùn)練集,從而得到更適合你的預(yù)測(cè)模型。
下圖是一個(gè)簡(jiǎn)單的例子,來(lái)自經(jīng)典的超分算法SRCNN[1]。模型基于卷積神經(jīng)網(wǎng)絡(luò),以原始圖像為輸入,先是用廉價(jià)的上采樣算法將分辨率提升到期望的大小, 然后經(jīng)過(guò)3層分別為9x9x128,3x3x64,5x5的卷積運(yùn)算,得到超分輸出。

圖3. SRCNN網(wǎng)絡(luò)結(jié)構(gòu)
這幾年每屆超分競(jìng)賽都會(huì)出現(xiàn)不少值得借鑒的新理論和新實(shí)現(xiàn),SR的效果上限被不斷提高。介紹這些算法的文章有很多,感興趣的讀者可以自行搜索。
什么時(shí)候用超分辨率
雖然視覺(jué)效果很好,但SR在使用上有幾方面限制需要我們注意。其中最重要的就是性能這個(gè)硬性指標(biāo)。即便是極為簡(jiǎn)單的SR算法,其運(yùn)算量也是傳統(tǒng)放大算法的上千倍,能否滿足應(yīng)用的性能需求是需要經(jīng)過(guò)測(cè)試和優(yōu)化的。
另外,目前的SR算法主要分兩個(gè)流派,一派的目標(biāo)是盡可能地還原信息,另一派則允許在不影響視覺(jué)體驗(yàn)的前提下對(duì)內(nèi)容進(jìn)行一些修改。我們需要根據(jù)應(yīng)用場(chǎng)景來(lái)選擇不同的算法。如果在對(duì)圖像還原度要求較高的場(chǎng)合下使用了不適當(dāng)?shù)腟R算法,可能帶來(lái)不好的后果。

圖4. 上圖左側(cè)為SRGAN模型[2]放大4倍生成的圖片,可以看到首飾的紋理被大幅修改。
還有一點(diǎn),目前的SR算法大都針對(duì)自然圖像。對(duì)于一些特殊的圖像,例如因?yàn)榭s小而失真的文字,直接使用SR算法去放大的效果實(shí)際測(cè)試下來(lái)并不理想。

圖5. 直接使用SR并不能較好地還原失真的文字
超分辨率的優(yōu)勢(shì)
基于深度學(xué)習(xí)的超分技術(shù)能較好的恢復(fù)圖像細(xì)節(jié). 在視頻發(fā)送源可能因?yàn)榉N種客觀限制, 無(wú)法提供高分辨率的視頻. 比如攝像頭采集能力不足, 網(wǎng)絡(luò)帶寬不足,源端處理能力不足等, 在這些情形下, 如果云端或者接收端的處理能力滿足要求, 可以借助超分技術(shù), 對(duì)于視頻質(zhì)量做恢復(fù), 呈現(xiàn)給用戶高質(zhì)量的視頻. 所以超分技術(shù)為在惡劣的客觀條件下的視頻應(yīng)用提供了高質(zhì)量呈現(xiàn)的可能, 是傳統(tǒng)的應(yīng)用借助人工智能技術(shù)提升使用體驗(yàn)的一種典型落地場(chǎng)景.
網(wǎng)易云信在超分辨率的實(shí)踐
網(wǎng)易云信提供了點(diǎn)播直播和實(shí)時(shí)音視頻等技術(shù)能力。 支持的終端包括Windows PC, MAC, iPhone, iPad, Android手機(jī), 機(jī)頂盒, 智能手表等可穿戴設(shè)備。其中可穿戴設(shè)備, 機(jī)頂盒等終端的成本控制比較嚴(yán)格, 通常CPU處理能力相對(duì)較弱, 無(wú)法支持高清, 甚至標(biāo)清的視頻規(guī)格, 但是作為這些終端的使用者, 它們依然希望看到高清或標(biāo)清的視頻質(zhì)量, 接收的終端可能是PC或者性能較好的手機(jī), 平板電腦等設(shè)備,他們自己可能有能力提供優(yōu)秀的計(jì)算資源。在這種場(chǎng)景下, 網(wǎng)易云信可以在接收的終端上通過(guò)超分辨率技術(shù), 恢復(fù)視頻質(zhì)量,極大地提升了移動(dòng)端用戶的體驗(yàn)。如果接收的終端本身運(yùn)算能力不足以支撐深度學(xué)習(xí), 但是有能力處理高清視頻的解碼, 網(wǎng)易云信依然可以在云端對(duì)低分辨率的視頻進(jìn)行處理, 采用包括超分在內(nèi)的技術(shù),對(duì)質(zhì)量恢復(fù)后,將高質(zhì)量的視頻提供到接收終端。
尤其針對(duì)弱網(wǎng)情況,云信將在云端或者接收終端通過(guò)超分技術(shù)對(duì)質(zhì)量進(jìn)行補(bǔ)償, 為用戶呈現(xiàn)超高質(zhì)量視頻。云信通過(guò)人工智能深度學(xué)習(xí)將低分辨率視頻重建成高分辨率視頻模糊圖像、視頻瞬間變高清,為移動(dòng)端為用戶帶來(lái)極致視頻體驗(yàn)。
[1] C. Dong, C. C. Loy, K. He, and X. Tang. Learning a deep convolutional network for image super-resolution. In European Conference on Computer Vision (ECCV), pages 184–199. Springer,
2014.
[2] Ledig C, Theis L,Huszar F, et al. Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network[J]. 2016:105-114.

想要閱讀更多技術(shù)干貨、行業(yè)洞察,歡迎關(guān)注網(wǎng)易云信博客。

了解網(wǎng)易云信,來(lái)自網(wǎng)易核心架構(gòu)的通信與視頻云服務(wù)。

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/19927.html

相關(guān)文章

  • AI 學(xué)會(huì)“腦補(bǔ)”:神經(jīng)網(wǎng)絡(luò)逼真圖像補(bǔ)完從 0 到 1

    摘要:那些局部響應(yīng)由小的通常神經(jīng)補(bǔ)丁表示。概述我們尋求對(duì)損失函數(shù)進(jìn)行了優(yōu)化的修復(fù)圖像,其被表示為三個(gè)項(xiàng)的組合整體內(nèi)容項(xiàng),局部紋理項(xiàng)和項(xiàng)。我們的方法使用兩個(gè)聯(lián)合損失函數(shù)來(lái)解決未知圖像,即整體內(nèi)容損失和局部紋理?yè)p失。 完勝 PS!新方法實(shí)現(xiàn)完美腦補(bǔ)在分享照片之前,你可能會(huì)想進(jìn)行一些修改,例如擦除分散注意力的場(chǎng)景元素,調(diào)整圖像中的物體位置以獲得更好的組合效果,或者把被遮擋的部分恢復(fù)出來(lái)。這些操作,以及其...

    tulayang 評(píng)論0 收藏0
  • 首次公開(kāi)!《阿里計(jì)算機(jī)視覺(jué)技術(shù)精選》揭秘前沿落地案例

    摘要:元旦假期即將來(lái)臨,我們精心準(zhǔn)備了這本阿里巴巴機(jī)器智能計(jì)算機(jī)視覺(jué)技術(shù)精選,收錄了頂級(jí)會(huì)議阿里論文,送給計(jì)劃在假期充電的同學(xué)們,也希望能和更多學(xué)術(shù)界工業(yè)界同仁一起探討交流。 當(dāng)下計(jì)算機(jī)視覺(jué)技術(shù)無(wú)疑是AI浪潮中最火熱的議題之一。視覺(jué)技術(shù)的滲透,既可以對(duì)傳統(tǒng)商業(yè)進(jìn)行改造使之看到新的商業(yè)機(jī)會(huì),還可以創(chuàng)造全新的商業(yè)需求和市場(chǎng)。無(wú)論在電商、安防、娛樂(lè),還是在工業(yè)、醫(yī)療、自動(dòng)駕駛領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)都...

    Carbs 評(píng)論0 收藏0
  • 人工智能期末筆記

    摘要:舉例,神經(jīng)元,感知機(jī),神經(jīng)網(wǎng)絡(luò)行為主義智能機(jī)器人認(rèn)為人工智能源于控制論。人工智能的研究領(lǐng)域包括專(zhuān)家系統(tǒng)推薦系統(tǒng)等等。是一種實(shí)現(xiàn)人工智能的方法根據(jù)某些算法,通過(guò)大量數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)。 1. 緒論 四大流派 符號(hào)主義(知識(shí)圖譜)原理主要為物理符號(hào)系統(tǒng)(即符號(hào)操作系統(tǒng))假設(shè)和有限合理性原理 用數(shù)理邏輯描述智能行為, 在計(jì)算機(jī)上實(shí)現(xiàn)了邏輯演繹系統(tǒng)。 ...

    CodeSheep 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<