0
本文作者: 汪思穎 | 2018-06-13 18:10 |
雷鋒網(wǎng) AI 研習(xí)社按,CVPR 2018 圖像壓縮挑戰(zhàn)賽(CLIC)結(jié)果已經(jīng)出爐,騰訊音視頻實(shí)驗(yàn)室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊(duì)于該項(xiàng)挑戰(zhàn)賽上取得壓縮性能第一。(騰訊音視頻實(shí)驗(yàn)室憑借在 CLIC 中 PSNR 指標(biāo)第一在雷鋒網(wǎng)學(xué)術(shù)頻道 AI 科技評(píng)論旗下數(shù)據(jù)庫項(xiàng)目「AI 影響因子」中增加 10 分。)
CVPR 是計(jì)算機(jī)視覺領(lǐng)域的盛宴,全世界相關(guān)領(lǐng)域的頂尖學(xué)者、研究人員和企業(yè)都會(huì)積極參與。今年,CVPR 新增了圖像壓縮 workshop 和挑戰(zhàn)賽議程,這場(chǎng)挑戰(zhàn)賽由 Google、Twitter、Amazon 等公司聯(lián)合贊助,是第一個(gè)由計(jì)算機(jī)視覺領(lǐng)域的會(huì)議發(fā)起的圖像壓縮挑戰(zhàn)賽,旨在將神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等一些新的方式引入到圖像壓縮領(lǐng)域。
圖像壓縮技術(shù)對(duì)于互聯(lián)網(wǎng)信息傳輸有至關(guān)重要的意義。一張未經(jīng)壓縮的 1200 萬像素的圖片就會(huì)占用 36MB 的存儲(chǔ)空間,而目前網(wǎng)絡(luò)上每天圖片傳輸、存儲(chǔ)數(shù)量數(shù)以億萬計(jì),為了節(jié)省帶寬資源、存儲(chǔ)資源,減少服務(wù)器的壓力,高效的圖像壓縮算法必不可少。
據(jù)大會(huì)官方介紹,此次挑戰(zhàn)賽分別從 PSNR 和主觀評(píng)價(jià)兩個(gè)方面去評(píng)估參賽團(tuán)隊(duì)的表現(xiàn)。峰值信噪比(PSNR)衡量的是壓縮前后兩張圖逐像素統(tǒng)計(jì)所產(chǎn)生的誤差,峰值信噪比越高,代表兩張圖誤差越小,也就意味著壓縮后的圖與原圖越接近、圖片質(zhì)量損失越小。
騰訊音視頻實(shí)驗(yàn)室和武漢大學(xué)陳震中教授聯(lián)合團(tuán)隊(duì) iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)指標(biāo)上占據(jù)領(lǐng)先優(yōu)勢(shì),在決賽數(shù)據(jù)集上比第二名高了 0.13 dB,位列第一。
據(jù)陳震中教授介紹,iipTiramisu 團(tuán)隊(duì)使用了基于傳統(tǒng)混合框架(hybrid image coder)融入深度學(xué)習(xí)的編碼模塊 CNNMC 以及 CNN in-loop filter,以及基于不確定性的資源分配策略,最終可以在數(shù)據(jù)集壓縮性能上比 BPG 提升 30% 以上。
從下圖可以看到,與業(yè)界最優(yōu)秀的開源圖像壓縮算法之一 BPG 相比,iipTiramisu 在峰值信噪比上有顯著的優(yōu)勢(shì):
Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)
信噪比不變的情況下,在性能優(yōu)先模式下 iipTiramisu 比 BPG 節(jié)省 30.8% 的碼率,速度優(yōu)先模式下比 BPG 節(jié)省 27.9% 的碼率。
Fig.2 Compressed by BPG, bit rate:0.14 bpp, PNSR:31.45 dB.
Fig.3 Compressed by iipTiramisu, bit rate:0.14 bpp, PNSR:33.03 dB
在碼率都為 0.14 bpp 的情況下,iipTiramisu 的峰值信噪比比 BPG 高 1.58 dB,質(zhì)量損失率明顯減少。
關(guān)于該比賽的更多信息,可參見如下地址:
http://www.compression.cc/challenge/
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。