0
本文作者: 木子 | 2019-11-19 10:44 | 專題:首屆“全國人工智能大賽” |
首屆“全國人工智能大賽”初賽已經(jīng)進入到白熱化階段,排行榜瞬息萬變,每天都給方小鯨眼前一亮的驚喜。不少選手反映 AI+4K 賽項“好難啊”,想要“抱一個大腿”,方小鯨有幸邀請到 AI+4K 賽項初賽階段兩支已霸榜的參賽隊伍成員,為大家分享一下他們的參賽思路。
話不多說,讓我們一起看看他們到底是怎么想的吧!
來自南京大學(xué)的參賽選手
Q1:看到題目后第一反應(yīng)是什么?做了哪些思考呢?
主要思考了數(shù)據(jù)怎么從 mp4 取出來增強然后又怎么變回 mp4 。
Q2:讓你取得這么好的成績主要是哪幾項技術(shù)或者工程處理呢?有沒有什么經(jīng)驗或者獨特的技巧可以和大家分享一下呢?
總的來說視頻超分框架是要優(yōu)于單幀的框架的,那視頻框架的話目前最好的就是 EDVR 了,尤其是這次比賽 vmaf 權(quán)重比較高,那多幀超分的 vmaf 估計是遠高于單幀的,只要把 edvr 的 baseline 跑出來,分數(shù)應(yīng)該不會低吧。
我們目前采用的就是 EDVR 的框架,因為硬盤讀取速度實在太慢,所以 batch size 設(shè)置為了4個 patch,就算這樣迭代100個 iter 也要兩分鐘,后面會考慮把訓(xùn)練速度提起來,目前我們只用了一塊1080ti 訓(xùn)練。
Q3:至今為止,比賽給你最大的收獲是?
最大收獲是在實現(xiàn)深度學(xué)習模型的時候?qū)W會考慮資源的分配了。這次賽題數(shù)據(jù)量很大,遠多于優(yōu)酷那個比賽,資源分配在這樣的實際環(huán)境中也非常重要。
Q4:如何理解本次數(shù)據(jù)競賽的意義和價值?
通過比賽可以吸引人才、讓很多同領(lǐng)域的優(yōu)秀人才聚在一起交流,是一個非常難得的機會。同時比賽也可以推動這個方向的研究,讓更多的人了解這個領(lǐng)域,推動超分辨這個技術(shù)的很多實用價值能夠可以真正落地。
Q5:你覺得在 CV 領(lǐng)域,還有哪些你喜歡的,或者覺得未來會越來越重要的技術(shù)?為什么會有這樣的考慮呢?
我覺得未來將會越來越依賴于三維方向的一些技術(shù),現(xiàn)在好多研究都在往三維方向拓展,二維圖像還是有一定的局限性的。
來自香港理工大學(xué)的參賽選手
Q1:看到題目后第一反應(yīng)是什么?做了哪些思考呢?
初賽的題目是將疊加隨機噪聲的540p SDR 視頻重建為去噪后的4K SDR 視頻??吹筋}目第一反應(yīng)就是解決這個問題有兩種方案,一種是將降噪和超分結(jié)合起來做,另一種是將降噪和超分分開來做,這兩種方案都是值得嘗試的。
另外,拿到題目的想法就是先設(shè)立一個 Baseline 將整個流程跑通,然后再在這基礎(chǔ)上進行改進。比如說,首先可以做一下單幀的嘗試,然后再拓展到多幀。
Q2:讓你取得這么好的成績主要是哪幾項技術(shù)或者工程處理呢?有沒有什么經(jīng)驗或者獨特的技巧可以和大家分享一下呢?
主要就是認真分析和處理數(shù)據(jù)。這個數(shù)據(jù)集不同于學(xué)術(shù)數(shù)據(jù)集,其中包含黑邊和場景轉(zhuǎn)換的問題,這些在訓(xùn)練和測試過程中都需要考慮。另外,這個數(shù)據(jù)集是540p 到4K ,對于這么大的圖,在訓(xùn)練過程中是不適合直接讀取原圖,那樣會造成 IO 瓶頸,所以我們采取了提前切塊的策略。至于網(wǎng)絡(luò)結(jié)構(gòu),我們目前采用的方案沒有很大的創(chuàng)新,但是之后也想做一些嘗試。
Q3:至今為止,比賽給你最大的收獲是?
此次比賽的數(shù)據(jù)集在規(guī)模上比學(xué)術(shù)的數(shù)據(jù)集大上不少,在噪聲模型上也要比學(xué)術(shù)數(shù)據(jù)集復(fù)雜不少,非常難得,鍛煉了我處理復(fù)雜數(shù)據(jù)的能力。
Q4:如何理解本次數(shù)據(jù)競賽的意義和價值?
人工智能在4K/高清視頻處理方向的應(yīng)用是一個很有前景的方向。隨著5G時代的來臨,越來越多的設(shè)備支持4K/高清視頻播放,而以前拍攝的很多視頻都達不到這個要求,如何將這些老舊視頻處理成符合現(xiàn)有設(shè)備標準的視頻將是一個有挑戰(zhàn)的問題。而本次主辦方舉辦的 AI+4K HDR 賽項就很好地貼合了這一主題。
Q5:你覺得在 CV 領(lǐng)域,還有哪些你喜歡的,或者覺得未來會越來越重要的技術(shù)?為什么會有這樣的思考呢?
畫質(zhì)增強可以應(yīng)用在智能 P 圖中;分割檢測可以應(yīng)用在工業(yè)質(zhì)檢中。我覺得這些都是未來會越來越重要的技術(shù)。
以上是首屆”全國人工智能大賽“(AI+4K HDR賽項)的采訪實錄,希望對正在參賽的小伙伴有所幫助,也歡迎還沒有報名參加大賽的圍觀群眾上場一試!
每周排行榜的前50支團隊,都將獲得「每周之星」獎項,獎品為騰訊視頻會員權(quán)益(1個月)。
轉(zhuǎn)自和鯨社區(qū),詳見原文。
作者:“方小鯨”
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。