0
本文作者: 木子 | 2019-11-19 10:44 | 專題:首屆“全國人工智能大賽” |
首屆“全國人工智能大賽”初賽已經(jīng)進(jìn)入到白熱化階段,排行榜瞬息萬變,每天都給方小鯨眼前一亮的驚喜。不少選手反映 AI+4K 賽項(xiàng)“好難啊”,想要“抱一個(gè)大腿”,方小鯨有幸邀請(qǐng)到 AI+4K 賽項(xiàng)初賽階段兩支已霸榜的參賽隊(duì)伍成員,為大家分享一下他們的參賽思路。
話不多說,讓我們一起看看他們到底是怎么想的吧!
來自南京大學(xué)的參賽選手
Q1:看到題目后第一反應(yīng)是什么?做了哪些思考呢?
主要思考了數(shù)據(jù)怎么從 mp4 取出來增強(qiáng)然后又怎么變回 mp4 。
Q2:讓你取得這么好的成績主要是哪幾項(xiàng)技術(shù)或者工程處理呢?有沒有什么經(jīng)驗(yàn)或者獨(dú)特的技巧可以和大家分享一下呢?
總的來說視頻超分框架是要優(yōu)于單幀的框架的,那視頻框架的話目前最好的就是 EDVR 了,尤其是這次比賽 vmaf 權(quán)重比較高,那多幀超分的 vmaf 估計(jì)是遠(yuǎn)高于單幀的,只要把 edvr 的 baseline 跑出來,分?jǐn)?shù)應(yīng)該不會(huì)低吧。
我們目前采用的就是 EDVR 的框架,因?yàn)橛脖P讀取速度實(shí)在太慢,所以 batch size 設(shè)置為了4個(gè) patch,就算這樣迭代100個(gè) iter 也要兩分鐘,后面會(huì)考慮把訓(xùn)練速度提起來,目前我們只用了一塊1080ti 訓(xùn)練。
Q3:至今為止,比賽給你最大的收獲是?
最大收獲是在實(shí)現(xiàn)深度學(xué)習(xí)模型的時(shí)候?qū)W會(huì)考慮資源的分配了。這次賽題數(shù)據(jù)量很大,遠(yuǎn)多于優(yōu)酷那個(gè)比賽,資源分配在這樣的實(shí)際環(huán)境中也非常重要。
Q4:如何理解本次數(shù)據(jù)競(jìng)賽的意義和價(jià)值?
通過比賽可以吸引人才、讓很多同領(lǐng)域的優(yōu)秀人才聚在一起交流,是一個(gè)非常難得的機(jī)會(huì)。同時(shí)比賽也可以推動(dòng)這個(gè)方向的研究,讓更多的人了解這個(gè)領(lǐng)域,推動(dòng)超分辨這個(gè)技術(shù)的很多實(shí)用價(jià)值能夠可以真正落地。
Q5:你覺得在 CV 領(lǐng)域,還有哪些你喜歡的,或者覺得未來會(huì)越來越重要的技術(shù)?為什么會(huì)有這樣的考慮呢?
我覺得未來將會(huì)越來越依賴于三維方向的一些技術(shù),現(xiàn)在好多研究都在往三維方向拓展,二維圖像還是有一定的局限性的。
來自香港理工大學(xué)的參賽選手
Q1:看到題目后第一反應(yīng)是什么?做了哪些思考呢?
初賽的題目是將疊加隨機(jī)噪聲的540p SDR 視頻重建為去噪后的4K SDR 視頻??吹筋}目第一反應(yīng)就是解決這個(gè)問題有兩種方案,一種是將降噪和超分結(jié)合起來做,另一種是將降噪和超分分開來做,這兩種方案都是值得嘗試的。
另外,拿到題目的想法就是先設(shè)立一個(gè) Baseline 將整個(gè)流程跑通,然后再在這基礎(chǔ)上進(jìn)行改進(jìn)。比如說,首先可以做一下單幀的嘗試,然后再拓展到多幀。
Q2:讓你取得這么好的成績主要是哪幾項(xiàng)技術(shù)或者工程處理呢?有沒有什么經(jīng)驗(yàn)或者獨(dú)特的技巧可以和大家分享一下呢?
主要就是認(rèn)真分析和處理數(shù)據(jù)。這個(gè)數(shù)據(jù)集不同于學(xué)術(shù)數(shù)據(jù)集,其中包含黑邊和場(chǎng)景轉(zhuǎn)換的問題,這些在訓(xùn)練和測(cè)試過程中都需要考慮。另外,這個(gè)數(shù)據(jù)集是540p 到4K ,對(duì)于這么大的圖,在訓(xùn)練過程中是不適合直接讀取原圖,那樣會(huì)造成 IO 瓶頸,所以我們采取了提前切塊的策略。至于網(wǎng)絡(luò)結(jié)構(gòu),我們目前采用的方案沒有很大的創(chuàng)新,但是之后也想做一些嘗試。
Q3:至今為止,比賽給你最大的收獲是?
此次比賽的數(shù)據(jù)集在規(guī)模上比學(xué)術(shù)的數(shù)據(jù)集大上不少,在噪聲模型上也要比學(xué)術(shù)數(shù)據(jù)集復(fù)雜不少,非常難得,鍛煉了我處理復(fù)雜數(shù)據(jù)的能力。
Q4:如何理解本次數(shù)據(jù)競(jìng)賽的意義和價(jià)值?
人工智能在4K/高清視頻處理方向的應(yīng)用是一個(gè)很有前景的方向。隨著5G時(shí)代的來臨,越來越多的設(shè)備支持4K/高清視頻播放,而以前拍攝的很多視頻都達(dá)不到這個(gè)要求,如何將這些老舊視頻處理成符合現(xiàn)有設(shè)備標(biāo)準(zhǔn)的視頻將是一個(gè)有挑戰(zhàn)的問題。而本次主辦方舉辦的 AI+4K HDR 賽項(xiàng)就很好地貼合了這一主題。
Q5:你覺得在 CV 領(lǐng)域,還有哪些你喜歡的,或者覺得未來會(huì)越來越重要的技術(shù)?為什么會(huì)有這樣的思考呢?
畫質(zhì)增強(qiáng)可以應(yīng)用在智能 P 圖中;分割檢測(cè)可以應(yīng)用在工業(yè)質(zhì)檢中。我覺得這些都是未來會(huì)越來越重要的技術(shù)。
以上是首屆”全國人工智能大賽“(AI+4K HDR賽項(xiàng))的采訪實(shí)錄,希望對(duì)正在參賽的小伙伴有所幫助,也歡迎還沒有報(bào)名參加大賽的圍觀群眾上場(chǎng)一試!
每周排行榜的前50支團(tuán)隊(duì),都將獲得「每周之星」獎(jiǎng)項(xiàng),獎(jiǎng)品為騰訊視頻會(huì)員權(quán)益(1個(gè)月)。
轉(zhuǎn)自和鯨社區(qū),詳見原文。
作者:“方小鯨”
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。