0
本文作者: 奕欣 | 2017-08-16 23:13 |
第一次投遞論文,就中了 KDD,是什么樣的體驗?
第一次投 KDD,不僅中了,還同時獲得了最佳論文 runner-up和最佳學(xué)生論文 runner-up,又是什么樣的體驗?
這兩個知乎體問題,邀請東北大學(xué) SDS(Sustainability & Data Science)實驗室的博士生 Thomas Vandal 來回答最合適不過了。他的處女作《DeepSD: Generating High Resolution Climate Change Projections through Single Image Super-Resolution》在 KDD 2017 上榮獲最佳論文 runner-up及最佳學(xué)生論文 runner-up,Vandal 此外還獲得了 Student Travel Award。
Vandal 在會后告訴雷鋒網(wǎng) AI 科技評論,之前他只參加過一些 workshop,因此一開始并沒有想到這篇論文會獲得最佳應(yīng)用類論文的 runner-up,「我們本來覺得可能會有機會獲得最佳學(xué)生論文獎,但這個結(jié)果的確出人意料?!?/p>
DeepSD 這篇論文圍繞的是解決氣候分析的統(tǒng)計降尺度問題,團隊利用深度學(xué)習(xí)技術(shù)通過廣義的疊加超分辨率 CNN (SRCNN) 框架增加多尺度輸入通道,生成有效的統(tǒng)計降尺度模型。(底部附論文摘要)
在 Youtube 上,Vandal 已經(jīng)放出了關(guān)于這篇論文的介紹視頻,雷鋒網(wǎng) AI 科技評論搬運視頻如下:
第一次投 KDD 就獲得如此出色的成績,讓 Vandal 感到非常驚訝和高興,他表示這對自己而言是一個莫大的鼓勵。自然,第一次上臺伴隨的也有緊張。在論文展示現(xiàn)場,他在演講時舌頭有些打結(jié),出現(xiàn)了不時的卡頓。或許大家也看到了他的局促不安,因此在問答環(huán)節(jié)的時候,只有一位觀眾非常「友善」地提了一個不痛不癢的問題;同一場次至少要讓觀眾提三四個問題的主持人也沒有「刁難」他,很快地邀請下一位講者上臺;在 Vandal 演講完畢下臺的時候,他抱著電腦快步離開,甚至忘記了把身上別著的麥克風(fēng)摘下來遞給下一位講者;而當(dāng)他回到后排座位上的時候,臉上終于流露出自然而放松的神色。
在演講過程中,Vandal 也提及了模型自身依然存在一些缺點,包括理解云、冰雹等氣象對氣候判斷的影響,還沒有在缺乏數(shù)據(jù)的地方檢驗?zāi)P偷目深A(yù)測性,在這樣的狀況下,要進行高分辨率的氣候分析則顯得更加困難。Vandal 也表示,希望利用機器學(xué)習(xí)將模型變得更高效,且能夠適應(yīng)更大范圍的分析。
「我們采用深度學(xué)習(xí)方法解決氣候問題的時候,實際上是在一個非常大的范圍內(nèi)產(chǎn)生作用。而其中面臨的最大問題是面對氣候的海量數(shù)據(jù)源,我們需要關(guān)注用戶真正關(guān)心的數(shù)據(jù)是哪些,并將其進行模式化處理。可能對于商務(wù)人士或是政府人士,他們需要的內(nèi)容可能會有差異?!?/p>
Thomas Vandal 向雷鋒網(wǎng) AI 科技評論表示,深度學(xué)習(xí)的火熱對計算機科學(xué)而言,是一個深入研究領(lǐng)域知識的良好契機,就像自然語言處理現(xiàn)在也運用了深度學(xué)習(xí)優(yōu)化模型結(jié)果一樣,反過來,它也能夠促進我們對領(lǐng)域知識的理解。「深度學(xué)習(xí)也提供了一種讓我們重新利用和審視數(shù)據(jù)的方法,值得所有研究者關(guān)注和思考?!?/p>
而根據(jù) Vandal 的說法,這篇論文很快將投遞到機器學(xué)習(xí)或計算機視覺的期刊上,在此之后會在大型計算機上進行試運行,最終將 120 個氣候模型投入使用并將結(jié)果開放給公眾。
作為一名正在研讀交叉學(xué)科工程的博士生,Thomas Vandal 實際上算得上是「半路出家」。2012 年在馬里蘭州大學(xué)完成數(shù)學(xué)本科學(xué)習(xí)的他,畢業(yè)后在 Boston Technologies 擔(dān)任市場風(fēng)險分析師,管理數(shù)百萬的外匯市場,隨后在 Affectiva 擔(dān)任數(shù)據(jù)科學(xué)家,開發(fā)了一款分析面部表情的工具。自 2015 年開始,Vandal 開始在東北大學(xué)攻讀交叉工程學(xué)科,致力于用深度學(xué)習(xí)研究氣候問題。
深度學(xué)習(xí)的應(yīng)用有很多,但為何他會選擇氣候方向?Vandal 表示,氣候領(lǐng)域是一個非常重要的方向,在未來的二十到五十年都可能會對全美國甚至全球產(chǎn)生普遍性的影響?!窷ASA 有很多衛(wèi)星在監(jiān)測各種有意思的氣象數(shù)據(jù),我也和很多其它 NASA 成員在合作?!?/p>
目前,Vandal 也在 NASA Ames 研究中心實習(xí),這篇獲獎?wù)撐囊彩桥c NASA 研究員 Sangram Ganguly、Ramakrishna Nemani,還有劍橋大學(xué)的 Evan Kodra、University Corporation 的 Andrew Michaelis 以及 Vandal 的導(dǎo)師 Auroop R Ganguly 合作完成。他計劃在未來繼續(xù)對氣候問題進行深度研究,爭取將自己的論文成果落地為成熟技術(shù)并盡快帶給公眾。
附論文摘要:
氣候變化的影響是由基礎(chǔ)設(shè)施、生態(tài)系統(tǒng)和發(fā)電廠等大多數(shù)關(guān)鍵系統(tǒng)所監(jiān)測到的。然而,目前地球系統(tǒng)模型(Earth System Models,ESM)的空間分辨率過低,因此并不適合本地化。統(tǒng)計降尺度(statistical downscaling)能夠通過對歷史氣候的觀測來學(xué)習(xí)低分辨率到高分辨率的映射,采用這種方法可以獲得縮減規(guī)模投射。依賴統(tǒng)計模型的選擇,小尺度投射在準(zhǔn)確性和可靠性上提出了不同的要求。氣候系統(tǒng)的時空特征推動了超分辨率圖像處理技術(shù)對統(tǒng)計降尺度的適應(yīng)性。我們提出了 DeepSD,一種用于氣候統(tǒng)計降尺度的、廣義的疊加超分辨率 CNN(SRCNN)框架。DeepSD 增加了具有多尺度輸入通道的 SRCNN,能夠最大化統(tǒng)計降尺度的可預(yù)測性。比起誤差訂正空間分解法(Bias Correction Spatial Disaggregation)以及三個自動統(tǒng)計降尺度方法,我們采用的方法將美國大陸范圍內(nèi)日降水量氣候降尺度從 1 度(~100 km)降至 1/8 度(~12.5 km)。此外,我們討論了使用 NASA 地球交換(NEX)平臺的框架,用于超過 20 個具有多個排放情景的 ESM 模型的統(tǒng)計降尺度。
Thomas Vandal的個人主頁:http://www1.coe.neu.edu/~tvandal/
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。