0
雷鋒網(wǎng)AI科技評論按:1 月 22 日,號稱業(yè)界「研值」最高的百度獎學金 2017 年度頒獎典禮在百度科技園隆重舉行。AI 科技評論作為合作媒體也受邀參加了頒獎儀式,共同見證了 10 位「AI 界耀眼新星」的誕生。
百度獎學金計劃是為了發(fā)掘、支持和鼓勵最優(yōu)秀的華人學生去解決人工智能學科領域當中最有價值的技術問題,促進中國人工智能的世界前沿站位,培養(yǎng)中國人工智能領域的未來儲備精英技術人才。因此本次的十位獲獎選手無疑都來自 AI 領域,研究方向涵蓋了當今最熱門的計算機視覺,自然語言處理,機器學習,大數(shù)據(jù)挖掘等相關細分方向。以下是十位選手的簡單介紹。
陳師哲,計算機視覺領域,主攻「多模態(tài)情感識別」和「視頻內(nèi)容自然語言描述」,在國際頂會期刊發(fā)表相關論文十余篇。
王奕森,機器學習/語音領域,主攻樹類機器學習模型,尤其是隨機森林模型相關的基礎理論和應用。
張飚,自然語言處理領域,主攻機器翻譯中的長時記憶模型,提出了創(chuàng)新型的新模型方案。
胡志挺,自然語言處理領域,主攻自然語言處理以及機器學習方向的基礎理論,尤其在知識和神經(jīng)網(wǎng)絡方法相結合的方向上有獨到的見解。
林衍凱,自然語言處理領域,主攻知識表示學習,知識獲取,知識應用方向,代表性的研究和成果有 TransR 和 PTransE,NRE 和 MNER 等。
王小龍,計算機視覺領域,碩士期間主要做 DPM 的檢測工作,博士從事預測學習(predictive learning)工作,發(fā)表的論文多次被國際頂會收錄,目前發(fā)表 17 篇論文,10 篇一作,570 個引用。
王云鶴,計算機視覺領域,主攻神經(jīng)網(wǎng)絡加速壓縮方面的研究。他提出了利用離散余弦變換來提升卷積神經(jīng)網(wǎng)絡預測過程的預測速度,該方法極具創(chuàng)新性和實用性。
李成濤,機器學習領域,主攻多樣性采樣方面的研究,他和導師共同研究使用馬爾科夫鏈進行采樣,并且運用數(shù)值計算的技術(Gauss Quadrature),極大地提升了采樣效率。
吳昊,數(shù)據(jù)挖掘領域,主攻利用數(shù)據(jù)挖掘、機器學習與深度學習解決軌跡序列建模以及預測問題。其研究的方法在地圖大數(shù)據(jù)軌跡挖掘、地圖新路徑挖掘,以及基于大數(shù)據(jù)人流分析具有非常重要的意義。
朱鎔,數(shù)據(jù)挖掘領域,主攻多層圖的挖掘算法, 包括 Top-K 可靠搜索,SimRank 相似性,Top-K 稠密子圖挖掘等問題。目前發(fā)表一作的頂級期刊和會議文章五篇(TKDE/KAIS/ICDE/ICDM)。
雷鋒網(wǎng) AI 科技評論了解到,本次的初選評選標準主要參考選手們的學術成績,包括在國際頂級學術會議和期刊上的總發(fā)文數(shù),以及一作和非一作的的各自占比。以上這些選手能夠脫穎而出,除了學術成績不俗、答辯環(huán)節(jié)征服評委外,最最重要的還有他們研究成果的工程轉化能力。這一點在頒獎現(xiàn)場也得到了百度技術委員會主席吳華的認可?!赶啾韧鶎玫陌俣泉剬W金獲獎選手們,這屆百度獎學金的選手更注重把研究與實際應用場景相結合,并取得了優(yōu)秀的成績。我們希望,這些頂尖的人才能夠在未來繼續(xù)用他們的科研成果去推動人工智能的進步?!拱俣燃夹g委員會主席,同時擔任本次獎學金評審組組長的吳華女士在頒獎現(xiàn)場如是說。
頒獎典禮結束后,為了能使大家更直接地感受獲獎選手的學術風采。活動方邀請了三位獲獎者林衍凱、李成濤、王云鶴進行了簡要的學術分享,同時也邀請了兩位往屆獲獎者李紀為、黃巖前來為「新秀們」助陣。他們五位學術青年共同為大家分享了目前對話系統(tǒng)、深度學習與知識圖譜等領域的最新研究成果。
第一位分享的嘉賓是斯坦福畢業(yè)生李紀為,分享主題是:教會機器談話。
大家好,很開心今天再次重新回到百度,我覺得非常開心!以前是做對話的,今天就為大家分享我一兩年前的工作。
教會機器像人類一樣交談,需要解決兩個問題。一個是如何讓機器產(chǎn)生比較有意思并且有信息的內(nèi)容。另一個是如何保持機器具有一致性,讓它說話不自相矛盾。
之前的這個模型,由于訓練數(shù)據(jù)集里有很多無聊的回復,結果就是模型每次都會產(chǎn)生這種無聊的對話,比如說「我不知道」,「呵呵」之類的。但是光禁止機器回答這類無聊的問題是不夠的,機器還會產(chǎn)生同類,同樣意思的其他語句變種,例如下面這張圖。
所以要解決這個問題首先要通過人對機器之前說的話,來猜到機器的回復是什么。機器通過人回復的話,來猜到人之前問的話是什么。
第二個問題如何讓機器對話保持一致性,大家的想法是讓每一個人用一個向量來代替,所以當你問一個人一百個問題的時候,他會用同一個向量做抵扣。也就是說它會用同一個向量來去讓這一百個問題的回答產(chǎn)生一致。
第二位分享嘉賓是林衍凱,分享主題是:知識表示與知識提取。
我是做偏知識圖譜方向的,前兩年主要在做知識的表示還有它的抽取。知識圖譜,可能大家比較熟悉,就是把一些實體關系組成一個圖譜。今天主要介紹兩方面,第一方面是知識表示,第二方面是知識獲取。
知識表示其實就是將知識圖譜里面的實體對應為一個空間中的向量,傳統(tǒng)的知識圖譜是以一種三元組形式去展現(xiàn)的,現(xiàn)有知識表示方法在模型復雜度較小的情況下,效果是非常好的。我們主要工作有兩點,就是去解決現(xiàn)知識表示方法存在的一些問題。第一個它無法去對知識圖譜中的復雜關系進行建模。第二個,它無法針對知識圖譜內(nèi)部的關系路徑去做建模。
第二部分工作是關于知識抽取。我主要做的是文本關系抽取方面的工作。我們提出了多元的關系抽取系統(tǒng),無論是在中文數(shù)據(jù)下或者在英文數(shù)據(jù)下,它抽取效果都比原始的有了非常大的提高。
第三位分享嘉賓是黃巖,分享主題為:用雙向循環(huán)神經(jīng)網(wǎng)絡處理超分辨率視頻。
我的研究方向是計算機視覺和深度學習,下面我將簡要介紹一下循環(huán)神經(jīng)網(wǎng)絡。相對于傳統(tǒng)的深度神經(jīng)網(wǎng)絡,循環(huán)的網(wǎng)絡更側重于處理序列化的數(shù)據(jù),最大的區(qū)別在于不同時刻隱含狀態(tài)之間的循環(huán)連接。需要注意的一點是,無論是傳統(tǒng)的深度神經(jīng)網(wǎng)絡,還是循環(huán)網(wǎng)絡,它們的所有輸入都是向量的形式,層與層之間都是全連接的操作。
再來介紹一下循環(huán)卷積網(wǎng)絡,它其實是一個全卷積的循環(huán)網(wǎng)絡。以上圖為例,對于傳統(tǒng)的全連接深度神經(jīng)網(wǎng)絡,把它進行全卷積化,即把所有的全連接都替換成卷積操作,就得到我們經(jīng)常使用的卷積網(wǎng)絡。沿著時間方向展開,深度神經(jīng)網(wǎng)絡就變成一個循環(huán)網(wǎng)絡。而我所介紹的循環(huán)卷積網(wǎng)絡本質(zhì)上是一個全卷積的循環(huán)網(wǎng)絡。這種網(wǎng)絡在參數(shù)量上有巨大優(yōu)勢,傳統(tǒng)循環(huán)網(wǎng)絡的參數(shù)量大概是在百萬甚至千萬左右,循環(huán)卷積網(wǎng)絡基本上只有一兩萬左右,因此測試速度會得極大的提升。
應用循環(huán)卷積網(wǎng)絡到視頻超分辨率上,可以在保持視覺內(nèi)容空間結構信息的同時極大提升模型的測試速度,并且卷積操作使得我們可以處理任意尺度的視頻幀。
第四位分享嘉賓為李成濤,分享主題是 :關于多樣性采樣相關的理論、實踐及應用。
我的研究主要是關于多樣性采樣方面的,具體來講就是在一個數(shù)據(jù)集中采樣出一些具有代表性的,沒有冗余信息的一些樣本來代表整個數(shù)據(jù)集,比如一本書的梗概,一段視頻的剪輯等等,簡言之就是從大量信息中提取「干貨」。
通過多樣性采樣,我們可以極大地減少處理數(shù)據(jù)的時間,在很短的時間內(nèi)獲得較多的信息。我之前做過一些多樣性采樣的理論工作,主要是關于如何提升多樣性采樣的效率的。比如我們研究的一個比較典型的多樣性采樣的概率分布,Determinantal Point Process。它的采樣過程非常耗時,我和導師研究后通過使用馬爾科夫鏈進行采樣,在理論上證明了它的采樣效率要高于原本的方法,并且運用數(shù)值計算的技術(Gauss Quadrature),極大地提升了采樣效率。
多樣性采樣還是有非常大的應用前景的。現(xiàn)在是一個信息爆炸時代,如何在更短的時間內(nèi)處理更多的信息一直是一個非常重要的課題。我覺得多樣性采樣在這里面會充當非常重要的角色。很多我們可能不敢想象的事情,可能都會因為多樣性采樣兒變成現(xiàn)實,比如一小時看完一本書,一分鐘看完一部電影電影等等。
最后一位分享嘉賓是王云鶴,分享主題為:關于深度神經(jīng)網(wǎng)絡的壓縮方面的研究。
我在神經(jīng)網(wǎng)絡加速壓縮方面做了深入研究,提出利用離散余弦變換將卷積神經(jīng)網(wǎng)絡預測過程中的卷積計算從空間域轉換為頻率域,在準確度只有輕微下降的前提下,預測速度大幅度提升、模型消耗的存儲大幅度降低。該方法極具創(chuàng)新性和實用性。
深度卷積神經(jīng)網(wǎng)絡壓縮這個課題非常具有應用前景,因為深度學習模型在大多數(shù)任務(例如圖像識別、圖像超分辨率等)上的精度已經(jīng)達到了落地需求,但是它們的線上速度和內(nèi)存消耗還沒有達到落地需求。
然而,越來越多的實際應用需要用到這些深度學習模型,例如手機、智能攝像頭、無人車等。所以如何設計更輕便、更高精度的深度神經(jīng)網(wǎng)絡仍舊是一個亟需解決的問題。
雷鋒網(wǎng)報道
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。