0
本文作者: 奕欣 | 2017-06-30 15:45 | 專題:GAIR 2017 |
由中國計算機學(xué)會(CCF)主辦、雷鋒網(wǎng) (公眾號:雷鋒網(wǎng)) 與香港中文大學(xué)(深圳)全程承辦的 AI 盛會 --「全球人工智能與機器人峰會」(CCF-GAIR),將于 7.7-7.9 日在深圳召開。
CCF-GAIR 為國內(nèi)外學(xué)術(shù)、業(yè)界專家提供一個廣闊交流的平臺,既在宏觀上把握全球人工智能趨勢脈搏,也深入探討人工智能在每一個垂直領(lǐng)域的應(yīng)用實踐細節(jié)。
縱觀國內(nèi) AI 創(chuàng)業(yè)公司,曠視科技無疑是不能被忽略的一家明星企業(yè)。在今年的 CCF-GAIR 大會上,曠視科技的首席科學(xué)家孫劍也將來到 7 月 7 日的大會現(xiàn)場,圍繞「AI 產(chǎn)業(yè)前沿」分享 Face++的研發(fā)成果。
今年 7 月恰逢孫劍加入曠視科技一年。去年此時,曠視科技聘請孫劍為首席科學(xué)家的新聞依然歷歷在目,雷鋒網(wǎng)也做過詳細的覆蓋與報道。
孫劍在西安交通大學(xué)度過了十年求學(xué)時光,先后拿到了學(xué)士、碩士和博士學(xué)位,主要的研究方向是計算機圖像、人臉識別及基于圖像的深度識別。
2003 年一畢業(yè),孫劍就加入了微軟研究院,這一呆就是 13 年,主要從事計算機視覺及圖像的研究,并進行基礎(chǔ)研究問題的研究與實際應(yīng)用問題的解決。
自 2002 年以來,他在 CVPR, ICCV, SIGGRAPH, PAMI 等頂級學(xué)術(shù)會議和期刊上發(fā)表學(xué)術(shù)論文 100 余篇,兩次獲得 CVPR 最佳論文獎 (2009, 2016)。他于 2010 年被美國權(quán)威技術(shù)期刊 MIT Technology Review 評選為「全球 35 歲以下杰出青年創(chuàng)新者」。
孫劍博士帶領(lǐng)的團隊于 2015 年獲得圖像識別國際大賽五項冠軍(ImageNet 分類,檢測和定位,MS COCO 檢測和分割),其團隊開發(fā)出來的「深度殘差網(wǎng)絡(luò)」和「基于區(qū)域的快速物體檢測」技術(shù)已經(jīng)被廣泛應(yīng)用在學(xué)術(shù)和工業(yè)界。孫劍博士擁有四十余項國際或美國專利,其團隊的研究成果也廣泛被應(yīng)用在微軟 Windows, Office, Bing, Azure, Surface, Xbox 等多條產(chǎn)品線上。
而在去年,作為微軟研究院首席科學(xué)家的孫劍加入了曠視科技。他曾經(jīng)在自述文章《創(chuàng)業(yè)公司里的研究之美》中寫道,兩家公司「研發(fā)部門的本質(zhì)幾乎沒有差別」。
何為研發(fā)部門的本質(zhì)?孫劍認為有三大要素極為關(guān)鍵,即使命定位、人員組成和研發(fā)方式。
1)同樣有著既基于產(chǎn)品,又探索前沿技術(shù)的使命定位;
2)同樣聚集著一群追求極致,有 Geek 精神,且高自我驅(qū)動的精英;
3)用同樣的套路推進研究工作:確定問題-->實現(xiàn)、研究和理解既有方法-->進行持續(xù)改進或創(chuàng)新。
成立于 2011 年 10 月的曠視可以說是人工智能創(chuàng)業(yè)企業(yè)中最早一批研究并應(yīng)用深度學(xué)習(xí)的公司,在 2012 年 8 月便上線了 Face++人臉識別云平臺,并先后獲得聯(lián)想之星、創(chuàng)新工場、啟明創(chuàng)投、建銀國際融資,并與阿里巴巴達成戰(zhàn)略合作,目前已為全球范圍內(nèi) 2.1 億人完成在線身份驗證服務(wù)。
或許是被同樣的理念及領(lǐng)先的研發(fā)水平所吸引,孫劍從原本研發(fā)資源雄厚的微軟加入曠視科技的舉動也顯得自然而合理。雖然孫劍曾經(jīng)自嘲自己老了,因為來到曠視之后,年輕的同事問他為何要把手機字體調(diào)得那么大;但至少從目前來看,孫劍加入曠視,依然與在微軟時一樣,從事著他所擅長且喜歡的工作。
如果要用一句話來回答孫劍加入曠視的日常工作,不如引用他在微軟亞洲研究院召開的「讓世界充滿 AI-人工智能研討會」上所做的報告《通向視覺智能之路》所說的話:「我在 Face++ 做的核心技術(shù)研究與我在微軟時做的方向一致:圖像分類、物體檢測、語義分割和序列學(xué)習(xí)?!?/p>
曠視所研究的技術(shù)路線可以算得上是非常徹底的深度學(xué)習(xí),主要體現(xiàn)在兩個方面,一是采用深度神經(jīng)網(wǎng)絡(luò),第二點是最大程度地使用端到端學(xué)習(xí)。目前解決這個問題的主流方法是遞歸神經(jīng)網(wǎng)絡(luò)(RNN),也是現(xiàn)在在語音識別和自然語言處理中的大殺器。由于人的智能本質(zhì)是在實時的「處理」連續(xù)不斷感知到的信號流,這使得序列學(xué)習(xí)成為當(dāng)下的最熱的研究方向之一。同樣地,曠視科技的研究團隊也正在利用 RNN 進行深挖,希望在計算機視覺領(lǐng)域有更大的突破。
作為曠視首席科學(xué)家,孫劍博士正在帶領(lǐng)曠視科技的研究團隊推進計算機視覺技術(shù)的進步和探索其在工業(yè)和商業(yè)上的實踐。目前,曠視的人工智能云開放平臺的 API 已經(jīng)服務(wù)了近 10 萬開發(fā)者;曠視的 FaceID 產(chǎn)品在全球范圍內(nèi)已為 2.1 億人提供了身份驗證服務(wù),覆蓋了 80% 的金融市場智能化應(yīng)用,同時其智慧安防和智能地產(chǎn)產(chǎn)品也已經(jīng)覆蓋全國 25 個省份。
孫劍曾在演講中表示,他現(xiàn)在有著「無比的自信」,能夠和 Face++的研發(fā)團隊一起,在這個最好的時代,做出更好的成績,追求研究之美。而在 7 月 7 日 CCF-GAIR 大會的人工智能前沿專場上,孫劍博士將代表曠視科技來到大會現(xiàn)場并做主題演講,闡述他在曠視所做的研究工作。不知道他在大會現(xiàn)場,又會有哪些真知灼見要分享呢?
如果您也想來到現(xiàn)場一睹孫劍博士的演講風(fēng)采,歡迎搶購 CCF-GAIR 大會的門票。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章