0
本文作者: 宗仁 | 2016-10-11 21:08 | 專題:IROS 2016 | 見證機器人領(lǐng)域最頂級的國際會議 |
宗仁,教頭聯(lián)合編輯。
很多人一直對百度相關(guān)研究院具體在開展什么業(yè)務(wù)很好奇,今天下午在IROS 2016的Grand Ballroom,百度IDL負責(zé)人林元慶從業(yè)務(wù)視角為我們詳細剖析了AI在百度業(yè)務(wù)中的運用。
首先,林元慶為我們介紹了以吳恩達為首的百度相關(guān)研究院的內(nèi)部分工情況,其中,Adam Coates負責(zé)硅谷的AI實驗室,林元慶本人負責(zé)IDL實驗室,Wei Fan則負責(zé)的大數(shù)據(jù)實驗室。
下面先講一下百度大腦里的AI技術(shù),除了我們熟知的語音識別,計算機視覺,NLP之外,還有更進一層的基于AI技術(shù)的推薦,預(yù)測;控制,運動以及決策,規(guī)劃,一共6個大的研究方向。
自從GPU以“洪荒之力” 登上舞臺,基于它計算力的平臺架構(gòu)也越來越豐富。。
百度AI層就是從底層平臺開始,一層一層往上疊加。主要包括3層。
最底層的機器學(xué)習(xí)平臺-PaddlePaddle深度學(xué)習(xí)平臺
AI基礎(chǔ)技術(shù)的應(yīng)用-語音識別,計算機視覺,NLP,決策/規(guī)劃,運動/控制,推薦/預(yù)測
AI終端層應(yīng)用-通過語音搜索,視頻分析,生物工程, 貼片廣告,人機交互,機器翻譯,自動駕駛。
據(jù)林元慶介紹,百度IDL在做大約十個方向的研究,包括PaddlePaddle深度學(xué)習(xí)開源框架、圖片搜索、底層圖像識別技術(shù)、人臉識別、OCR(光學(xué)字符識別)、視頻分析、learning robot、有細密紋理的圖片識別、AR以及醫(yī)療影像識別。
如今百度的IDL重點研究和應(yīng)用領(lǐng)域還是在圖形圖像方向,但視頻識別和醫(yī)療影響識別是最近開始涉足的新領(lǐng)域,借助視頻識別技術(shù)的發(fā)展,汽車在路上行駛時對周遭環(huán)境會更加靈敏。另外,根據(jù)林元慶現(xiàn)場透露,到今年底百度IDL的人員會增加一倍(北京,深圳,硅谷三地都設(shè)有辦公室)。林元慶去年年底上任百度IDL負責(zé)人,這些變動都是他上任之后產(chǎn)生的。
林元慶在擔(dān)任百度IDL實驗室負責(zé)人之前,是NEC Labs America媒體分析部門負責(zé)人,其主攻的兩個研究方向分別是大規(guī)模細粒度圖像識別和自動駕駛視覺感知。從他現(xiàn)在IDL做的十余個方向中,我們到處可以看到其擅長的大規(guī)模細粒度圖像識別在各個場景中的應(yīng)用,現(xiàn)在我們已經(jīng)看到了IDL跟之前的細微變化,期待后面有更多不一樣的東西。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。