丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給谷磊
發(fā)送

1

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

本文作者: 谷磊 2017-04-13 16:45
導(dǎo)語(yǔ):百度研究院院長(zhǎng)、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室主任林元慶做了“最強(qiáng)大腦背后的技術(shù)”主題演講,詳細(xì)解釋了小度在“腦王”對(duì)決中的臺(tái)前幕后

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

雷鋒網(wǎng)按:近日,《最強(qiáng)大腦》第四季落下帷幕,憑借在人臉識(shí)別和圖像檢索方面的出色表現(xiàn),百度人工智能機(jī)器人小度榮獲“腦王” 稱號(hào)。4月11日,百度以此為主題在北京舉辦了“第五屆百度技術(shù)開(kāi)放日”的活動(dòng)。百度研究院院長(zhǎng)、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程實(shí)驗(yàn)室主任林元慶做了“最強(qiáng)大腦背后的技術(shù)”主題演講,詳細(xì)解釋了小度在“腦王”對(duì)決中的臺(tái)前幕后,涉及圖像檢索、聲紋識(shí)別、人臉識(shí)別等方向。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

隨后林元慶還介紹了百度將在人工智能方面著重發(fā)力的方向及下一步的計(jì)劃,雷鋒網(wǎng)總結(jié)如下:

  • 將圖像識(shí)別技術(shù)做到極致

  • 完善聲紋識(shí)別技術(shù)

  • 視頻的分析:像素級(jí)別的圖像分割

  • 醫(yī)療圖像分析

  • 開(kāi)放深度學(xué)習(xí)平臺(tái)

  • 產(chǎn)學(xué)研融合共建七大平臺(tái)

林元慶提到:

從去年開(kāi)始,Robin(李彥宏)一直在講,作為目前最重要的戰(zhàn)略,百度的下一幕是人工智能?,F(xiàn)在百度在人工智能方面的投入在持續(xù)的增加,過(guò)去兩年每年都投入了超過(guò)100億,我們希望做好這個(gè)方面。

以下是林元慶的演講實(shí)錄,雷鋒網(wǎng)做了不改變?cè)獾恼恚?/strong>

今天就從最強(qiáng)大腦說(shuō)起吧,也會(huì)給大家展示一些百度的其他技術(shù),隨后劉煬團(tuán)隊(duì)說(shuō)的更系統(tǒng)、更全面一些,就是跟開(kāi)發(fā)者生態(tài)有關(guān)的,百度有哪些技術(shù)在往外面開(kāi)放的。

最強(qiáng)大腦背后的技術(shù)

讓我們先來(lái)回顧一下與最強(qiáng)大腦的合作歷程:之前節(jié)目組找過(guò)一些國(guó)內(nèi)的公司,已經(jīng)得到非常多的驗(yàn)證,后來(lái)聽(tīng)說(shuō)百度也在做人臉識(shí)別才找過(guò)來(lái)。我就問(wèn)節(jié)目組為什么不先找我們?他們表示以前根本就不知道百度也做人臉識(shí)別,這一度令我非常驚訝。

不過(guò)對(duì)于百度來(lái)說(shuō),這樣的合作也是一個(gè)契機(jī)。一方面希望我們的技術(shù)能夠讓大家都知道,一方面參加《最強(qiáng)大腦》的初衷是希望我們的技術(shù)跟最強(qiáng)的人類去比,看看百度大腦到底在什么樣的水平上。我們是抱著輸贏不是那么重要的心態(tài)去比賽的。我們內(nèi)部開(kāi)玩笑說(shuō),如果輸了的話,我們回去還得繼續(xù)做研發(fā),如果贏了的話,我們還得回去做研發(fā),只是希望我們真正把技術(shù)到極限,能夠更好的服務(wù)到人類。

在節(jié)目中我們做過(guò)的幾個(gè)任務(wù),這里簡(jiǎn)要的回顧一下。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

第一個(gè)是圖像檢索的技術(shù)。左邊的圖像是從右邊30張照片的一張當(dāng)中截取的一小塊,需要找出到底是哪張圖上的。就像以圖搜圖差不多,因?yàn)橐詧D搜圖的圖像質(zhì)量相對(duì)來(lái)說(shuō)還是不錯(cuò)的,另外它是整張圖片去搜,而最強(qiáng)大腦節(jié)目組希望看看現(xiàn)在我們的技術(shù)極限到底在哪,就將照片做了老化、破損處理,所以這就比現(xiàn)在百度的以圖搜圖在技術(shù)實(shí)現(xiàn)上還要難。

這背后我們也是使用了深度學(xué)習(xí)的方法,它能夠很好的處理模糊、噪聲、甚至是不同的圖像角度。現(xiàn)在我們能夠索引百億級(jí)別的照片,可以在1s之內(nèi)返回結(jié)果。這個(gè)技術(shù)也就幾家有自主知識(shí)產(chǎn)權(quán)的搜索引擎在大規(guī)模的做。

剛才提到的是最新研發(fā)的技術(shù),應(yīng)該是接下來(lái)幾個(gè)月吧,我們會(huì)用到新的引擎里面,到時(shí)現(xiàn)有的服務(wù)會(huì)有一個(gè)非常大的升級(jí)。 

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

第二個(gè)是聲紋識(shí)別。它和語(yǔ)音識(shí)別不太一樣。語(yǔ)音識(shí)別是要識(shí)別出說(shuō)了什么,而聲紋識(shí)別是要識(shí)別出誰(shuí)在說(shuō)話,說(shuō)話的內(nèi)容不同會(huì)對(duì)聲紋識(shí)別準(zhǔn)確性有非常大的干擾。咱們?nèi)祟悓?duì)聲音的噪聲不是很敏感,做聲音處理專業(yè)的人都知道,聲音是信噪比非常差的,因此聲紋識(shí)別其實(shí)是很有挑戰(zhàn)性的。

現(xiàn)在百度非常重視基于AI的交互,比如現(xiàn)在我們有鼠標(biāo)鍵盤,手機(jī)上的觸摸屏等交互方式,我們更希望下一代是基于語(yǔ)音圖像或者AI非常自然的交互,特別是語(yǔ)音的,你們?nèi)绻嘘P(guān)注百度,也知道百度投入非常大的力量,在做Duer OS,我們內(nèi)部把它叫OS,因?yàn)橄襁@些基于語(yǔ)音質(zhì)量交互的情況,語(yǔ)音已經(jīng)是一個(gè)存在的信號(hào),如果我們能利用那個(gè)信號(hào)的話,能夠識(shí)別說(shuō)話的人是誰(shuí),這是非常有用的。因此在這塊我們后續(xù)也在繼續(xù)加大投入,技術(shù)上已經(jīng)取得了一些突破,最后我們希望把聲紋做的跟人臉識(shí)別那樣高的精度。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

第三個(gè)是人臉識(shí)別。在最強(qiáng)大腦節(jié)目中一個(gè)是跨年齡的人臉識(shí)別,一個(gè)是跨代的人臉識(shí)別。人臉識(shí)別是由檢測(cè)和識(shí)別兩個(gè)技術(shù)組成。檢測(cè)是給出一張照片我們能檢測(cè)出人在哪里,同時(shí)還能找出像鼻子眼睛嘴巴這樣的關(guān)鍵點(diǎn)在哪里。這個(gè)我們可以很自信的說(shuō)沒(méi)有人能做的比我們更好。

很多時(shí)候我們所說(shuō)的識(shí)別精度都是針對(duì)測(cè)試集說(shuō)的,2015年年底的時(shí)候,我們搞了一個(gè)比較大的數(shù)據(jù)集,把一些相對(duì)來(lái)說(shuō)簡(jiǎn)單一些的圖片去掉,用了我們當(dāng)時(shí)所能的達(dá)到最好的算法,在這個(gè)測(cè)試集上僅能做到92%的準(zhǔn)確率。后來(lái)在2016年的百度云計(jì)算大會(huì)前,我們對(duì)它的數(shù)據(jù)和算法都進(jìn)行了很大的迭代,錯(cuò)誤率從8%降低到了2.3%,那已經(jīng)是非常大的提高了?,F(xiàn)在的錯(cuò)誤率已經(jīng)低于1%了。

百度在 AI 領(lǐng)域的布局

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

百度現(xiàn)在在很多人工智能領(lǐng)域同時(shí)在發(fā)力,百度人工智能的核心就是百度大腦,它有四大類的應(yīng)用:

  • 語(yǔ)音

  • 圖像

  • 自然語(yǔ)言處理

  • 用戶畫像

下面這張圖可以更加形象的說(shuō)明百度在人工智能上的布局,中間這層人工智能基礎(chǔ)技術(shù)就類似于上面說(shuō)到的百度大腦,它們都是基于下面機(jī)器學(xué)習(xí)的平臺(tái)做的研發(fā)。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

在人工智能的研發(fā)上,有一個(gè)從數(shù)據(jù)-->技術(shù)-->產(chǎn)品-->用戶-->數(shù)據(jù)的閉環(huán),如果閉環(huán)產(chǎn)生的話,技術(shù)就能夠發(fā)展的非??臁,F(xiàn)在百度在人工智能方面,哪些做哪些不做,就是看能否產(chǎn)生很強(qiáng)的閉環(huán)。

在通用圖像技術(shù)方面,大家所熟知的ImageNet是1000個(gè)類150萬(wàn)張照片,而我們?cè)?jīng)做過(guò)的一個(gè)庫(kù)就已經(jīng)有4萬(wàn)類7000萬(wàn)張照片,目前我們正在做的有11萬(wàn)類,我們希望將圖像識(shí)別真正做到極致。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

同時(shí)我們要建深度學(xué)習(xí)、聽(tīng)覺(jué)、生物特征識(shí)別、視覺(jué)感知、新型人機(jī)交互、知識(shí)產(chǎn)權(quán)、標(biāo)準(zhǔn)化服務(wù)等七大平臺(tái)。這七大平臺(tái)百度都要建,其中聽(tīng)覺(jué)和生物特征識(shí)別是和清華大學(xué)共建,視覺(jué)感知和新型人機(jī)交互是和北航共建的,知識(shí)產(chǎn)權(quán)和標(biāo)準(zhǔn)化服務(wù)和電信研究院共建。這些建設(shè)完成后都會(huì)向外部開(kāi)放。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

深度學(xué)習(xí)平臺(tái)方面,現(xiàn)在PaddlePaddle已經(jīng)開(kāi)源了,但是還不夠。第一步,我們要做一些針對(duì)PaddlePaddle的教程,下一步,國(guó)家工程實(shí)驗(yàn)室在建設(shè)一些機(jī)房,屆時(shí)我們將開(kāi)放一些機(jī)器,用戶只需要一個(gè)賬號(hào),就可以使用這些計(jì)算資源。

下面的一些應(yīng)用是百度已經(jīng)比較成熟的技術(shù),我們做好后也將對(duì)外部開(kāi)放,當(dāng)然現(xiàn)在已經(jīng)開(kāi)放了很多了,包括圖像、語(yǔ)音、自然語(yǔ)言處理等。

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

現(xiàn)在百度還有一個(gè)正在進(jìn)行的項(xiàng)目就是視頻的分析,主要分為兩個(gè)方向。一個(gè)是語(yǔ)義理解,就像現(xiàn)在非常火的短視頻,我們需要理解視頻里面到底發(fā)生了什么。另一個(gè)方向是low level 的環(huán)境理解,即根據(jù)視頻我們能夠精確的估計(jì)出攝像頭在環(huán)境中的坐標(biāo)和朝向。這是三維重建非常重要的一步,我們希望結(jié)合深度學(xué)習(xí),使其達(dá)到像素級(jí)別的圖像分割。

比如自動(dòng)駕駛的場(chǎng)景,視頻中的房子、車、人、路面、天空等區(qū)域我們希望以像素為單位將其識(shí)別出來(lái),這個(gè)現(xiàn)在百度正在做,我們希望能夠達(dá)到99%以上的精度。這是非常難的一個(gè)方向,但是如果能夠攻克的話,對(duì)很多應(yīng)用的影響都會(huì)是非常大的,特別是無(wú)人駕駛、AR。現(xiàn)在百度在這方面正在籌建一個(gè)很大的團(tuán)隊(duì),致力于解決這方面的問(wèn)題。

還有一個(gè)是醫(yī)療圖像分析的項(xiàng)目,百度正在花很大的力氣去做,我們也希望將其做成一個(gè)很大的方向。

AI是個(gè)新的電能,希望AI能夠像電一樣,影響各個(gè)行業(yè),實(shí)現(xiàn)各個(gè)行業(yè)的升級(jí)。

從去年開(kāi)始,Robin(李彥宏)一直在講,作為目前最重要的戰(zhàn)略,百度的下一幕是人工智能。現(xiàn)在百度在人工智能方面的投入在持續(xù)的增加,目前百度科研與營(yíng)收比為15%,這是非常高的,過(guò)去兩年每年都投入了超過(guò)100億,我們真的希望做好這個(gè)方面。

我的介紹就這些了,謝謝大家。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

百度研究院院長(zhǎng)林元慶:解讀《最強(qiáng)大腦》背后的技術(shù)

分享:
相關(guān)文章

編輯

專注報(bào)道人工智能。微信:ydxy301
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄