0
本文作者: 劉芳平 | 2017-02-22 21:13 |
雷鋒網(wǎng)按:21日,《麻省理工科技評論》發(fā)布全球十大突破性技術榜單,百度以人臉識別技術獲得提名。百度深度學習實驗室主任林元慶會后舉行了一場媒體溝通會,詳細闡述了百度在人工智能,特別是人臉識別方面的技術突破和應用落地,并透露了百度國家級人工智能實驗室的部分計劃。雷鋒網(wǎng)對溝通會內(nèi)容進行了整理。
其實人臉識別在2016年還是非常突破性的,中國有很多公司,包括百度,也花了非常大的研發(fā)的力量和市場推廣在人臉識別上面。2016年我們看到技術報告和市場報告很多,技術上的一個標志性事件就是通過2016年的技術積累,2017年年初的時候百度大腦在在《最強大腦》第一期贏了。人臉識別技術甚至在一些極端的情況下,我們能做得比最優(yōu)秀的人更好,之前是沒有過這樣的實驗,從科學的角度來看,這是第一次有這么一個實驗。
應用的話,我們2016年在百度已經(jīng)開始落地非常多的人臉識別相關的應用,特別是我們?nèi)ツ暝诟呔鹊?:N的人臉識別上,我們的系統(tǒng)是確實扎扎實實的是行業(yè)首創(chuàng)。如果有媒體朋友最近去百度,能體驗到我們百度員工刷臉進樓,我們在百度科技園跟百度大廈大部分員工已經(jīng)注冊了,已經(jīng)一萬多人,應該很快會到五萬人,百度全體員工會注冊。這個就是我拿一張人臉,要跟庫里的一萬多人去比較,這個技術比傳統(tǒng)上的銀行用的1:1的人臉識別要難很多。
百度這種系統(tǒng)基本上需要做到接近于0的誤過率,簡單來說就是,不是百度的人,一定不能讓他進。這個要求非常嚴格。比如這里站了一個保安,你得跟他說,你要非常嚴格,不是百度的人千萬不能讓他進?,F(xiàn)在這個系統(tǒng)實際里面大家都感覺確實非常成熟,我們的技術已經(jīng)能做到非常好的識別。是就是,不是就不是。這個還是做得非常好。
其實這個系統(tǒng)就是因為過去這幾年,特別是去年,我們在人臉識別上取得非常大的技術的突破。今年應該至少會有一百個以上的4A、5A的景區(qū)啟用百度的人臉識別系統(tǒng),這是已經(jīng)在談的,我們在非常積極的推進這個事情。這也是同樣的。不要再刷身份證了,你只要注冊完之后,就可以直接往里面走,是1:N的人臉識別。
這個技術我們確實是行業(yè)首創(chuàng),我們能做到刷臉,不用再掏證件了。掏證件是我要看你是誰,我從庫里取完照片,再看是不是這個人。我們能做到1:N的人臉識別。我們已經(jīng)運營了半年左右的烏鎮(zhèn)的進出西柵景區(qū)的人臉識別系統(tǒng),也都是1:N的人臉識別。
今天來MIT Technology Review,公布十大突破技術的時候,我們還是蠻興奮的,因為刷臉是其中的一個,基本上這個技術都是中國的公司做的,包括百度、face++,他們其實沒有提到,中國還有好多家初創(chuàng)公司在做人臉識別,這些都是非常優(yōu)秀的公司。我們也非常高興,覺得十大突破技術,基本上全部是中國公司產(chǎn)生的技術。
我還想提醒一下大家,去年百度的語音識別,同樣入選了MIT十大突破技術。從2016年來看,語音識別技術確實在百度里面取得非常大的商業(yè)化的發(fā)展,比如說最近成立的度秘事業(yè)部,語音交互變成了一個非常非常重要的領域。今年是人臉識別。我們希望到了明年,再回頭看,能有非常好的商業(yè)化,希望技術能夠真正改變大家的生活。
刷臉為什么這么重要呢?其實不單單是刷臉支付,應該是負責廣義上的刷臉,或者身份認證,其實是涉及到生活的方方面面。包括我們互聯(lián)網(wǎng)上的各種活動,特別是互聯(lián)網(wǎng)金融,包括銀行、保險,有很多很多的都會涉及到身份認證的問題。首先你要知道這個款是貸給誰的,包括進出景區(qū),你去旅游,慢慢的也會在中國變得非常普及。今年至少有一百家以上的TOP景區(qū)可以刷臉進景區(qū)。
大家也看到很多報道,比如火車站、機場,現(xiàn)在也在非常積極的跟我們合作,希望以后這些場所的身份認證變得無形,這才是最理想的。剛才有嘉賓說,支付的最高境界就是不要支付。以后身份認證的最高境界就是不要認證,你直接走就可以了。百度也在非常積極的跟手機廠商合作,要落地各個方面人臉識別的技術。因為百度的判斷是,我們覺得我們很多的人臉識別技術,在手機上是非常好的應用場景。我們現(xiàn)在跟國內(nèi)主流的手機廠商也合作,我們希望把我們的人臉識別能夠落到手機上,未來就像指紋一樣是開機密碼,指紋已經(jīng)做得很成功了,但是指紋安全性也算比較低的,人臉安全性要高很多。
大家如果注意到,像《最強大腦》第二期是聲紋識別,像我們做的身份認證,會是一整套的解決方案,有聲紋識別、人臉識別,甚至更多的信息,我們希望把身份認證做得非常好。我大概就講這些。大家如果有問題,可以隨意討論。
以下為林元慶媒體溝通會的Q&A環(huán)節(jié),雷鋒網(wǎng)做了不改變原意的整理。
問:商業(yè)化今年有沒有收入上面的KPI?大概能達到什么等級?
林元慶:現(xiàn)在人臉識別的主要的工作,包括它的商業(yè)化,我們其實沒有一定要做到多少。百度的話,KPI也是有的,但我們更多時候還是focus在過程、產(chǎn)品支持。人臉識別我們沒有說我們一定要收入多少,我們還是更看重過程,看過程怎么做。比如商業(yè)化方向,我們是怎么布局的,最后能做到什么樣子。其實很多技術都在探索,定高了很難實現(xiàn),定低了還是覺得很容易的。像我們這種部門,是非常少直接用KPI的。
問:現(xiàn)在百度的人臉識別技術,有沒有一個計劃,怎么跟百度內(nèi)部做一個落地的結合?
林元慶:人臉識別的商業(yè)化,我們內(nèi)部定了四個大方向。
第一個是閘機的情況,就是1:N的高精度識別。因為跟市場上的競爭者相比,我們確實是有非常獨特的優(yōu)勢的地方。技術的壁壘非常高。我們要落地到景區(qū),還會落地到百度這樣的大企業(yè)、寫字樓,這是第一個方向,1:N的人臉閘機。
第二個大方向是交通,簡單來說交通就是鐵路、機場。
第三個大方向是銀行,銀行是百度非??粗氐模俣冉鹑诜帐聵I(yè)部群組的消費金融服務就在使用?,F(xiàn)在很多的現(xiàn)金貸、遠程的身份認證也已經(jīng)應用了我們的人臉識別技術。其實還有很多,包括百度錢包等等很多業(yè)務都上線了?,F(xiàn)在身份認證在金融的第一個應用,內(nèi)部迭代就是在百度金融,還有泰康、銀行等等,像泰康身份認證已經(jīng)上線了,評價非常高。還有很多客戶,金融從場景來看可能是最重要的。
第四個大方向是手機,這跟老百姓的生活非常密切相關。我們跟手機廠商在合作,具體的產(chǎn)品形態(tài)現(xiàn)在還不知道
這四個方向基本上都是非常互聯(lián)網(wǎng)化的??赡芎芏嗤瑢W一提人臉識別,就提到安防,但是我們更多聚焦在互聯(lián)網(wǎng)相關的方向上,包括出行也是與互聯(lián)網(wǎng)非常相關的。
這是我們現(xiàn)在想的四個大方向,以后可能會變,我們在這四個大方向在非常大的發(fā)力,并不是說只做這四個大方向,其他不做,我們還是要服務于需求。
問:最近在國際人工智能大會AAAI上,包括谷歌在內(nèi)的一些大佬提出了這樣的觀點:關于人工智能在業(yè)界的實踐,從實際應用的角度來看,關鍵性的應用幾乎不允許發(fā)生錯誤,一旦發(fā)生故障,可能造成人員和財產(chǎn)損失。所以對整體的系統(tǒng),包括硬件和軟件的可靠性要求非常高,實現(xiàn)的難度也會越來越大。所以如果把這個問題套用到人臉識別技術上,要特別注意的事項是什么?您可不可以舉例來回答這個問題?
林元慶:你說得非常對,現(xiàn)在很多機器學習的模型都是基于統(tǒng)計的,因此有時候會出錯,這是難免的。因此要不斷地去提高系統(tǒng)的精度。
人臉識別,我舉一個例子,比如我們現(xiàn)在裝在百度的人臉閘機系統(tǒng)。半年之前,就開始了兩條線,先試。剛開始問題挺多的,比如說識別的精度、對光線的影響等等很多方面,甚至有很多機制,還發(fā)生了不是百度的人,結果放進去了的情況。只要發(fā)生一個case,行政就找到我們,說這樣不行,不是百度的人進來,有明顯的安全隱患。在那之后,我們花了非常大的力氣調(diào)我們的系統(tǒng)?,F(xiàn)在我們這個系統(tǒng)非常非常精準,不是百度的人,是絕對進不去的,在一些應用的特別指標上會非常非常嚴格。其實我們是非常喜歡這樣的應用的,要有一定的技術門檻才能做得好。像這種情況,其實是沒有選擇的,必須沉下心來,把技術做好。
有一些系統(tǒng)上,包括自動駕駛,還包括銀行的應用,比如我們的身份認證,絕對不是只靠一個人臉,還要做很重要的活體識別等各方面,可能還會用到大數(shù)據(jù),甚至用聲紋識別,用多模態(tài)的,來保證這個識別非??煽?。這些方面都需要每個方面的機構一起做得特別好。
2008年世博會的時候,就聽說過可以人臉閘機,刷臉進世博會了,但是現(xiàn)在很多地方都不能刷臉進園區(qū)。比如去古北水鎮(zhèn),古北水鎮(zhèn)就是刷指紋的。我們上次去參加一個會議,一百多人,進門的時候就一個多小時,因為按指紋挺麻煩的,還要查身份證。十年之前就已經(jīng)在說人臉識別了,為什么現(xiàn)在古北水鎮(zhèn)很高端的景區(qū)還是沒有應用?人工智能很多技術,其實做一套系統(tǒng)很容易,但是要做一套真的是很多人都在用的系統(tǒng),這個本身就是有非常高的技術門檻。
問:您剛才提到了人臉識別百度這邊有四個大的落地方向,李彥宏提到互聯(lián)網(wǎng)時代,軟硬件結合是明顯的趨勢,主要講人臉識別,再加上比如圖像、語音等相關的人工智能,都結合在一起來看,您覺得現(xiàn)在還有哪些應用空間是待開發(fā)的?包括百度在這方面哪些打算在內(nèi)部有一些應用,在外部是怎么打算通過一些合作的方式落地到不同的行業(yè)?
林元慶:我先提一下軟硬結合。剛才我們提到人臉識別,進景區(qū)的閘機,其實我們也需要在硬件上一體化的來做優(yōu)化,比如說很多景區(qū)可能到了下午陽光就非常曬,攝像頭會受影響,我們能不能開發(fā)出來足夠好的攝像頭,把主要的曝光集中在人臉上。現(xiàn)在人工智能技術很多要落地的話,很多的系統(tǒng)都需要考慮軟硬結合,把性能給真正的發(fā)揮出來。
你們可能聽說過,百度原來覺得不需要做硬件,也盡量不做硬件,但是現(xiàn)在我們其實挺強調(diào)軟硬結合的。因為這也是應用驅(qū)動的,我們也不是一成不變的。像人工智能這些,特別是我們提供最后的解決方案,像智能駕駛,很多硬件的東西肯定是需要進來一起優(yōu)化的。在新的條件下,軟硬結合是人工智能時代應該要做的事情。
你剛才提到百度除人臉識別以外的技術,人工智能技術能夠發(fā)揮非常好的效應,非常重要在于它能夠進到某個行業(yè)、提升某個行業(yè)、升級某個行業(yè)。在百度已經(jīng)做得比較成功的是人工智能去升級搜索、人工智能去升級金融行業(yè),比如我剛才提的身份認證,互聯(lián)網(wǎng)金融。還有一個是百度現(xiàn)在正在布局的是智能駕駛行業(yè),不只是一個單個的模塊進去,而希望是一整套的,甚至是幾百人的,非常大的團隊投入進去。
我們很多時候看的更多是這樣子的人工智能應用,比如我們最近投入比較大的力量在做的,用人工智能來升級旅游行業(yè)。我們希望人工智能會是一條線,把很多跟旅游有關的東西串起來,從買票開始,就提交了人臉,到了景區(qū)直接刷人臉閘機就進了景區(qū),進了景區(qū)之后你可能需要地圖導航,就為你提供景區(qū)內(nèi)的地圖導航?,F(xiàn)在地圖這塊,戶外地圖大家都做得還不錯,但景區(qū)里面是百度做得最好(其實我們說做得最好還是比較初級的,還有很多景區(qū)沒有cover,或者cover不夠好)。智能導航、智能導游還能做什么,比如進了景區(qū),你需要問洗手間在哪,你可以打開地圖直接問;比如去爬香山,你想知道到底哪條路可以到香山,你可以問;你看到一個牌匾,覺得非常有意思,你可以拍照,可以搜索,這個牌匾是康熙提的,康熙到底在什么時候提的……你都上網(wǎng)去問,它把信息告訴你,而且可以把搜到的信息讀給你。再比如到了景區(qū),中午想吃飯了,我們還可以為你打開糯米,并希望糯米能夠知道你喜歡吃哪一樣菜,我們可以給你做菜品級別的搜索,而不是餐館級別的,這方面百度也花了非常大的力量,從2016年就開始在做了。隨便舉個例子,比如你最喜歡的是剁椒魚頭,我可以告訴你在景區(qū)方圓五公里之內(nèi),剁椒魚頭哪一家做得最好,甚至還可以地圖給你導到那里。這都是可以一條線、一條龍的幫你實現(xiàn)。
我剛才舉的這些例子,其實是我們實實在在在跟旅游部門合作,我們希望有非常好的落地。這樣子的話,大家的生活就很智能。很多人都要用到地圖、語音識別,還有大數(shù)據(jù),我把很多很多都打包起來為你服務。就像李彥宏提到的連接服務,我們希望用人工智能做到非常好的連接服務。
問:主要目前聚焦在跟互聯(lián)網(wǎng)密切相關的,百度之所以在人臉識別相關的落地聚焦在互聯(lián)網(wǎng)相關,而不是說有一些會到安防或者一些傳統(tǒng)行業(yè),原因是什么?
林元慶:還是同樣的理念。我們很希望人工智能技術真的能夠落地,去提高老百姓的生活。這是我們的立意之所在。我們?nèi)四樧R別服務,首先要做的就是看看我們的技術能不能提高大家的生活水平和質(zhì)量,有一些是需要論證,讓這個東西變得很容易,比如出去玩,會涉及到交通,還有銀行,還有我每天都在用的手機……我們希望落在這些產(chǎn)品上,這也是我們的競爭優(yōu)勢之所在。做安防可能也會有,但是應該會非常非常少。
問:您剛才說人臉識別還沒有做到百分之百的準確度、精確度,那能夠做到非常準確可能也不完全百分之百可能,有哪些障礙在阻礙它的精確度?
林元慶:做人工智能的這些業(yè)務,其實非常重要的是需要技術的落地,我記得在一些公開場合也說過,形成閉環(huán)是非常重要的。我們算一個數(shù)據(jù),研發(fā)第一步的技術,做第一代的產(chǎn)品,產(chǎn)品到給用戶,用戶產(chǎn)生數(shù)據(jù),數(shù)據(jù)回來進一步提高技術,提高更多的數(shù)據(jù)、更好的算法……算法并非不變,很多時候算法是和技術是一起發(fā)展的,這才是非常好的正循環(huán),這是非常非常重要的。
在人工智能技術的發(fā)展上,做一個技術,和把這個技術做到極致,是兩個不同的目標。如果只是做一套人臉識別系統(tǒng),那我就只要數(shù)據(jù)算好了,隨便一搭就能出來一套系統(tǒng)。但如果你真的想把這個數(shù)據(jù)做到極致,要做得非常非常好,閉環(huán)是必要的,沒有這個閉環(huán)是做不下去的。
比如百度人臉閘機非常嚴格,偶爾也會有人看身份證或者工卡進去,但由于閘機性能做得比較好,一旦發(fā)生情況,后面的系統(tǒng)立馬就更新,非??彀堰@些情況解決掉。因此這個系統(tǒng)越來越聰明,可能過了一段時間就不會再有任何問題了。
問:這個技術已經(jīng)提了十年了,但是現(xiàn)在很多景區(qū)的閘機還沒有鋪開,阻礙沒有鋪開的原因是什么?
林元慶:還是技術。其實還是蠻難的,你做不到就是做不到。我們當時在烏鎮(zhèn)落地,烏鎮(zhèn)的景區(qū)還不太放心,他們又找了一家,基本上一個地方布了兩臺,差不多一個禮拜那臺就拿走了,技術差別不是一點點。你們?nèi)绻腥蹑?zhèn),可以親身體驗一下,就在西柵景區(qū),去年剛布上去,當時有些媒體報道,也有視頻?,F(xiàn)在是每天都在運行的。烏鎮(zhèn)跟古北水鎮(zhèn)是一個老板,他們非常急切推動我們把相同的系統(tǒng)鋪在古北水鎮(zhèn),現(xiàn)在在推進做更大的系統(tǒng),還沒有徹底落下來。
問:之前春運的時候,刷臉的技術,這個技術沒有用百度的,而是國外的公司,我想問一下為什么沒有用百度的技術?這個技術跟百度的區(qū)別,下一階段能不能做到用我們的技術?
林元慶:其實目前的情況是,鐵道部用了很多家公司的技術,都在上面去試,最后希望看誰的最好。確實,百度是去年在烏鎮(zhèn)才做了第一個商業(yè)化。我們內(nèi)部用得非常好,但是全網(wǎng)的內(nèi)容搜索,落地的,做得確實不夠多。
《最強大腦》的節(jié)目組,他們原來是找的別的公司,我說你們?yōu)槭裁床粊碚野俣?,這個很奇怪,你們難道沒有想到嗎?我說最起碼你得來找一下,看我們有沒有技術。他們節(jié)目說我們根本沒有聽到百度做人臉識別,因為我們在這方面的宣傳還是太少了。因此,鐵路那個現(xiàn)在做的都是1:1的人臉識別,我們肯定能做得很好,這是沒有什么爭議的。只是我們的商業(yè)化在這方面有一點滯后,后面的話我相信百度的技術一定會應用在鐵路平臺上面,只是時間的問題。
問:現(xiàn)在國內(nèi)做人臉識別技術和應用的廠商其實很多,從百度的角度來看,百度的人臉識別的技術和應用有哪些獨到的地方,哪些地方是其他應用和技術所不具備的?
林元慶:剛才有提到了高精度的1:N的人臉識別,能商業(yè)化的布到景區(qū)里,現(xiàn)在應該是沒有別人能做得到。規(guī)模比較大的1:N的識別,N可能是幾萬,或者是說十萬,難度還是比較大。1:N的識別原來是有過的,比如抓罪犯的場景,布一個攝像頭,和十萬的黑名單對比,人走過來,看到這個人跟黑名單里有點像,但后面得讓人再來看一下,因為不能保證這個人就是他。而在我們場景,一個人走過來的時候,我要非常高精度的知道你就是你,他就是他。1:N不是初創(chuàng),但高精度的1:N(N是萬或者十萬的級別),這是初創(chuàng)的,對技術的要求非常高。目前我相信在中國甚至在世界上,也只有我們能做到,因為美國的很多大廠商、大景區(qū)都在找我們,希望用百度的人臉識別系統(tǒng)。如果技術達不到,是很難做到的,就像剛才舉的例子,你也可以去部署一個系統(tǒng),但可能比較難用,所以后來景區(qū)就不用了。
國內(nèi)的初創(chuàng)公司,這幾年也做得很不錯,比如銀行的應用,1:1的人臉識別,他們還是有相當?shù)母偁幜Φ?。但即使這樣情況,我們也會想一些辦法,因為百度是一個互聯(lián)網(wǎng)公司,人臉只是一個點,我們還有很多點可以跟別的公司談合作,這些是我們百度的優(yōu)勢。
技術是很重要的,好幾個月之前,我在微信朋友圈就提出,百度進入人臉識別行業(yè),走的是技術路線。
問:除了1:N的應用方式,那其他的技術上有沒有一些比較獨到之處?
林元慶:其實1:N反映的是在人臉識別上能做到非常高精度,但有一些情況精度做得不夠高,產(chǎn)品也可以用。比如銀行的系統(tǒng),是半自動的,如果識別不好會有人工干預,現(xiàn)在這是一個普遍情況。我們?nèi)プ龅脑挘锌赡苋斯じ深A會非常少,別的公司去做可能需要人工干預多一些。
其實1:N不是說我們憑空就做上來,很深刻的方面就是,我們確實在人臉識別技術上,在它的后端,人臉的特征能夠體現(xiàn)的更好,1:1跟1:N其實是一樣的,但是能做到1:N,就是人臉識別的特征非常好。
問:昨天(2月20日)百度牽頭成立國家級的AI實驗室,是跟高校合作,您正好是負責這一項目的,我想問一下這個項目具體到高校和百度這邊的分工到底是什么樣子的?到您本人這邊,會負責具體的什么內(nèi)容?這是第一次一個企業(yè)和高校,而且是國家發(fā)改委級別的,想聽聽您對這件事的看法。
林元慶:因為是昨天的新聞,我們牽頭的深度學習技術和應用國家工程實驗室,落地在百度。我沒有仔細去查,應該是BAT的唯一一家深度學習國家工程實驗室,我們覺得非常幸運,牽頭單位非常重要,因為是聯(lián)合的,要真正落在那兒,真正follow你的戰(zhàn)略。是我去答辯的,競爭非常激烈,特別是因為百度不是高校,也不是國營單位,我們拿到這個非常感謝國家的信任。我們內(nèi)部也有非常大的計劃,要在這個平臺上做,今天也借這個機會跟媒體朋友說一下。
我們下周四還有一個揭牌儀式,李彥宏會參加。我記得我第一次跟陸奇匯報的時候,說我們很快就get到深度學習的平臺,我順便提了一下,會有一個國家級的深度學習平臺工程實驗室會落在百度,他非常興奮,因為這是一個非常大的事情。我們會做在人工智能行業(yè)非常有意義的事情。
在這個平臺上我們會:
第一、開放深度學習的平臺,是一個開源的深度學習平臺,我們已經(jīng)做了;
第二,我們要在這個平臺上開源非常大集群的服務器的集群,就是GPU的,或者FPGA的。
我們不光開放深度學習的平臺,還要開放計算資源,我們的平臺要跟計算資源做非常好的優(yōu)化。大家如果想去run深度學習的程序,只需要一個賬號,就可以到這個平臺上。因為是國家的平臺,我們基本上是免費提供給大家用的。
我們現(xiàn)在聯(lián)合單位主要是清華,清華的計算機系、電子系、自動化系三個系都參加了。我們會跟他們一起來看,現(xiàn)在這個行業(yè)、這個領域里非常重要的是哪些研究課題,然后我們會一起去定一些方向,在這些方向上,百度會去收集數(shù)據(jù)(因為百度有很多很多數(shù)據(jù),不夠我們再收集)。我們會把數(shù)據(jù)放在這個平臺上,因此我們會把一大批對這些非常前沿的問題、很重要的問題感興趣的科研人員、學生、甚至包括實驗室,吸引到這個平臺上,一起來攻關一些非常核心的課題。我們會把研究的課題、大數(shù)據(jù)放在這。大家經(jīng)常說的深度學習主要三個要素,算法、大計算、大數(shù)據(jù),都會在這個平臺上做非常大的開發(fā)。
百度經(jīng)常會提到,我們還經(jīng)常關注大應用,因為我們覺得閉環(huán)很重要。我們研發(fā)出來的技術如果不錯,百度會很支持在百度的平臺上立刻用出來。我們希望在這個平臺上去搭建一個非常好的生態(tài)體系,簡單說就是人工智能研發(fā)的,從算法開始,到計算、數(shù)據(jù)、應用的非常好的生態(tài)系統(tǒng)。作為一個國家級平臺,我們會在社會上非常開放的跟這些高?;蛘呤浅鮿?chuàng)公司進行合作,希望把它做成一個大事情。
問:應用層面,比如說具體的方向能聚焦一下嗎?
林元慶:經(jīng)常會有朋友問我,人工智能下一步到底發(fā)展在哪,其實在百度里最成功的應用就是搜索跟廣告,第二是是金融,第三個就是EDU,就是智能駕駛。現(xiàn)在這些技術其實還用在很多很多別的方面,包括我剛才舉的旅游的例子?,F(xiàn)在很多的技術,在百度非常多的平臺上應用,內(nèi)部比較成熟之后,會往外走。
問:現(xiàn)在這個實驗室要承擔國家人工智能的課題嗎?
林元慶:因為剛剛批下來,這方面還沒有規(guī)劃,后面應該也是需要去承擔國家一些重要課題的?,F(xiàn)在雖然剛開始,但是我們覺得非常重要的一個就是要做一個很開放的平臺。
問::這個跟之前的“兩會”提案有關系嗎?就是中國大腦。
林元慶:對,這就是中國大腦一個具體的落地,這是非常好的問題。
問:中國大腦除了這個實驗室的落地以外,還有其他的是嗎?還是只有這個實驗室?
林元慶:這個實驗室是一個非常重要的落地。我們可能后續(xù)也可能會承擔一些國家的項目,會有更多落地。目前,我相信這是最重要的一個落地。
百度的人工智能架構、布局及技術
問:能介紹一下百度人工智能的架構和團隊,他們之間是什么樣的關系?怎么協(xié)調(diào)的?
林元慶:基本上三個層次,中間那個層次是AI的基礎技術,就是語音、圖像、NLP、大數(shù)據(jù),還有預測和推薦,都跟大數(shù)據(jù)有關,還有跟智能駕駛有關,等等,六大塊形成了百度的人工智能基礎技術?;久恳粔K都有一個實驗室在做,比如說語音是AI lab。百度研究院現(xiàn)在是四個實驗室,IDL這個層面上就是圖像、視頻,第二個lab是語音的,還有大數(shù)據(jù)的。NLP更大一部分是海峰老師的搜索部,還有跟自動駕駛有關的。
從中間來看,百度的人工智能基礎技術布局是非常全面的,基本上核心的人工智能技術在百度的層面上都有很強的體系。再底層是深度學習平臺PaddlePaddle、大數(shù)據(jù)、大規(guī)模計算。最頂層是各種各樣的應用,比如度秘、圖片搜索……非常非常多,可能應該是上百種的跟人工智能有關的產(chǎn)品,有的是幾乎全套。因此你能看到我們說百度是人工智能,可能外部不理解,從內(nèi)部看是非常容易理解的。
從大的層面來看,第一波人工智能在搜索和廣告上的應用,還有現(xiàn)在的金融。(百度沒有幾個事業(yè)群組,大搜索是一個事業(yè)群組,金融事業(yè)部也是很重要的,為什么做金融?非常重要就是人工智能,人工智能可以做新的互聯(lián)網(wǎng)效益的金融。)這些最大的業(yè)務群組,都是在干人工智能的事情。
問:去年的時候,有人統(tǒng)計過李彥宏提人工智能提了500多次,百度世界大會提到,人工智能是百度核心中的核心,為什么今年他在年初的內(nèi)部演講,四個大方向,把人工智能排在最后。
林元慶:前面那三個都是應用,后面人工智能是貫穿前面的。沒有人工智能,前面三個都不用談了,是因為前面那三個,內(nèi)容分發(fā)、連接服務、金融創(chuàng)新,這三個都嚴重依賴人工智能。
問:您能不能通俗解釋一下什么是算法,它的關鍵和核心是什么?為什么百度的算法比別人的算法好?
林元慶:我舉一個例子。比如我把這張人臉輸入進來,算法是我在這個人臉上做一些計算。
五年、十年之前的技術是,大家都是用人為的去設計一些特征,去找通過多少維的特征算出來,比如1千個特征,然后再去做比對。人工定位這是眼睛、這是鼻子、這是嘴巴……嘴角長這個樣子,眼睛放在這里……最后我綜合這些信息:你的眼睛長這樣,嘴巴長這樣……這成為一個一千維的特征,最后表達成一千個數(shù)據(jù)。比如嘴巴,第一維上是0.1,如果特別尖的嘴角就是1,如果不那么尖、比較圓就是0.5,最后是一個類似打分的東西,這些叫特征向量。這些特征向量,最后就可以拿去做人臉識別了。一張新的照片來,就可以按照這個標準來比對,每個部分的分數(shù)是多少。
但是基于深度學習的算法不是這么簡單來算的,可能需要通過數(shù)據(jù)不斷的去學?;谏疃葘W習,基于非常多的數(shù)據(jù),它覺得哪一種特征是特別有用的,就去調(diào)整,看這個東西應該怎么算,算出來才有用。我舉一個比較極端的例子,假定這個算法發(fā)現(xiàn),所有人的嘴角都是尖的,這個特征就沒有用了,就扔掉了。要去發(fā)現(xiàn)一些特別有用的特征,這些就是為什么深度學習變得特別有用,就是說它能夠去海量的數(shù)據(jù)里面學一些特別有用的特征。
問:所以算法的強弱取決于什么呢?
林元慶:算法的強弱取決于兩點:
一點是你要去設計比較好的計算方法,如果在深度學習里面,你要設計你的這些位置、這些線是怎么連的,因為整體最后是非常非常大的,就反映出來深度學習的一些架構。
第二,你是不是有足夠的數(shù)據(jù),能把這個算法給訓練出來比較好的項目。如果數(shù)據(jù)很小,就看到一個人嘴角是尖的,你就以為大家嘴角都是尖的,這就不行。當然這里面也有很多技術能夠讓你進行海量的數(shù)據(jù)訓練。比如如果算法特別慢,可能算一萬個數(shù)據(jù)得一天,連一個數(shù)據(jù)就得幾萬天,這就是做不出來的。
問:其實這個人臉識別技術的精確程度已經(jīng)達到非常高了,但是2015年的時候,在出席一個會議的時候,銀監(jiān)會的領導就表態(tài)說,我們覺得它還不能百分之百的放心,所以從政策方面就沒有給它放開,在這塊你們是不是取得了一些什么樣的突破,現(xiàn)在有沒有新的進展?第二個問題,你剛才提到聲紋識別,就是現(xiàn)在的應用和嘗試的情況是怎樣的?
林元慶:最開始的時候我也提到了,其實在幾年之前,人臉識別已經(jīng)做得比普通人好,去年我們把它提到了新的高度,能夠比最強大腦的選手還要好,這是很難的。最強大腦的三期節(jié)目我一直在后臺,因為整個技術人臉、聲紋都是我自己在盯的,我也親身感覺到最強大腦的選手有多厲害。原來只是說我們比普通大腦好,但是現(xiàn)在我們在最強大腦的節(jié)目里,比非常優(yōu)秀的人類還要好,是往前進了一大步。
其實證監(jiān)會的這些東西也有很多問題需要去解決。我曾經(jīng)聽一個銀行的領導跟我講,現(xiàn)在國內(nèi)有很多黑產(chǎn),特別是針對金融,所以單靠一個技術是不會全部覆蓋的,我相信人臉識別跟很多技術是一樣的,得有一個過程,很多時候因為有別的因素很難一步到位。
聲紋的話,我們已經(jīng)在百度用到了,比如現(xiàn)金貸和身份認證場景,除了人臉識別還會走一下聲紋識別。
聲紋這塊我們可能后續(xù)在度秘的場景,比如喚醒,會快速往前推進。我們要知道誰在跟度秘說話,你說完這段話之后,我知道是你說的,幾個人說完之后,我就能記住這個話是某某說的,那個話是某某說的。
問:剛才您也談到會軟硬件結合來做,為什么不是以SDK的形式來做?還有一個問題,有個關于錯時識率的問題,現(xiàn)在錯識率會做到千萬分之一的級別?
林元慶:我先回答軟硬件的問題,為什么做軟硬件結合,而不是做SDK。我們景區(qū)的場景,就是跟一些硬件廠商一起做軟件開發(fā)、硬件開發(fā)。我們每天跟他們在一起做測試,一起提高,出一個最后的方案,這樣更有利于我們充分的發(fā)揮算法的優(yōu)勢。當然我們也不排除一些服務是用了SDK的形式,我們的SDK給他讓他去用,但很多時候我們還是希望跟他們一起配合。我們下一步往回走了一點,還是在做SDK,也做軟硬結合。
像手機的情況就是純SDK的形式,就是軟件的形式。剛才說的閘機的情況,非常極端的情況,可能會做一些硬件。
我們一方面是在優(yōu)化算法,讓它很容易用,我們特別看重的是多規(guī)模、大規(guī)模的高效計算。還有一個是國家工程實驗室這個非常重要的平臺,我們現(xiàn)在的計劃也會把這些推到中國的高校里,高校里都會有機器學習的課,你上了這個課,做作業(yè)就直接用這個平臺做就可以了。我們還是蠻開放的。
第二個攻擊的問題,是人臉識別里面非常重要的問題。剛才在下面有一個嘉賓說了,如果指紋丟了,你可能還有九個手指,但是人臉丟了,就沒有辦法了。其實人臉識別里非常重要的就是需要做很好的防攻擊,比如百度閘機,我們和吳恩達錄了一個視頻,他先過了閘機,讓我拿著他的工卡,我把他的工卡這么拿看能不能過得去,百度的系統(tǒng)是拒絕的。因為那識別出那不是真人。人臉識別里面,這叫活體檢測,我們的活體檢測出那不是活的,是個死的,是個工卡,因此就不讓過?;铙w檢測在人臉識別當中是非常重要的一個技術,像銀行系統(tǒng),人臉識別都是要配很好的活體識別的技術,就像防計算機病毒那樣,要不斷提高。
還有一個很重要的,就是我們現(xiàn)在會把這個精度做得非常高,甚至希望有一天能夠識別現(xiàn)在的人跟半年之前的人的區(qū)別。這說的是很極端的情況,如果你的系統(tǒng)真的做得非常好,這些是有可能做到的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。