0
本文作者: 劉芳平 | 2017-02-22 21:13 |
雷鋒網(wǎng)按:21日,《麻省理工科技評(píng)論》發(fā)布全球十大突破性技術(shù)榜單,百度以人臉識(shí)別技術(shù)獲得提名。百度深度學(xué)習(xí)實(shí)驗(yàn)室主任林元慶會(huì)后舉行了一場(chǎng)媒體溝通會(huì),詳細(xì)闡述了百度在人工智能,特別是人臉識(shí)別方面的技術(shù)突破和應(yīng)用落地,并透露了百度國家級(jí)人工智能實(shí)驗(yàn)室的部分計(jì)劃。雷鋒網(wǎng)對(duì)溝通會(huì)內(nèi)容進(jìn)行了整理。
其實(shí)人臉識(shí)別在2016年還是非常突破性的,中國有很多公司,包括百度,也花了非常大的研發(fā)的力量和市場(chǎng)推廣在人臉識(shí)別上面。2016年我們看到技術(shù)報(bào)告和市場(chǎng)報(bào)告很多,技術(shù)上的一個(gè)標(biāo)志性事件就是通過2016年的技術(shù)積累,2017年年初的時(shí)候百度大腦在在《最強(qiáng)大腦》第一期贏了。人臉識(shí)別技術(shù)甚至在一些極端的情況下,我們能做得比最優(yōu)秀的人更好,之前是沒有過這樣的實(shí)驗(yàn),從科學(xué)的角度來看,這是第一次有這么一個(gè)實(shí)驗(yàn)。
應(yīng)用的話,我們2016年在百度已經(jīng)開始落地非常多的人臉識(shí)別相關(guān)的應(yīng)用,特別是我們?nèi)ツ暝诟呔鹊?:N的人臉識(shí)別上,我們的系統(tǒng)是確實(shí)扎扎實(shí)實(shí)的是行業(yè)首創(chuàng)。如果有媒體朋友最近去百度,能體驗(yàn)到我們百度員工刷臉進(jìn)樓,我們?cè)诎俣瓤萍紙@跟百度大廈大部分員工已經(jīng)注冊(cè)了,已經(jīng)一萬多人,應(yīng)該很快會(huì)到五萬人,百度全體員工會(huì)注冊(cè)。這個(gè)就是我拿一張人臉,要跟庫里的一萬多人去比較,這個(gè)技術(shù)比傳統(tǒng)上的銀行用的1:1的人臉識(shí)別要難很多。
百度這種系統(tǒng)基本上需要做到接近于0的誤過率,簡(jiǎn)單來說就是,不是百度的人,一定不能讓他進(jìn)。這個(gè)要求非常嚴(yán)格。比如這里站了一個(gè)保安,你得跟他說,你要非常嚴(yán)格,不是百度的人千萬不能讓他進(jìn)?,F(xiàn)在這個(gè)系統(tǒng)實(shí)際里面大家都感覺確實(shí)非常成熟,我們的技術(shù)已經(jīng)能做到非常好的識(shí)別。是就是,不是就不是。這個(gè)還是做得非常好。
其實(shí)這個(gè)系統(tǒng)就是因?yàn)檫^去這幾年,特別是去年,我們?cè)谌四樧R(shí)別上取得非常大的技術(shù)的突破。今年應(yīng)該至少會(huì)有一百個(gè)以上的4A、5A的景區(qū)啟用百度的人臉識(shí)別系統(tǒng),這是已經(jīng)在談的,我們?cè)诜浅7e極的推進(jìn)這個(gè)事情。這也是同樣的。不要再刷身份證了,你只要注冊(cè)完之后,就可以直接往里面走,是1:N的人臉識(shí)別。
這個(gè)技術(shù)我們確實(shí)是行業(yè)首創(chuàng),我們能做到刷臉,不用再掏證件了。掏證件是我要看你是誰,我從庫里取完照片,再看是不是這個(gè)人。我們能做到1:N的人臉識(shí)別。我們已經(jīng)運(yùn)營(yíng)了半年左右的烏鎮(zhèn)的進(jìn)出西柵景區(qū)的人臉識(shí)別系統(tǒng),也都是1:N的人臉識(shí)別。
今天來MIT Technology Review,公布十大突破技術(shù)的時(shí)候,我們還是蠻興奮的,因?yàn)樗⒛樖瞧渲械囊粋€(gè),基本上這個(gè)技術(shù)都是中國的公司做的,包括百度、face++,他們其實(shí)沒有提到,中國還有好多家初創(chuàng)公司在做人臉識(shí)別,這些都是非常優(yōu)秀的公司。我們也非常高興,覺得十大突破技術(shù),基本上全部是中國公司產(chǎn)生的技術(shù)。
我還想提醒一下大家,去年百度的語音識(shí)別,同樣入選了MIT十大突破技術(shù)。從2016年來看,語音識(shí)別技術(shù)確實(shí)在百度里面取得非常大的商業(yè)化的發(fā)展,比如說最近成立的度秘事業(yè)部,語音交互變成了一個(gè)非常非常重要的領(lǐng)域。今年是人臉識(shí)別。我們希望到了明年,再回頭看,能有非常好的商業(yè)化,希望技術(shù)能夠真正改變大家的生活。
刷臉為什么這么重要呢?其實(shí)不單單是刷臉支付,應(yīng)該是負(fù)責(zé)廣義上的刷臉,或者身份認(rèn)證,其實(shí)是涉及到生活的方方面面。包括我們互聯(lián)網(wǎng)上的各種活動(dòng),特別是互聯(lián)網(wǎng)金融,包括銀行、保險(xiǎn),有很多很多的都會(huì)涉及到身份認(rèn)證的問題。首先你要知道這個(gè)款是貸給誰的,包括進(jìn)出景區(qū),你去旅游,慢慢的也會(huì)在中國變得非常普及。今年至少有一百家以上的TOP景區(qū)可以刷臉進(jìn)景區(qū)。
大家也看到很多報(bào)道,比如火車站、機(jī)場(chǎng),現(xiàn)在也在非常積極的跟我們合作,希望以后這些場(chǎng)所的身份認(rèn)證變得無形,這才是最理想的。剛才有嘉賓說,支付的最高境界就是不要支付。以后身份認(rèn)證的最高境界就是不要認(rèn)證,你直接走就可以了。百度也在非常積極的跟手機(jī)廠商合作,要落地各個(gè)方面人臉識(shí)別的技術(shù)。因?yàn)榘俣鹊呐袛嗍?,我們覺得我們很多的人臉識(shí)別技術(shù),在手機(jī)上是非常好的應(yīng)用場(chǎng)景。我們現(xiàn)在跟國內(nèi)主流的手機(jī)廠商也合作,我們希望把我們的人臉識(shí)別能夠落到手機(jī)上,未來就像指紋一樣是開機(jī)密碼,指紋已經(jīng)做得很成功了,但是指紋安全性也算比較低的,人臉安全性要高很多。
大家如果注意到,像《最強(qiáng)大腦》第二期是聲紋識(shí)別,像我們做的身份認(rèn)證,會(huì)是一整套的解決方案,有聲紋識(shí)別、人臉識(shí)別,甚至更多的信息,我們希望把身份認(rèn)證做得非常好。我大概就講這些。大家如果有問題,可以隨意討論。
以下為林元慶媒體溝通會(huì)的Q&A環(huán)節(jié),雷鋒網(wǎng)做了不改變?cè)獾?整理。
問:商業(yè)化今年有沒有收入上面的KPI?大概能達(dá)到什么等級(jí)?
林元慶:現(xiàn)在人臉識(shí)別的主要的工作,包括它的商業(yè)化,我們其實(shí)沒有一定要做到多少。百度的話,KPI也是有的,但我們更多時(shí)候還是focus在過程、產(chǎn)品支持。人臉識(shí)別我們沒有說我們一定要收入多少,我們還是更看重過程,看過程怎么做。比如商業(yè)化方向,我們是怎么布局的,最后能做到什么樣子。其實(shí)很多技術(shù)都在探索,定高了很難實(shí)現(xiàn),定低了還是覺得很容易的。像我們這種部門,是非常少直接用KPI的。
問:現(xiàn)在百度的人臉識(shí)別技術(shù),有沒有一個(gè)計(jì)劃,怎么跟百度內(nèi)部做一個(gè)落地的結(jié)合?
林元慶:人臉識(shí)別的商業(yè)化,我們內(nèi)部定了四個(gè)大方向。
第一個(gè)是閘機(jī)的情況,就是1:N的高精度識(shí)別。因?yàn)楦袌?chǎng)上的競(jìng)爭(zhēng)者相比,我們確實(shí)是有非常獨(dú)特的優(yōu)勢(shì)的地方。技術(shù)的壁壘非常高。我們要落地到景區(qū),還會(huì)落地到百度這樣的大企業(yè)、寫字樓,這是第一個(gè)方向,1:N的人臉閘機(jī)。
第二個(gè)大方向是交通,簡(jiǎn)單來說交通就是鐵路、機(jī)場(chǎng)。
第三個(gè)大方向是銀行,銀行是百度非常看重的,百度金融服務(wù)事業(yè)部群組的消費(fèi)金融服務(wù)就在使用。現(xiàn)在很多的現(xiàn)金貸、遠(yuǎn)程的身份認(rèn)證也已經(jīng)應(yīng)用了我們的人臉識(shí)別技術(shù)。其實(shí)還有很多,包括百度錢包等等很多業(yè)務(wù)都上線了?,F(xiàn)在身份認(rèn)證在金融的第一個(gè)應(yīng)用,內(nèi)部迭代就是在百度金融,還有泰康、銀行等等,像泰康身份認(rèn)證已經(jīng)上線了,評(píng)價(jià)非常高。還有很多客戶,金融從場(chǎng)景來看可能是最重要的。
第四個(gè)大方向是手機(jī),這跟老百姓的生活非常密切相關(guān)。我們跟手機(jī)廠商在合作,具體的產(chǎn)品形態(tài)現(xiàn)在還不知道
這四個(gè)方向基本上都是非?;ヂ?lián)網(wǎng)化的。可能很多同學(xué)一提人臉識(shí)別,就提到安防,但是我們更多聚焦在互聯(lián)網(wǎng)相關(guān)的方向上,包括出行也是與互聯(lián)網(wǎng)非常相關(guān)的。
這是我們現(xiàn)在想的四個(gè)大方向,以后可能會(huì)變,我們?cè)谶@四個(gè)大方向在非常大的發(fā)力,并不是說只做這四個(gè)大方向,其他不做,我們還是要服務(wù)于需求。
問:最近在國際人工智能大會(huì)AAAI上,包括谷歌在內(nèi)的一些大佬提出了這樣的觀點(diǎn):關(guān)于人工智能在業(yè)界的實(shí)踐,從實(shí)際應(yīng)用的角度來看,關(guān)鍵性的應(yīng)用幾乎不允許發(fā)生錯(cuò)誤,一旦發(fā)生故障,可能造成人員和財(cái)產(chǎn)損失。所以對(duì)整體的系統(tǒng),包括硬件和軟件的可靠性要求非常高,實(shí)現(xiàn)的難度也會(huì)越來越大。所以如果把這個(gè)問題套用到人臉識(shí)別技術(shù)上,要特別注意的事項(xiàng)是什么?您可不可以舉例來回答這個(gè)問題?
林元慶:你說得非常對(duì),現(xiàn)在很多機(jī)器學(xué)習(xí)的模型都是基于統(tǒng)計(jì)的,因此有時(shí)候會(huì)出錯(cuò),這是難免的。因此要不斷地去提高系統(tǒng)的精度。
人臉識(shí)別,我舉一個(gè)例子,比如我們現(xiàn)在裝在百度的人臉閘機(jī)系統(tǒng)。半年之前,就開始了兩條線,先試。剛開始問題挺多的,比如說識(shí)別的精度、對(duì)光線的影響等等很多方面,甚至有很多機(jī)制,還發(fā)生了不是百度的人,結(jié)果放進(jìn)去了的情況。只要發(fā)生一個(gè)case,行政就找到我們,說這樣不行,不是百度的人進(jìn)來,有明顯的安全隱患。在那之后,我們花了非常大的力氣調(diào)我們的系統(tǒng)?,F(xiàn)在我們這個(gè)系統(tǒng)非常非常精準(zhǔn),不是百度的人,是絕對(duì)進(jìn)不去的,在一些應(yīng)用的特別指標(biāo)上會(huì)非常非常嚴(yán)格。其實(shí)我們是非常喜歡這樣的應(yīng)用的,要有一定的技術(shù)門檻才能做得好。像這種情況,其實(shí)是沒有選擇的,必須沉下心來,把技術(shù)做好。
有一些系統(tǒng)上,包括自動(dòng)駕駛,還包括銀行的應(yīng)用,比如我們的身份認(rèn)證,絕對(duì)不是只靠一個(gè)人臉,還要做很重要的活體識(shí)別等各方面,可能還會(huì)用到大數(shù)據(jù),甚至用聲紋識(shí)別,用多模態(tài)的,來保證這個(gè)識(shí)別非??煽?。這些方面都需要每個(gè)方面的機(jī)構(gòu)一起做得特別好。
2008年世博會(huì)的時(shí)候,就聽說過可以人臉閘機(jī),刷臉進(jìn)世博會(huì)了,但是現(xiàn)在很多地方都不能刷臉進(jìn)園區(qū)。比如去古北水鎮(zhèn),古北水鎮(zhèn)就是刷指紋的。我們上次去參加一個(gè)會(huì)議,一百多人,進(jìn)門的時(shí)候就一個(gè)多小時(shí),因?yàn)榘粗讣y挺麻煩的,還要查身份證。十年之前就已經(jīng)在說人臉識(shí)別了,為什么現(xiàn)在古北水鎮(zhèn)很高端的景區(qū)還是沒有應(yīng)用?人工智能很多技術(shù),其實(shí)做一套系統(tǒng)很容易,但是要做一套真的是很多人都在用的系統(tǒng),這個(gè)本身就是有非常高的技術(shù)門檻。
問:您剛才提到了人臉識(shí)別百度這邊有四個(gè)大的落地方向,李彥宏提到互聯(lián)網(wǎng)時(shí)代,軟硬件結(jié)合是明顯的趨勢(shì),主要講人臉識(shí)別,再加上比如圖像、語音等相關(guān)的人工智能,都結(jié)合在一起來看,您覺得現(xiàn)在還有哪些應(yīng)用空間是待開發(fā)的?包括百度在這方面哪些打算在內(nèi)部有一些應(yīng)用,在外部是怎么打算通過一些合作的方式落地到不同的行業(yè)?
林元慶:我先提一下軟硬結(jié)合。剛才我們提到人臉識(shí)別,進(jìn)景區(qū)的閘機(jī),其實(shí)我們也需要在硬件上一體化的來做優(yōu)化,比如說很多景區(qū)可能到了下午陽光就非常曬,攝像頭會(huì)受影響,我們能不能開發(fā)出來足夠好的攝像頭,把主要的曝光集中在人臉上。現(xiàn)在人工智能技術(shù)很多要落地的話,很多的系統(tǒng)都需要考慮軟硬結(jié)合,把性能給真正的發(fā)揮出來。
你們可能聽說過,百度原來覺得不需要做硬件,也盡量不做硬件,但是現(xiàn)在我們其實(shí)挺強(qiáng)調(diào)軟硬結(jié)合的。因?yàn)檫@也是應(yīng)用驅(qū)動(dòng)的,我們也不是一成不變的。像人工智能這些,特別是我們提供最后的解決方案,像智能駕駛,很多硬件的東西肯定是需要進(jìn)來一起優(yōu)化的。在新的條件下,軟硬結(jié)合是人工智能時(shí)代應(yīng)該要做的事情。
你剛才提到百度除人臉識(shí)別以外的技術(shù),人工智能技術(shù)能夠發(fā)揮非常好的效應(yīng),非常重要在于它能夠進(jìn)到某個(gè)行業(yè)、提升某個(gè)行業(yè)、升級(jí)某個(gè)行業(yè)。在百度已經(jīng)做得比較成功的是人工智能去升級(jí)搜索、人工智能去升級(jí)金融行業(yè),比如我剛才提的身份認(rèn)證,互聯(lián)網(wǎng)金融。還有一個(gè)是百度現(xiàn)在正在布局的是智能駕駛行業(yè),不只是一個(gè)單個(gè)的模塊進(jìn)去,而希望是一整套的,甚至是幾百人的,非常大的團(tuán)隊(duì)投入進(jìn)去。
我們很多時(shí)候看的更多是這樣子的人工智能應(yīng)用,比如我們最近投入比較大的力量在做的,用人工智能來升級(jí)旅游行業(yè)。我們希望人工智能會(huì)是一條線,把很多跟旅游有關(guān)的東西串起來,從買票開始,就提交了人臉,到了景區(qū)直接刷人臉閘機(jī)就進(jìn)了景區(qū),進(jìn)了景區(qū)之后你可能需要地圖導(dǎo)航,就為你提供景區(qū)內(nèi)的地圖導(dǎo)航?,F(xiàn)在地圖這塊,戶外地圖大家都做得還不錯(cuò),但景區(qū)里面是百度做得最好(其實(shí)我們說做得最好還是比較初級(jí)的,還有很多景區(qū)沒有cover,或者cover不夠好)。智能導(dǎo)航、智能導(dǎo)游還能做什么,比如進(jìn)了景區(qū),你需要問洗手間在哪,你可以打開地圖直接問;比如去爬香山,你想知道到底哪條路可以到香山,你可以問;你看到一個(gè)牌匾,覺得非常有意思,你可以拍照,可以搜索,這個(gè)牌匾是康熙提的,康熙到底在什么時(shí)候提的……你都上網(wǎng)去問,它把信息告訴你,而且可以把搜到的信息讀給你。再比如到了景區(qū),中午想吃飯了,我們還可以為你打開糯米,并希望糯米能夠知道你喜歡吃哪一樣菜,我們可以給你做菜品級(jí)別的搜索,而不是餐館級(jí)別的,這方面百度也花了非常大的力量,從2016年就開始在做了。隨便舉個(gè)例子,比如你最喜歡的是剁椒魚頭,我可以告訴你在景區(qū)方圓五公里之內(nèi),剁椒魚頭哪一家做得最好,甚至還可以地圖給你導(dǎo)到那里。這都是可以一條線、一條龍的幫你實(shí)現(xiàn)。
我剛才舉的這些例子,其實(shí)是我們實(shí)實(shí)在在在跟旅游部門合作,我們希望有非常好的落地。這樣子的話,大家的生活就很智能。很多人都要用到地圖、語音識(shí)別,還有大數(shù)據(jù),我把很多很多都打包起來為你服務(wù)。就像李彥宏提到的連接服務(wù),我們希望用人工智能做到非常好的連接服務(wù)。
問:主要目前聚焦在跟互聯(lián)網(wǎng)密切相關(guān)的,百度之所以在人臉識(shí)別相關(guān)的落地聚焦在互聯(lián)網(wǎng)相關(guān),而不是說有一些會(huì)到安防或者一些傳統(tǒng)行業(yè),原因是什么?
林元慶:還是同樣的理念。我們很希望人工智能技術(shù)真的能夠落地,去提高老百姓的生活。這是我們的立意之所在。我們?nèi)四樧R(shí)別服務(wù),首先要做的就是看看我們的技術(shù)能不能提高大家的生活水平和質(zhì)量,有一些是需要論證,讓這個(gè)東西變得很容易,比如出去玩,會(huì)涉及到交通,還有銀行,還有我每天都在用的手機(jī)……我們希望落在這些產(chǎn)品上,這也是我們的競(jìng)爭(zhēng)優(yōu)勢(shì)之所在。做安防可能也會(huì)有,但是應(yīng)該會(huì)非常非常少。
問:您剛才說人臉識(shí)別還沒有做到百分之百的準(zhǔn)確度、精確度,那能夠做到非常準(zhǔn)確可能也不完全百分之百可能,有哪些障礙在阻礙它的精確度?
林元慶:做人工智能的這些業(yè)務(wù),其實(shí)非常重要的是需要技術(shù)的落地,我記得在一些公開場(chǎng)合也說過,形成閉環(huán)是非常重要的。我們算一個(gè)數(shù)據(jù),研發(fā)第一步的技術(shù),做第一代的產(chǎn)品,產(chǎn)品到給用戶,用戶產(chǎn)生數(shù)據(jù),數(shù)據(jù)回來進(jìn)一步提高技術(shù),提高更多的數(shù)據(jù)、更好的算法……算法并非不變,很多時(shí)候算法是和技術(shù)是一起發(fā)展的,這才是非常好的正循環(huán),這是非常非常重要的。
在人工智能技術(shù)的發(fā)展上,做一個(gè)技術(shù),和把這個(gè)技術(shù)做到極致,是兩個(gè)不同的目標(biāo)。如果只是做一套人臉識(shí)別系統(tǒng),那我就只要數(shù)據(jù)算好了,隨便一搭就能出來一套系統(tǒng)。但如果你真的想把這個(gè)數(shù)據(jù)做到極致,要做得非常非常好,閉環(huán)是必要的,沒有這個(gè)閉環(huán)是做不下去的。
比如百度人臉閘機(jī)非常嚴(yán)格,偶爾也會(huì)有人看身份證或者工卡進(jìn)去,但由于閘機(jī)性能做得比較好,一旦發(fā)生情況,后面的系統(tǒng)立馬就更新,非??彀堰@些情況解決掉。因此這個(gè)系統(tǒng)越來越聰明,可能過了一段時(shí)間就不會(huì)再有任何問題了。
問:這個(gè)技術(shù)已經(jīng)提了十年了,但是現(xiàn)在很多景區(qū)的閘機(jī)還沒有鋪開,阻礙沒有鋪開的原因是什么?
林元慶:還是技術(shù)。其實(shí)還是蠻難的,你做不到就是做不到。我們當(dāng)時(shí)在烏鎮(zhèn)落地,烏鎮(zhèn)的景區(qū)還不太放心,他們又找了一家,基本上一個(gè)地方布了兩臺(tái),差不多一個(gè)禮拜那臺(tái)就拿走了,技術(shù)差別不是一點(diǎn)點(diǎn)。你們?nèi)绻腥蹑?zhèn),可以親身體驗(yàn)一下,就在西柵景區(qū),去年剛布上去,當(dāng)時(shí)有些媒體報(bào)道,也有視頻?,F(xiàn)在是每天都在運(yùn)行的。烏鎮(zhèn)跟古北水鎮(zhèn)是一個(gè)老板,他們非常急切推動(dòng)我們把相同的系統(tǒng)鋪在古北水鎮(zhèn),現(xiàn)在在推進(jìn)做更大的系統(tǒng),還沒有徹底落下來。
問:之前春運(yùn)的時(shí)候,刷臉的技術(shù),這個(gè)技術(shù)沒有用百度的,而是國外的公司,我想問一下為什么沒有用百度的技術(shù)?這個(gè)技術(shù)跟百度的區(qū)別,下一階段能不能做到用我們的技術(shù)?
林元慶:其實(shí)目前的情況是,鐵道部用了很多家公司的技術(shù),都在上面去試,最后希望看誰的最好。確實(shí),百度是去年在烏鎮(zhèn)才做了第一個(gè)商業(yè)化。我們內(nèi)部用得非常好,但是全網(wǎng)的內(nèi)容搜索,落地的,做得確實(shí)不夠多。
《最強(qiáng)大腦》的節(jié)目組,他們?cè)瓉硎钦业膭e的公司,我說你們?yōu)槭裁床粊碚野俣?,這個(gè)很奇怪,你們難道沒有想到嗎?我說最起碼你得來找一下,看我們有沒有技術(shù)。他們節(jié)目說我們根本沒有聽到百度做人臉識(shí)別,因?yàn)槲覀冊(cè)谶@方面的宣傳還是太少了。因此,鐵路那個(gè)現(xiàn)在做的都是1:1的人臉識(shí)別,我們肯定能做得很好,這是沒有什么爭(zhēng)議的。只是我們的商業(yè)化在這方面有一點(diǎn)滯后,后面的話我相信百度的技術(shù)一定會(huì)應(yīng)用在鐵路平臺(tái)上面,只是時(shí)間的問題。
問:現(xiàn)在國內(nèi)做人臉識(shí)別技術(shù)和應(yīng)用的廠商其實(shí)很多,從百度的角度來看,百度的人臉識(shí)別的技術(shù)和應(yīng)用有哪些獨(dú)到的地方,哪些地方是其他應(yīng)用和技術(shù)所不具備的?
林元慶:剛才有提到了高精度的1:N的人臉識(shí)別,能商業(yè)化的布到景區(qū)里,現(xiàn)在應(yīng)該是沒有別人能做得到。規(guī)模比較大的1:N的識(shí)別,N可能是幾萬,或者是說十萬,難度還是比較大。1:N的識(shí)別原來是有過的,比如抓罪犯的場(chǎng)景,布一個(gè)攝像頭,和十萬的黑名單對(duì)比,人走過來,看到這個(gè)人跟黑名單里有點(diǎn)像,但后面得讓人再來看一下,因?yàn)椴荒鼙WC這個(gè)人就是他。而在我們場(chǎng)景,一個(gè)人走過來的時(shí)候,我要非常高精度的知道你就是你,他就是他。1:N不是初創(chuàng),但高精度的1:N(N是萬或者十萬的級(jí)別),這是初創(chuàng)的,對(duì)技術(shù)的要求非常高。目前我相信在中國甚至在世界上,也只有我們能做到,因?yàn)槊绹暮芏啻髲S商、大景區(qū)都在找我們,希望用百度的人臉識(shí)別系統(tǒng)。如果技術(shù)達(dá)不到,是很難做到的,就像剛才舉的例子,你也可以去部署一個(gè)系統(tǒng),但可能比較難用,所以后來景區(qū)就不用了。
國內(nèi)的初創(chuàng)公司,這幾年也做得很不錯(cuò),比如銀行的應(yīng)用,1:1的人臉識(shí)別,他們還是有相當(dāng)?shù)母?jìng)爭(zhēng)力的。但即使這樣情況,我們也會(huì)想一些辦法,因?yàn)榘俣仁且粋€(gè)互聯(lián)網(wǎng)公司,人臉只是一個(gè)點(diǎn),我們還有很多點(diǎn)可以跟別的公司談合作,這些是我們百度的優(yōu)勢(shì)。
技術(shù)是很重要的,好幾個(gè)月之前,我在微信朋友圈就提出,百度進(jìn)入人臉識(shí)別行業(yè),走的是技術(shù)路線。
問:除了1:N的應(yīng)用方式,那其他的技術(shù)上有沒有一些比較獨(dú)到之處?
林元慶:其實(shí)1:N反映的是在人臉識(shí)別上能做到非常高精度,但有一些情況精度做得不夠高,產(chǎn)品也可以用。比如銀行的系統(tǒng),是半自動(dòng)的,如果識(shí)別不好會(huì)有人工干預(yù),現(xiàn)在這是一個(gè)普遍情況。我們?nèi)プ龅脑挘锌赡苋斯じ深A(yù)會(huì)非常少,別的公司去做可能需要人工干預(yù)多一些。
其實(shí)1:N不是說我們憑空就做上來,很深刻的方面就是,我們確實(shí)在人臉識(shí)別技術(shù)上,在它的后端,人臉的特征能夠體現(xiàn)的更好,1:1跟1:N其實(shí)是一樣的,但是能做到1:N,就是人臉識(shí)別的特征非常好。
問:昨天(2月20日)百度牽頭成立國家級(jí)的AI實(shí)驗(yàn)室,是跟高校合作,您正好是負(fù)責(zé)這一項(xiàng)目的,我想問一下這個(gè)項(xiàng)目具體到高校和百度這邊的分工到底是什么樣子的?到您本人這邊,會(huì)負(fù)責(zé)具體的什么內(nèi)容?這是第一次一個(gè)企業(yè)和高校,而且是國家發(fā)改委級(jí)別的,想聽聽您對(duì)這件事的看法。
林元慶:因?yàn)槭亲蛱斓男侣?,我們牽頭的深度學(xué)習(xí)技術(shù)和應(yīng)用國家工程實(shí)驗(yàn)室,落地在百度。我沒有仔細(xì)去查,應(yīng)該是BAT的唯一一家深度學(xué)習(xí)國家工程實(shí)驗(yàn)室,我們覺得非常幸運(yùn),牽頭單位非常重要,因?yàn)槭锹?lián)合的,要真正落在那兒,真正follow你的戰(zhàn)略。是我去答辯的,競(jìng)爭(zhēng)非常激烈,特別是因?yàn)榘俣炔皇歉咝#膊皇菄鵂I(yíng)單位,我們拿到這個(gè)非常感謝國家的信任。我們內(nèi)部也有非常大的計(jì)劃,要在這個(gè)平臺(tái)上做,今天也借這個(gè)機(jī)會(huì)跟媒體朋友說一下。
我們下周四還有一個(gè)揭牌儀式,李彥宏會(huì)參加。我記得我第一次跟陸奇匯報(bào)的時(shí)候,說我們很快就get到深度學(xué)習(xí)的平臺(tái),我順便提了一下,會(huì)有一個(gè)國家級(jí)的深度學(xué)習(xí)平臺(tái)工程實(shí)驗(yàn)室會(huì)落在百度,他非常興奮,因?yàn)檫@是一個(gè)非常大的事情。我們會(huì)做在人工智能行業(yè)非常有意義的事情。
在這個(gè)平臺(tái)上我們會(huì):
第一、開放深度學(xué)習(xí)的平臺(tái),是一個(gè)開源的深度學(xué)習(xí)平臺(tái),我們已經(jīng)做了;
第二,我們要在這個(gè)平臺(tái)上開源非常大集群的服務(wù)器的集群,就是GPU的,或者FPGA的。
我們不光開放深度學(xué)習(xí)的平臺(tái),還要開放計(jì)算資源,我們的平臺(tái)要跟計(jì)算資源做非常好的優(yōu)化。大家如果想去run深度學(xué)習(xí)的程序,只需要一個(gè)賬號(hào),就可以到這個(gè)平臺(tái)上。因?yàn)槭菄业钠脚_(tái),我們基本上是免費(fèi)提供給大家用的。
我們現(xiàn)在聯(lián)合單位主要是清華,清華的計(jì)算機(jī)系、電子系、自動(dòng)化系三個(gè)系都參加了。我們會(huì)跟他們一起來看,現(xiàn)在這個(gè)行業(yè)、這個(gè)領(lǐng)域里非常重要的是哪些研究課題,然后我們會(huì)一起去定一些方向,在這些方向上,百度會(huì)去收集數(shù)據(jù)(因?yàn)榘俣扔泻芏嗪芏鄶?shù)據(jù),不夠我們?cè)偈占?。我們?huì)把數(shù)據(jù)放在這個(gè)平臺(tái)上,因此我們會(huì)把一大批對(duì)這些非常前沿的問題、很重要的問題感興趣的科研人員、學(xué)生、甚至包括實(shí)驗(yàn)室,吸引到這個(gè)平臺(tái)上,一起來攻關(guān)一些非常核心的課題。我們會(huì)把研究的課題、大數(shù)據(jù)放在這。大家經(jīng)常說的深度學(xué)習(xí)主要三個(gè)要素,算法、大計(jì)算、大數(shù)據(jù),都會(huì)在這個(gè)平臺(tái)上做非常大的開發(fā)。
百度經(jīng)常會(huì)提到,我們還經(jīng)常關(guān)注大應(yīng)用,因?yàn)槲覀冇X得閉環(huán)很重要。我們研發(fā)出來的技術(shù)如果不錯(cuò),百度會(huì)很支持在百度的平臺(tái)上立刻用出來。我們希望在這個(gè)平臺(tái)上去搭建一個(gè)非常好的生態(tài)體系,簡(jiǎn)單說就是人工智能研發(fā)的,從算法開始,到計(jì)算、數(shù)據(jù)、應(yīng)用的非常好的生態(tài)系統(tǒng)。作為一個(gè)國家級(jí)平臺(tái),我們會(huì)在社會(huì)上非常開放的跟這些高?;蛘呤浅鮿?chuàng)公司進(jìn)行合作,希望把它做成一個(gè)大事情。
問:應(yīng)用層面,比如說具體的方向能聚焦一下嗎?
林元慶:經(jīng)常會(huì)有朋友問我,人工智能下一步到底發(fā)展在哪,其實(shí)在百度里最成功的應(yīng)用就是搜索跟廣告,第二是是金融,第三個(gè)就是EDU,就是智能駕駛?,F(xiàn)在這些技術(shù)其實(shí)還用在很多很多別的方面,包括我剛才舉的旅游的例子?,F(xiàn)在很多的技術(shù),在百度非常多的平臺(tái)上應(yīng)用,內(nèi)部比較成熟之后,會(huì)往外走。
問:現(xiàn)在這個(gè)實(shí)驗(yàn)室要承擔(dān)國家人工智能的課題嗎?
林元慶:因?yàn)閯倓偱聛?,這方面還沒有規(guī)劃,后面應(yīng)該也是需要去承擔(dān)國家一些重要課題的?,F(xiàn)在雖然剛開始,但是我們覺得非常重要的一個(gè)就是要做一個(gè)很開放的平臺(tái)。
問::這個(gè)跟之前的“兩會(huì)”提案有關(guān)系嗎?就是中國大腦。
林元慶:對(duì),這就是中國大腦一個(gè)具體的落地,這是非常好的問題。
問:中國大腦除了這個(gè)實(shí)驗(yàn)室的落地以外,還有其他的是嗎?還是只有這個(gè)實(shí)驗(yàn)室?
林元慶:這個(gè)實(shí)驗(yàn)室是一個(gè)非常重要的落地。我們可能后續(xù)也可能會(huì)承擔(dān)一些國家的項(xiàng)目,會(huì)有更多落地。目前,我相信這是最重要的一個(gè)落地。
百度的人工智能架構(gòu)、布局及技術(shù)
問:能介紹一下百度人工智能的架構(gòu)和團(tuán)隊(duì),他們之間是什么樣的關(guān)系?怎么協(xié)調(diào)的?
林元慶:基本上三個(gè)層次,中間那個(gè)層次是AI的基礎(chǔ)技術(shù),就是語音、圖像、NLP、大數(shù)據(jù),還有預(yù)測(cè)和推薦,都跟大數(shù)據(jù)有關(guān),還有跟智能駕駛有關(guān),等等,六大塊形成了百度的人工智能基礎(chǔ)技術(shù)?;久恳粔K都有一個(gè)實(shí)驗(yàn)室在做,比如說語音是AI lab。百度研究院現(xiàn)在是四個(gè)實(shí)驗(yàn)室,IDL這個(gè)層面上就是圖像、視頻,第二個(gè)lab是語音的,還有大數(shù)據(jù)的。NLP更大一部分是海峰老師的搜索部,還有跟自動(dòng)駕駛有關(guān)的。
從中間來看,百度的人工智能基礎(chǔ)技術(shù)布局是非常全面的,基本上核心的人工智能技術(shù)在百度的層面上都有很強(qiáng)的體系。再底層是深度學(xué)習(xí)平臺(tái)PaddlePaddle、大數(shù)據(jù)、大規(guī)模計(jì)算。最頂層是各種各樣的應(yīng)用,比如度秘、圖片搜索……非常非常多,可能應(yīng)該是上百種的跟人工智能有關(guān)的產(chǎn)品,有的是幾乎全套。因此你能看到我們說百度是人工智能,可能外部不理解,從內(nèi)部看是非常容易理解的。
從大的層面來看,第一波人工智能在搜索和廣告上的應(yīng)用,還有現(xiàn)在的金融。(百度沒有幾個(gè)事業(yè)群組,大搜索是一個(gè)事業(yè)群組,金融事業(yè)部也是很重要的,為什么做金融?非常重要就是人工智能,人工智能可以做新的互聯(lián)網(wǎng)效益的金融。)這些最大的業(yè)務(wù)群組,都是在干人工智能的事情。
問:去年的時(shí)候,有人統(tǒng)計(jì)過李彥宏提人工智能提了500多次,百度世界大會(huì)提到,人工智能是百度核心中的核心,為什么今年他在年初的內(nèi)部演講,四個(gè)大方向,把人工智能排在最后。
林元慶:前面那三個(gè)都是應(yīng)用,后面人工智能是貫穿前面的。沒有人工智能,前面三個(gè)都不用談了,是因?yàn)榍懊婺侨齻€(gè),內(nèi)容分發(fā)、連接服務(wù)、金融創(chuàng)新,這三個(gè)都嚴(yán)重依賴人工智能。
問:您能不能通俗解釋一下什么是算法,它的關(guān)鍵和核心是什么?為什么百度的算法比別人的算法好?
林元慶:我舉一個(gè)例子。比如我把這張人臉輸入進(jìn)來,算法是我在這個(gè)人臉上做一些計(jì)算。
五年、十年之前的技術(shù)是,大家都是用人為的去設(shè)計(jì)一些特征,去找通過多少維的特征算出來,比如1千個(gè)特征,然后再去做比對(duì)。人工定位這是眼睛、這是鼻子、這是嘴巴……嘴角長(zhǎng)這個(gè)樣子,眼睛放在這里……最后我綜合這些信息:你的眼睛長(zhǎng)這樣,嘴巴長(zhǎng)這樣……這成為一個(gè)一千維的特征,最后表達(dá)成一千個(gè)數(shù)據(jù)。比如嘴巴,第一維上是0.1,如果特別尖的嘴角就是1,如果不那么尖、比較圓就是0.5,最后是一個(gè)類似打分的東西,這些叫特征向量。這些特征向量,最后就可以拿去做人臉識(shí)別了。一張新的照片來,就可以按照這個(gè)標(biāo)準(zhǔn)來比對(duì),每個(gè)部分的分?jǐn)?shù)是多少。
但是基于深度學(xué)習(xí)的算法不是這么簡(jiǎn)單來算的,可能需要通過數(shù)據(jù)不斷的去學(xué)?;谏疃葘W(xué)習(xí),基于非常多的數(shù)據(jù),它覺得哪一種特征是特別有用的,就去調(diào)整,看這個(gè)東西應(yīng)該怎么算,算出來才有用。我舉一個(gè)比較極端的例子,假定這個(gè)算法發(fā)現(xiàn),所有人的嘴角都是尖的,這個(gè)特征就沒有用了,就扔掉了。要去發(fā)現(xiàn)一些特別有用的特征,這些就是為什么深度學(xué)習(xí)變得特別有用,就是說它能夠去海量的數(shù)據(jù)里面學(xué)一些特別有用的特征。
問:所以算法的強(qiáng)弱取決于什么呢?
林元慶:算法的強(qiáng)弱取決于兩點(diǎn):
一點(diǎn)是你要去設(shè)計(jì)比較好的計(jì)算方法,如果在深度學(xué)習(xí)里面,你要設(shè)計(jì)你的這些位置、這些線是怎么連的,因?yàn)檎w最后是非常非常大的,就反映出來深度學(xué)習(xí)的一些架構(gòu)。
第二,你是不是有足夠的數(shù)據(jù),能把這個(gè)算法給訓(xùn)練出來比較好的項(xiàng)目。如果數(shù)據(jù)很小,就看到一個(gè)人嘴角是尖的,你就以為大家嘴角都是尖的,這就不行。當(dāng)然這里面也有很多技術(shù)能夠讓你進(jìn)行海量的數(shù)據(jù)訓(xùn)練。比如如果算法特別慢,可能算一萬個(gè)數(shù)據(jù)得一天,連一個(gè)數(shù)據(jù)就得幾萬天,這就是做不出來的。
問:其實(shí)這個(gè)人臉識(shí)別技術(shù)的精確程度已經(jīng)達(dá)到非常高了,但是2015年的時(shí)候,在出席一個(gè)會(huì)議的時(shí)候,銀監(jiān)會(huì)的領(lǐng)導(dǎo)就表態(tài)說,我們覺得它還不能百分之百的放心,所以從政策方面就沒有給它放開,在這塊你們是不是取得了一些什么樣的突破,現(xiàn)在有沒有新的進(jìn)展?第二個(gè)問題,你剛才提到聲紋識(shí)別,就是現(xiàn)在的應(yīng)用和嘗試的情況是怎樣的?
林元慶:最開始的時(shí)候我也提到了,其實(shí)在幾年之前,人臉識(shí)別已經(jīng)做得比普通人好,去年我們把它提到了新的高度,能夠比最強(qiáng)大腦的選手還要好,這是很難的。最強(qiáng)大腦的三期節(jié)目我一直在后臺(tái),因?yàn)檎麄€(gè)技術(shù)人臉、聲紋都是我自己在盯的,我也親身感覺到最強(qiáng)大腦的選手有多厲害。原來只是說我們比普通大腦好,但是現(xiàn)在我們?cè)谧顝?qiáng)大腦的節(jié)目里,比非常優(yōu)秀的人類還要好,是往前進(jìn)了一大步。
其實(shí)證監(jiān)會(huì)的這些東西也有很多問題需要去解決。我曾經(jīng)聽一個(gè)銀行的領(lǐng)導(dǎo)跟我講,現(xiàn)在國內(nèi)有很多黑產(chǎn),特別是針對(duì)金融,所以單靠一個(gè)技術(shù)是不會(huì)全部覆蓋的,我相信人臉識(shí)別跟很多技術(shù)是一樣的,得有一個(gè)過程,很多時(shí)候因?yàn)橛袆e的因素很難一步到位。
聲紋的話,我們已經(jīng)在百度用到了,比如現(xiàn)金貸和身份認(rèn)證場(chǎng)景,除了人臉識(shí)別還會(huì)走一下聲紋識(shí)別。
聲紋這塊我們可能后續(xù)在度秘的場(chǎng)景,比如喚醒,會(huì)快速往前推進(jìn)。我們要知道誰在跟度秘說話,你說完這段話之后,我知道是你說的,幾個(gè)人說完之后,我就能記住這個(gè)話是某某說的,那個(gè)話是某某說的。
問:剛才您也談到會(huì)軟硬件結(jié)合來做,為什么不是以SDK的形式來做?還有一個(gè)問題,有個(gè)關(guān)于錯(cuò)時(shí)識(shí)率的問題,現(xiàn)在錯(cuò)識(shí)率會(huì)做到千萬分之一的級(jí)別?
林元慶:我先回答軟硬件的問題,為什么做軟硬件結(jié)合,而不是做SDK。我們景區(qū)的場(chǎng)景,就是跟一些硬件廠商一起做軟件開發(fā)、硬件開發(fā)。我們每天跟他們?cè)谝黄鹱鰷y(cè)試,一起提高,出一個(gè)最后的方案,這樣更有利于我們充分的發(fā)揮算法的優(yōu)勢(shì)。當(dāng)然我們也不排除一些服務(wù)是用了SDK的形式,我們的SDK給他讓他去用,但很多時(shí)候我們還是希望跟他們一起配合。我們下一步往回走了一點(diǎn),還是在做SDK,也做軟硬結(jié)合。
像手機(jī)的情況就是純SDK的形式,就是軟件的形式。剛才說的閘機(jī)的情況,非常極端的情況,可能會(huì)做一些硬件。
我們一方面是在優(yōu)化算法,讓它很容易用,我們特別看重的是多規(guī)模、大規(guī)模的高效計(jì)算。還有一個(gè)是國家工程實(shí)驗(yàn)室這個(gè)非常重要的平臺(tái),我們現(xiàn)在的計(jì)劃也會(huì)把這些推到中國的高校里,高校里都會(huì)有機(jī)器學(xué)習(xí)的課,你上了這個(gè)課,做作業(yè)就直接用這個(gè)平臺(tái)做就可以了。我們還是蠻開放的。
第二個(gè)攻擊的問題,是人臉識(shí)別里面非常重要的問題。剛才在下面有一個(gè)嘉賓說了,如果指紋丟了,你可能還有九個(gè)手指,但是人臉丟了,就沒有辦法了。其實(shí)人臉識(shí)別里非常重要的就是需要做很好的防攻擊,比如百度閘機(jī),我們和吳恩達(dá)錄了一個(gè)視頻,他先過了閘機(jī),讓我拿著他的工卡,我把他的工卡這么拿看能不能過得去,百度的系統(tǒng)是拒絕的。因?yàn)槟亲R(shí)別出那不是真人。人臉識(shí)別里面,這叫活體檢測(cè),我們的活體檢測(cè)出那不是活的,是個(gè)死的,是個(gè)工卡,因此就不讓過。活體檢測(cè)在人臉識(shí)別當(dāng)中是非常重要的一個(gè)技術(shù),像銀行系統(tǒng),人臉識(shí)別都是要配很好的活體識(shí)別的技術(shù),就像防計(jì)算機(jī)病毒那樣,要不斷提高。
還有一個(gè)很重要的,就是我們現(xiàn)在會(huì)把這個(gè)精度做得非常高,甚至希望有一天能夠識(shí)別現(xiàn)在的人跟半年之前的人的區(qū)別。這說的是很極端的情況,如果你的系統(tǒng)真的做得非常好,這些是有可能做到的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。