0
本文作者: 奕欣 | 2017-07-15 15:18 | 專題:GAIR 2017 |
7 月 9 日下午,由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的第二屆CCF-GAIR全球人工智能與機(jī)器人峰會(huì),進(jìn)行到最后一天,CV+專場(chǎng)的圓桌論壇作為本次大會(huì)的最后一個(gè)議程順利進(jìn)行。圓桌討論的主題是,計(jì)算機(jī)視覺滲透生活。本次圓桌由微軟亞洲研究院資深研究員梅濤博士擔(dān)任主持人,他幽默但犀利的主持風(fēng)格博得現(xiàn)場(chǎng)陣陣掌聲。
參與本次圓桌的五位圓桌嘉賓包括:中科院計(jì)算所研究員、中科視拓董事長(zhǎng)兼 CTO 山世光、閱面科技 CEO 趙京雷、圖麟科技 CEO 魏京京、瑞為智能 CEO 詹東暉以及臻識(shí)科技 CEO 任鵬。
雖然大會(huì)已經(jīng)接近尾聲,但現(xiàn)場(chǎng)依然座無虛席,觀眾們也幸運(yùn)地看到了六位大牛時(shí)而輕松愉快、時(shí)而嚴(yán)肅認(rèn)真的討論。
雷鋒網(wǎng)整理了本次圓桌的討論全文。
梅濤:今天我們圓桌的主題是「計(jì)算機(jī)視覺滲透生活」。為什么今天選擇這個(gè)主題?因?yàn)槲覀冇X得計(jì)算機(jī)視覺已經(jīng)滲透到我們生活無處不在的地方,滲透這個(gè)詞英文是「permeate」。計(jì)算機(jī)視覺已經(jīng)在改變我們生活的方方面面,我們有必要探討一下計(jì)算機(jī)視覺到底在我們生活中能夠產(chǎn)生什么樣的影響以及怎么落地。
今天我們會(huì)邀請(qǐng)到五位嘉賓,剛才我用好奇心給每個(gè)人起了一個(gè)外號(hào),如果不當(dāng)請(qǐng)?jiān)?。因?yàn)樽隹蒲校偸窍矚g做一些很創(chuàng)新的事情。
第一個(gè)嘉賓,剛才山老師說公司最小,所以請(qǐng)他第一個(gè)上臺(tái),給山老師起名字叫「X man」,因?yàn)樯嚼蠋焺偛胖v了很多「X」(雷鋒網(wǎng) AI 科技評(píng)論按:山世光博士的演講題目為《X 數(shù)據(jù)驅(qū)動(dòng)的 Seeta 平臺(tái)與技術(shù)》)。有請(qǐng)山老師。第二位嘉賓我起了個(gè)名字叫「憂郁的男子」,歡迎趙京雷趙總。趙總是畢業(yè)于上海交通大學(xué)的人工智能博士,現(xiàn)在是閱面科技的 CEO。第三位嘉賓我起的名字叫「Cool Man」,有請(qǐng)圖麟科技 CEO 魏京京,他是我的師弟。第四位嘉賓我給他起的名字叫「風(fēng)一樣的男子」,因?yàn)樗┲谝路駛€(gè)黑衣人一樣,他就是瑞為智能的 CEO 詹東暉。詹東暉博士是瑞為智能的創(chuàng)始人兼總經(jīng)理,十一年在華為的經(jīng)歷,創(chuàng)立了瑞為智能。最后一位嘉賓我們叫「Cooler Man」,因?yàn)樗雌饋肀任規(guī)煹芨?,有?qǐng)臻識(shí)科技的 CEO 任鵬。(現(xiàn)場(chǎng)笑聲+掌聲)
今天有幾個(gè)話題給各位嘉賓準(zhǔn)備,在座來聽課的各位老師和朋友也可以提出你們的問題,通過雷鋒網(wǎng)的同事給我傳達(dá)一下。
第一個(gè)話題比較簡(jiǎn)單一點(diǎn),大家覺得計(jì)算機(jī)視覺對(duì)我們生活產(chǎn)生了什么影響?大家可以結(jié)合自己的生活講一講你們的體會(huì),我們從最小的公司開始吧,山總。(現(xiàn)場(chǎng)笑聲)
山世光:我最近經(jīng)常在演講的時(shí)候問大家一個(gè)問題,你今年刷了幾次臉?我相信在今年也許你會(huì)刷三五次,明年搞不好得三十到五十次了。為什么這么說呢?因?yàn)槿四樧R(shí)別,就像剛才說的,在過去幾年時(shí)間里面是計(jì)算機(jī)視覺里面最快落地的一個(gè)技術(shù)。我自己做人臉識(shí)別,我就不說「之一」了,這個(gè)技術(shù)確實(shí)在不斷滲透到我們?nèi)粘I罾?,大家可以看到出行方面,比如說坐高鐵、飛機(jī),機(jī)場(chǎng)需要刷身份證,驗(yàn)證你這個(gè)技術(shù)是不是能應(yīng)用。包括接下來幾年,我們有大量公司采用人臉識(shí)別的技術(shù)做員工的考勤和門禁。這一代考勤門禁跟上一代不一樣,三四年前我們家旁邊的門禁考勤都是人過去,還是要看著屏幕做考勤,未來將會(huì)是無感的考勤,我相信人臉識(shí)別會(huì)越來越多的滲透到日常生活中去。人臉識(shí)別就像門和鎖的關(guān)系一樣,你需要進(jìn)入到某一種狀態(tài),有這個(gè)權(quán)限就可以驗(yàn)證你是你,這是幾乎無處不在的場(chǎng)景。我就說一下人臉識(shí)別,后面還有很多空間可以說。
梅濤:謝謝山老師,山老師認(rèn)為人臉有很多因素。
趙京雷:「憂郁的男子」這個(gè)名字特別貼切,因?yàn)槲疫@一年馬上要開始駕照年審了,我已經(jīng)被抓拍三次了,馬上要開始去學(xué)習(xí)了。
對(duì)我而言,計(jì)算機(jī)視覺對(duì)我而言不能說是好的改變,但是對(duì)車牌的識(shí)別(很重要),每天我們開進(jìn)去停車場(chǎng),這種技術(shù)很成熟,已經(jīng)潛移默化了,我們已經(jīng)意識(shí)不到這種技術(shù)的存在了,包括臻識(shí)科技也在做這種技術(shù)。我們生活中類似車牌識(shí)別的技術(shù)大量存在了。跟車牌識(shí)別相關(guān)的 OCR 技術(shù),包括手機(jī)里面各種各樣的貼圖、美顏。說到美顏,好像在座的女生不是很多,只要是女生,我覺得這已經(jīng)是必備的。很多技術(shù)我們每天意識(shí)不到它的存在,我覺得這更是標(biāo)準(zhǔn)的這些技術(shù)的成熟。
反過來,我們思考一個(gè)問題,比如說山老師剛才談到的人臉識(shí)別,包括馬云,包括很多公司,每天都在講刷臉,為什么把它叫做一種技術(shù)呢?從這個(gè)角度考慮,我認(rèn)為這個(gè)技術(shù)反而是不成熟的。過幾年以后,我們?cè)僖膊恢v刷臉,每天很正常,我上街買一個(gè)東西,不需要站在那里一刷,付一下款就可以了,這個(gè)時(shí)候技術(shù)會(huì)真正走向成熟。
梅濤:謝謝趙總,人工智能帶來很多便利,但是需要人們更加的自律,希望趙總以后不要再憂郁了。接下來請(qǐng)魏總談一談?dòng)?jì)算機(jī)視覺給你生活帶來什么改變。
魏京京:人工智能給我?guī)砗芏嘟梃b,我們平常感受到人工智能的點(diǎn)非常少,比如說我們用 FaceU 這種產(chǎn)品,還是比較簡(jiǎn)單化的產(chǎn)品。其實(shí) 2C 和 2B 我們看了很多,但是真正 2C 落地非常難,大部分公司都在做 2B 的業(yè)務(wù),2B 是做我們正在做我們用到的東西。如果說視覺改變生活,現(xiàn)在這個(gè)階段是非常隱藏的,你是看不到的,在每一個(gè)商品的背后是大量的服務(wù)和技術(shù)在里面,只是你感覺不到。后續(xù)的發(fā)展會(huì)從后端延展到前端,我們用的東西會(huì)慢慢感覺到有視覺的東西在里面,這個(gè)時(shí)間還很長(zhǎng)。現(xiàn)在 2B 的業(yè)務(wù)我們做不過來,還有很多需要挖掘,2B 的爆發(fā)點(diǎn)還在后面,我非??春煤罄m(xù)三五年視覺在我們生活中顯現(xiàn)出來,大的關(guān)鍵的應(yīng)用機(jī)會(huì)非常多,我們創(chuàng)業(yè)公司先做 2B 的事情,慢慢技術(shù)、場(chǎng)景、用戶行為習(xí)慣和付費(fèi)習(xí)慣成熟之后慢慢會(huì)到前端。
梅濤:魏總的意思是你認(rèn)為人工智能先從 2B 業(yè)務(wù)開始,然后慢慢滲透到生活。
魏京京:對(duì),先從 2B 滲透到產(chǎn)品,慢慢滲透到前端,包括 2C 的產(chǎn)品和應(yīng)用會(huì)越來越多,這是創(chuàng)業(yè)公司和產(chǎn)業(yè)發(fā)展的大的機(jī)會(huì)。
梅濤:下面請(qǐng)詹總講一下人工智能的變化。
詹東暉:我覺得如果從人工智能對(duì)生活的影響,最直觀的還是臻識(shí)科技他們做的車牌識(shí)別,以后每次進(jìn)出停車場(chǎng)不用取卡。我們四位都做人臉識(shí)別,大家感受很多的還是刷卡,未來很多機(jī)場(chǎng)會(huì)增加人臉識(shí)別的登機(jī),包括廈門碼頭,你去鼓浪嶼必須做人臉識(shí)別,包括未來做長(zhǎng)途汽車,這些領(lǐng)域都會(huì)通過人臉識(shí)別技術(shù)的引入,讓整個(gè)生活變得更安全。
開始我們也做了剛才魏總講的 2B 的場(chǎng)景,這兩年我們開始在家電領(lǐng)域引入人工智能的技術(shù),比如我們跟美的合作開發(fā)了智能空調(diào)的產(chǎn)品,現(xiàn)在已經(jīng)開始在賣場(chǎng)做銷售。你可以通過手勢(shì)、語音可以讓空調(diào)更智能的感知人的喜好,這是潛移默化的對(duì)生活的影響。我們?nèi)馂橹悄茏龅母氐氖?AI+零售的應(yīng)用,現(xiàn)在在很多門店,特別是在北上廣深很多門店逛街的時(shí)候,我們攝像頭已經(jīng)在分析你的喜好,包括分眾的媒體已經(jīng)有我們的一些攝像頭,這些已經(jīng)在間接的潛移默化的改變我們的生活方式。這是我做的一點(diǎn)補(bǔ)充。
梅濤:謝謝詹總,基本上你們會(huì)讓我們購(gòu)物非常方便,也方便了商家。最后是任總,談一談你的看法。
任鵬:剛才兩位老總還介紹了我們公司。我們做的確實(shí)對(duì)大家當(dāng)前的出行帶來很多方便,現(xiàn)在停車場(chǎng)的進(jìn)出就已經(jīng)很方便了。其實(shí)還有一些很簡(jiǎn)單的,大家已經(jīng)感覺不到的其實(shí)對(duì)生活改變更大。我想問大家每天會(huì)掃幾次碼?這是非常簡(jiǎn)單的計(jì)算機(jī)視覺技術(shù)的應(yīng)用,里面的關(guān)鍵在于它的準(zhǔn)確度,如果人臉識(shí)別真的像山老師講的那樣,準(zhǔn)確度達(dá)到百萬分之一的時(shí)候,對(duì)大家的改變就完全不一樣了。一個(gè)技術(shù)要改變生活,還是在于這個(gè)技術(shù)的成熟度。如果不是走這個(gè)方向,可能會(huì)在娛樂方面,比如說在游戲方面改變生活。我們走的是工業(yè)化的路線,比如說安防的應(yīng)用、工業(yè)自動(dòng)化的應(yīng)用,對(duì)算法的準(zhǔn)確度要求是非常高的?,F(xiàn)在隨著技術(shù)的發(fā)展,我相信我們技術(shù)的改變對(duì)大家生活的影響,可能不知不覺中大家的習(xí)慣就改變了,還不知道這是因?yàn)橛?jì)算機(jī)視覺的改變。
梅濤:謝謝任總,謝謝五位嘉賓的講解。我自己感覺剛才問的問題比較簡(jiǎn)單,我是比較喜歡提一些難的問題的,我對(duì)剛才問題的解答不夠滿意,因?yàn)樗麄冊(cè)谧兿嘧鰪V告(現(xiàn)場(chǎng)笑),所以我接下來的問題稍微難一點(diǎn)。問題沒有變,我想問大家,你覺得計(jì)算機(jī)視覺能夠改變生活的哪個(gè)方面呢?但是得是除了你們業(yè)務(wù)以外的方面。把這個(gè)問題先提給詹總。
詹東暉:您的意思是在我們業(yè)務(wù)范圍之外。
梅濤:對(duì),這才是真心話。
詹東暉:我覺得人工智能對(duì)生活的影響,這個(gè)趨勢(shì)肯定是必然的,只不過我們看它是在五年之內(nèi)、十年之內(nèi)能夠多深地改變我們的生活。我可能偏悲觀一些,在我們能看到的眼前三到五年時(shí)間,我覺得還不會(huì)給我們帶來很大的變化,比如說機(jī)器人,雖然現(xiàn)在機(jī)器人很火,但之前看起來很傻萌的機(jī)器人有沒有用處?好像沒有什么用處。
梅濤:大家可以看到,我第二個(gè)問題把他真心話問出來了。(笑聲+掌聲)
詹東暉:對(duì),我認(rèn)為還需要蠻長(zhǎng)的一條路,在技術(shù)上面做更多突破和革新。剛才任總說到,對(duì)人臉識(shí)別來講,客觀來講,我們不吹牛的話,它還是能夠達(dá)到非常高的精準(zhǔn)度,能不能把人臉識(shí)別作為唯一的取款方式,未來三到五年是不可能的。我們講陽(yáng)光大道的同時(shí),其實(shí)還是有很多挑戰(zhàn)存在的。
梅濤:這一點(diǎn)我深為贊同,謝謝詹總。誰自告奮勇第二個(gè)來講一講你的真心話。
趙京雷:這個(gè)問題非常有挑戰(zhàn)。對(duì)大部分視覺公司來說是有需求,然后賣技術(shù)。我覺得這是我們要思考的問題,我們成立一個(gè)公司,80% 是不做得,10% 或者 20% 要專注做這個(gè)才可以,首先要看我們專注的點(diǎn)是什么,我們?cè)谝曈X上面,但是不代表我們不具備其他的能力,比如說 FDDB、LFW 技術(shù)我們公司目前排第一,我們也可以解決很多安防問題、金融問題等等,和人相關(guān)的東西我們都可以解決,但是有所為、有所不為,我們目前主要關(guān)注怎么思考山老師講的刷臉。
刷臉講了這么多年,在消費(fèi)級(jí)范圍內(nèi)怎么能夠成為現(xiàn)實(shí),有沒有具備創(chuàng)新性的產(chǎn)品出來,所以我們更多是基于對(duì)這個(gè)核心技術(shù)自己去做一些創(chuàng)新性的產(chǎn)品,希望能夠做一些能夠改變行業(yè)的產(chǎn)品,而不是做大家都能解決了的問題,解決不了的問題是大家沒有好思路,我們希望從自己意愿而言尋找這些思路和尋找方法,不是喊兩三年,大家針對(duì)這個(gè)問題一直停留在這個(gè)狀態(tài),這是我們?nèi)プ龅?。反過來,某種意義上講,如果大部分人都能解決的問題我們不太會(huì)去做。如果問題很強(qiáng),比如說在識(shí)別里面,怎么能夠在未來普及,怎么樣成為人人可用的技術(shù),不只是掌握在政府、只是掌握在少數(shù)人手里的技術(shù),我們希望更多的做這樣一些事情。
梅濤:謝謝。魏總,你有什么高見?
魏京京:剛才都說了一些虛話,現(xiàn)在說實(shí)在話。說心里話,從一開始我們做這個(gè)行業(yè),從三年前到現(xiàn)在為止,我們對(duì)人工智能和這項(xiàng)技術(shù)的理解并沒有像外面媒體宣傳的那么酷、那么炫、那么反人類,它只是對(duì)軟件技術(shù)的爆發(fā)而已,對(duì)我們生活或者行業(yè)的改變,我覺得是潤(rùn)物細(xì)無聲的改變。上一個(gè)潮流是在講互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng),互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的特點(diǎn)是爆發(fā)力度非常強(qiáng),爆發(fā)出來的時(shí)間點(diǎn)非常短,比如說共享單車等等互聯(lián)網(wǎng)的產(chǎn)品。在人工智能這個(gè)產(chǎn)品,你希望在一年兩年或者三年五年有更新?lián)Q代變革的東西不太可能,不管在產(chǎn)業(yè)過程還是在我們生活過程中,它只是一個(gè)輔助手段,只不過把我們?cè)瓉碚J(rèn)為比較難被智能化的東西逐步開始智能化,但是這個(gè)過程也是非常緩慢或者非常逐步的。
我們給客戶做產(chǎn)品,一開始不是把所有東西都顛覆掉,只是在某一個(gè)環(huán)節(jié)能夠幫你節(jié)省人力、金錢或者時(shí)間效率,說實(shí)在話,這個(gè)東西沒有那么高大上,也沒有那么反人類,只是這個(gè)時(shí)間點(diǎn)出來一個(gè)很好的技術(shù),給它插上一個(gè)翅膀,在每個(gè)行業(yè)慢慢顯現(xiàn)出它的價(jià)值。所以,這個(gè)行業(yè)的周期應(yīng)該比互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)長(zhǎng)非常長(zhǎng)的時(shí)間,我看好十年、二十年之后可以在技術(shù)革新和產(chǎn)業(yè)進(jìn)步方面發(fā)揮更大的作用。
梅濤:魏總說了很多真心話,至少是有希望的。任總呢?
任鵬:我講一個(gè)改變生活的場(chǎng)景,我們也想做,但是技術(shù)還達(dá)不到。比如今天這個(gè)會(huì)場(chǎng),如果安防領(lǐng)域的技術(shù)能識(shí)別出在場(chǎng)的每一位是誰,這會(huì)兒在講什么話,我覺得這個(gè)場(chǎng)景會(huì)對(duì)大家的生活有非常大的改變。
梅濤:你想干嘛?(現(xiàn)場(chǎng)笑)
任鵬:我們想做,但是這個(gè)比較有難度、比較有挑戰(zhàn),受限于當(dāng)前的技術(shù)。
梅濤:比如你知道各位的知識(shí)文化水平、受眾面,可能今天講得會(huì)不一樣。
任鵬:簡(jiǎn)單一點(diǎn),有點(diǎn)像上帝。做技術(shù)的可能會(huì)有這樣的想法和追求,但是實(shí)際上他對(duì)生活的改變可能是負(fù)面的,沒有隱私了,也有可能有的人的工作會(huì)失去,但是這種發(fā)展是擋不住的。
梅濤:謝謝任總,最后有請(qǐng)我們最小的公司的山總。(現(xiàn)場(chǎng)笑)
山世光:我想跳出來計(jì)算機(jī)視覺講整個(gè) AI 領(lǐng)域。這次大家注意到搜狗同傳這件事情,還是蠻有意思的,中文不太好,但是對(duì)英文,包括同傳比較好,包括今天聽醫(yī)療那邊講的,不用聽英語,看中文基本上能理解是什么意思。像這樣一個(gè)技術(shù)不是說多么成熟,但是如果不去用,更加不能走向我們的日常生活。對(duì)計(jì)算機(jī)視覺來說,需要比語音識(shí)別還要更晚一點(diǎn),這是一個(gè)必然的現(xiàn)象,因?yàn)檎Z音識(shí)別的好處是識(shí)別完以后變成文本,變成文本就有語義,直接可以跟互聯(lián)網(wǎng)掛鉤,這對(duì)計(jì)算機(jī)視覺來說,大多數(shù)場(chǎng)景里面我們看到圖像里面精確的語義比較少,我們希望把圖像里面盡可能多的語義盡可能精確地提取出來。當(dāng)盡可能多的語義被提取出來以后,后面是有很多空間可以做的,但是相比語音識(shí)別我覺得會(huì)晚蠻久。如果不是人臉識(shí)別,還有很多,計(jì)算機(jī)視覺一定是潤(rùn)物細(xì)無聲的作用。
如果非要說計(jì)算機(jī)視覺,最廣泛的應(yīng)用就是在鼠標(biāo)領(lǐng)域。大家知道光學(xué)鼠標(biāo)的原理,就知道光學(xué)鼠標(biāo)在移動(dòng)過程中是通過圖像匹配做移動(dòng)位置的檢測(cè)的,大家天天都在用計(jì)算機(jī)視覺的產(chǎn)品,但是大家不覺得它是計(jì)算機(jī)視覺的產(chǎn)品。很多時(shí)候計(jì)算機(jī)視覺產(chǎn)品往往是錦上添花,潤(rùn)物細(xì)無聲,你沒有感覺的時(shí)候讓你體會(huì)到技術(shù)給你帶來的好處。在醫(yī)療方面我非??春茫矣X得未來自動(dòng)這件事情很快會(huì)超過中國(guó)平均以上醫(yī)生的水平,對(duì)醫(yī)療的改變會(huì)非常大,當(dāng)然政策上的原因,如果政策能夠突破,這是非常大的改變。
梅濤:剛才問這個(gè)問題我是希望大家能夠發(fā)散思維想一想,也許十年、二十年后大家可以去那個(gè)方向創(chuàng)業(yè)。
接下來的問題,請(qǐng)?jiān)试S我作為主持人再問最后一個(gè)問題,待會(huì)兒大家可以準(zhǔn)備一些非常難的問題。下一個(gè)問題很簡(jiǎn)單,我想問大家,因?yàn)榇蠹覄?chuàng)業(yè)好幾年,踩過很多坑,我們?cè)谖④涀霎a(chǎn)品、做研發(fā)的時(shí)候也遇到好多坑,我想問大家,你覺得人工智能技術(shù)在落地過程中最大的難點(diǎn)是什么?希望大家簡(jiǎn)潔明了的告訴我們你遇到的難點(diǎn)是什么,你覺得這個(gè)難點(diǎn)應(yīng)該朝哪個(gè)方向解決?
任鵬:我覺得最大的難點(diǎn)是閉環(huán)。這個(gè)閉環(huán)是指什么呢?市場(chǎng)的需求和當(dāng)前的技術(shù)能達(dá)到的水平的閉環(huán)。做這個(gè)產(chǎn)品的時(shí)候,作為一個(gè)創(chuàng)業(yè)公司,你能把握的影響產(chǎn)業(yè)鏈的閉環(huán),比如說取得數(shù)據(jù),以數(shù)據(jù)來驅(qū)動(dòng),當(dāng)前產(chǎn)品的結(jié)果和客戶市場(chǎng)的需求還有差距,你反過來怎么迭代?所以這個(gè)閉環(huán)是非常關(guān)鍵的。
舉個(gè)例子,安防行業(yè),08 年我們剛剛開始創(chuàng)業(yè)的時(shí)候,客戶提了這樣一個(gè)需求,你們的算法能不能把場(chǎng)景里面的人、車都識(shí)別出來?過了九年,當(dāng)前的技術(shù)是可以解決了,但是要批量化成本很高,客戶會(huì)不接受這個(gè)東西,他想的是,你們能不能把這個(gè)東西識(shí)別出來,又很便宜。所以,這個(gè)閉環(huán)是很難的,做產(chǎn)品的時(shí)候就有很多需要取舍和平衡的東西,要去平衡你的功能、性能,滿足客戶的指標(biāo)、期望,最后在產(chǎn)品設(shè)計(jì)和成本相關(guān)的這些方面,其實(shí)一個(gè)核心就是閉環(huán)。
梅濤:任總認(rèn)為閉環(huán)是一個(gè)難點(diǎn)。詹總呢?
詹東暉:我也同意任總的說法,閉環(huán)是一個(gè)難點(diǎn),對(duì)商業(yè)場(chǎng)景來說,對(duì)人工智能的需求是存在的,但是為什么這么多年沒有什么應(yīng)用?最根本的原因是技術(shù),這兩年比較火,因?yàn)樯疃葘W(xué)習(xí)的引入讓技術(shù)的性能上達(dá)到一個(gè)跳躍,我們發(fā)現(xiàn)很多場(chǎng)景似乎具備了可應(yīng)用的基礎(chǔ),這距離人工智能要達(dá)到的目標(biāo)是有差距的,但是不意味著不可用。如何讓這個(gè)技術(shù)和用戶需求達(dá)到一個(gè)平衡,這是一個(gè)難點(diǎn)。
另外,剛才提到深度學(xué)習(xí),深度學(xué)習(xí)是一個(gè)很消耗處理資源的技術(shù),很多時(shí)候一個(gè)問題是如何在一種低成本、高性價(jià)比的方案里面去實(shí)現(xiàn)。你可能做出一個(gè)很牛的識(shí)別相機(jī),但是成本要 2 萬塊錢,這個(gè)相機(jī)可能就基本上沒有辦法銷售和商用。
舉個(gè)例子,我們?cè)谧?AI 放到零售的時(shí)候,做了快四年才推出第一代產(chǎn)品。從算法上來看,我們并沒有做太大的革新,這三四年都在做它的落地。從最開始很復(fù)雜的系統(tǒng),要前端相機(jī)、后端服務(wù)器,那時(shí)候成本要大幾千塊錢、一兩萬塊錢,做到現(xiàn)在可以很低的成本,一兩個(gè)很小的攝像頭,可以完全不依賴網(wǎng)絡(luò)和云端,可以做復(fù)雜的智能學(xué)習(xí)的算法的實(shí)現(xiàn),我們花了四年時(shí)間。因?yàn)檫@四年時(shí)間的投入,達(dá)到這樣一個(gè)落地化的產(chǎn)品,才使它具備開始規(guī)模的在商業(yè)應(yīng)用的情況。我覺得這里面很大的挑戰(zhàn)在于,算法本身已經(jīng)不是一個(gè)最主要的維度了,而是看怎么做落地化。
梅濤:關(guān)于落地化我自己感觸很深,因?yàn)槲医?jīng)常遇到客戶,客戶經(jīng)常提出無理的要求,客戶說你能不能識(shí)別人臉做到 5 個(gè) 9、6 個(gè) 9?我說我可以識(shí)別出來黃曉明,但是識(shí)別不出來梅濤,這是兩個(gè)不一樣的場(chǎng)景。
魏京京:觀點(diǎn)基本類似,我們創(chuàng)業(yè)過程中最大的一個(gè)難點(diǎn)是怎么從飄在天上落到地下,因?yàn)橐曈X這個(gè)領(lǐng)域基本上是很高的技術(shù)壁壘或者帶著技術(shù)光環(huán)創(chuàng)業(yè),否則做不了這個(gè)事情。通常是以我為主,客戶圍繞我來轉(zhuǎn),我們也犯了這個(gè)錯(cuò)誤,我們產(chǎn)品設(shè)計(jì)的時(shí)候以我為主,這是技術(shù)背景的公司很容易犯的問題。
我們慢慢從飄在天上到接受現(xiàn)實(shí)落到地下,跟之前兩位的理解是差不多的意思,最關(guān)鍵的不是你有什么技術(shù),而是你把已有的技術(shù)跟他的痛點(diǎn)結(jié)合,這個(gè)問題不是技術(shù)的問題,基本上就是商業(yè)問題。你要做商業(yè)閉環(huán),同時(shí)要跟已有的環(huán)節(jié)有合適的商業(yè)產(chǎn)品的設(shè)計(jì),這個(gè)需要付出的努力不是做技術(shù)的來做的,而是你要接地氣,圍著客戶做討論、設(shè)計(jì)和服務(wù),讓他慢慢接受你,這是很痛苦的,也是我們做技術(shù)創(chuàng)業(yè)需要轉(zhuǎn)換的地方。我原來也做過投資,看過很多以技術(shù)為背景的創(chuàng)業(yè)公司,這是很容易犯的一個(gè)問題。
梅濤:謝謝魏總,魏總說出很重要的一點(diǎn),要服務(wù)客戶,要理解他的需求,要整天圍著客戶轉(zhuǎn)。(現(xiàn)場(chǎng)笑)
趙京雷:非常同意前面幾位嘉賓的觀點(diǎn),這確實(shí)反映了技術(shù)創(chuàng)業(yè)遇到的比較大的難點(diǎn)或者痛點(diǎn)。從我們自身而言也是這樣,可以歸納為兩點(diǎn):第一點(diǎn),怎么樣管理客戶的期望,不一定是用戶的期望,因?yàn)榇蟛糠质?2B 的??赡苁芎芏嗝襟w或者各方面的宣傳,如果不是做技術(shù)這個(gè)行業(yè)的,總是對(duì) AI 能做的事期望太高了,不管是普通的小機(jī)器人或者對(duì)視覺技術(shù)期望太高,經(jīng)常有各種各樣的公司找過來說,我有這樣的需求,你能不能做。
第二點(diǎn),計(jì)算機(jī)視覺不是萬能的,比如說我們一般說的視覺是 RGB,計(jì)算機(jī)視覺這兩年進(jìn)步很大,在 RGB 普通鏡頭下,光線、角度各方面都有了比較大的進(jìn)步,但是現(xiàn)在的技術(shù)發(fā)展的情況還不是所有問題都能解決。跟客戶解決的問題可能依賴計(jì)算平臺(tái),依賴整個(gè)體系的聯(lián)合優(yōu)化,比如說有很多場(chǎng)景的客戶找到我們說,能不能幫我們做一件事,我們會(huì)問他,這個(gè)事情晚上要不要做?晚上要做。他是拿普通攝像頭,補(bǔ)光的時(shí)候,這是消費(fèi)級(jí)的,你又不能拿燈去補(bǔ)光,這種情況怎么去管理,和客戶一起去梳理行業(yè)碰到的這樣一些需求,然后把它抽象出來,怎么樣用最好的芯片、最好的后臺(tái)系統(tǒng)結(jié)合算法一起去做,其實(shí)算法一定不是孤立的。
梅濤:謝謝趙總,其實(shí)我也很贊同,因?yàn)槲野l(fā)現(xiàn)用戶需求和期望有兩種,一種是用戶沒有期望到你算法能做到這一步,另外是用戶覺得這么低的要求算法做不到,其實(shí)用戶需要引導(dǎo)。
山世光:其實(shí)我特別不想同意他們幾位的觀點(diǎn),但是在是沒有辦法不同意。(現(xiàn)場(chǎng)笑)我就不重復(fù)了,但是我的觀點(diǎn)是,最大的障礙還是技術(shù)不完美。我們所謂的技術(shù)完美,當(dāng)然我們希望「快、準(zhǔn)、穩(wěn)」??焓请S便找一個(gè)很爛的芯片就可以做;準(zhǔn)是什么情況下都能工作;穩(wěn)是不會(huì)出現(xiàn)差錯(cuò),這樣落地和閉環(huán)就不會(huì)出現(xiàn)難題了,但是我們現(xiàn)在真的做不到。比如剛才說的萬分之一,很多時(shí)候是達(dá)不到的,比如變換場(chǎng)景,晚上你非要用普通的攝像頭就是做不到,沒有辦法。我覺得真的還是技術(shù)上不完美,這也是這個(gè)領(lǐng)域并沒有到非常非常完美的馬上可以四處用的階段,在這個(gè)階段最難的是怎么去找到客戶的需求和技術(shù)的邊界能夠結(jié)合的應(yīng)用,再配合上其他的一些條件,能夠滿足用戶的需求。剛才幾位說得都對(duì),技術(shù)不完美還是一個(gè)很大的障礙。
梅濤:其實(shí)我覺得不完美有時(shí)候也是一種完美,正因?yàn)椴煌昝浪晕覀冇泻芏鄼C(jī)會(huì)。
山世光:對(duì),上帝也不完美。
梅濤:謝謝大家。接下來把時(shí)間留給在座到場(chǎng)的聽眾,不知道有沒有非常難的問題?
聽眾:我想問一個(gè)很具體的問題,關(guān)于圖像識(shí)別領(lǐng)域的競(jìng)爭(zhēng)差異化的問題?,F(xiàn)在有一種說法,在人臉識(shí)別、醫(yī)療讀圖領(lǐng)域,行業(yè)里面這兩個(gè)領(lǐng)域主要的公司用的技術(shù)都非常像,有人就說現(xiàn)在這些領(lǐng)域的發(fā)展變成不是拼技術(shù),而是拼市場(chǎng),去跑馬圈地,去融資和燒錢,不知道對(duì)這種情況臺(tái)上各位老總怎么看?
魏京京:你剛才提到圖像識(shí)別視覺差異化的問題。每家從圖像識(shí)別本身來說,從技術(shù)到落地中間的環(huán)節(jié)非常多,并不代表有圖像識(shí)別技術(shù)就既能在醫(yī)療領(lǐng)域做,又能在營(yíng)銷領(lǐng)域做,又能在工業(yè)領(lǐng)域做,差的十萬八千里,這中間是顯現(xiàn)每家公司技術(shù)核心競(jìng)爭(zhēng)力的。你要有技術(shù)落地,需要找數(shù)據(jù)源、找他的痛點(diǎn),同時(shí)把商業(yè)閉環(huán)做好,不代表我直接說一個(gè)故事就有人給你錢,你就把這個(gè)事做成,中間的過程還是非常復(fù)雜的。我們做很多細(xì)分領(lǐng)域,每個(gè)細(xì)分領(lǐng)域少則半年,多則一年到一年半,中間需要打磨的東西非常多。
圖像識(shí)別雖然是有技術(shù)的通用性,但是到細(xì)分行業(yè)需要做的事情非常多,這個(gè)事情不僅僅是技術(shù)問題,技術(shù)只占 1/10 甚至更少的環(huán)節(jié),因?yàn)闄C(jī)器學(xué)習(xí)的原理邏輯帶來技術(shù)壁壘本身不是特別高,很多時(shí)候需要你把商業(yè)的東西完備的提供給客戶,這是商業(yè)要做的事情,也是我們公司創(chuàng)業(yè)要做的事情。我們不是做學(xué)術(shù),是真正做一個(gè)人家愿意買單的東西,要把這個(gè)價(jià)值鏈條梳理的更加清晰一點(diǎn)。
詹東暉:我簡(jiǎn)單補(bǔ)充一下,我很同意,我的觀點(diǎn)是不會(huì)有所謂純粹的 AI 公司,AI 只是一個(gè)技術(shù),對(duì)于我們?cè)谧膸孜粊碚f也只是 AI 的創(chuàng)業(yè)者,每個(gè)人可能會(huì)選擇不同的落地行業(yè)、落地跑道。未來可能有人做安防,說誰是在安防領(lǐng)域做的最好的 AI 公司、誰是零售領(lǐng)域做的最好的 AI 公司。單純的計(jì)算機(jī)視覺技術(shù)的壁壘,對(duì)做得好的公司來講,這個(gè)壁壘越來越?jīng)]有差異化,做得好的就是看誰跑得更快,能夠更快讓技術(shù)和產(chǎn)品落到行業(yè)里面去,更深的鋪到這個(gè)行業(yè),構(gòu)建一個(gè)更完整的行業(yè)壁壘,這可能會(huì)是一個(gè)更重要的地方。
趙京雷:我覺得這是一個(gè)蠻重要的問題,所以我補(bǔ)充兩句。其實(shí)大部分人都會(huì)問到這個(gè)問題,這家也在做、那家也在做,為什么還要做這一塊?我覺得這個(gè)事情分兩個(gè)階段,一個(gè)階段是人工智能技術(shù)底層還不是非常成熟,我們?cè)谧?AI 底層基礎(chǔ)設(shè)施鋪墊的階段,這個(gè)階段不像大家想象的那樣,比如說我們有開源的框架,把不同算法寫上去,大家跑出來的東西是一樣的。如果是這樣,F(xiàn)acebook 和 Google 這樣的大公司就不用收購(gòu)這種基礎(chǔ)性的公司了。像剛才魏總談到了,每一個(gè)單項(xiàng)技術(shù)成熟在不同領(lǐng)域、某一個(gè)點(diǎn)成熟,在這個(gè)結(jié)點(diǎn)需要至少一年半到兩年的時(shí)間,比如說一家公司從無到有的模型上做,第一個(gè)是在云端能不能部署,在前端能不能部署,肯定需要一年半到兩年的優(yōu)化過程。
我覺得在這個(gè)階段,人工智能基礎(chǔ)設(shè)施快速落地的階段,不同公司的技術(shù)差異非常大,但是如果過了這個(gè)階段,我非常同意剛才談到的,這些技術(shù)不是絕對(duì)的壁壘,一年能算什么呢?未來人工智能的場(chǎng)合里面一年可能就是一瞬間,所以這里面技術(shù)肯定不是壁壘。那什么是壁壘?剛才各位已經(jīng)談到應(yīng)用領(lǐng)域,我覺得主要就是產(chǎn)品。像移動(dòng)互聯(lián)網(wǎng)早期那樣,基礎(chǔ)設(shè)施和運(yùn)營(yíng)商很早出現(xiàn),最終是什么樣的東西把不同的做這一塊的公司區(qū)分開來?一定是產(chǎn)品。比如說蘋果是爆品,iPhone 出來了。其實(shí)人工智能現(xiàn)在缺少爆品。有一些公司,不管做什么領(lǐng)域,能從這個(gè)領(lǐng)域里面把自己的爆品打造出來,我覺得這就是未來 AI 公司本質(zhì)的差異化所在的點(diǎn)。
梅濤:謝謝趙總。由于時(shí)間關(guān)系,可以再來一個(gè)問題。
聽眾:這個(gè)問題想請(qǐng)問一下山老師,剛才講到表情識(shí)別,識(shí)別表情到底干什么?我們是做行業(yè)應(yīng)用的,在行業(yè)里面的服務(wù)人員的微笑有一定的要求,微笑是比較簡(jiǎn)單的事情,我的想法是通過這個(gè)表情我們?cè)诤笈_(tái)再進(jìn)行一些深度的應(yīng)用挖掘,比如說他的績(jī)效,企業(yè)可以根據(jù)這個(gè)做員工的關(guān)懷,這種勞動(dòng)強(qiáng)度可能比較高,在后端進(jìn)行進(jìn)一步的挖掘,我想請(qǐng)教您的看法。
山世光:這是蠻好的問題。我覺得對(duì) AI 感知人本身,除了認(rèn)出他,還要了解他的意圖和情感,這一點(diǎn)是非常非常重要的。我們能夠想到有很多可以落地的應(yīng)用,比如說風(fēng)控,當(dāng)然我不能做測(cè)謊,但是可以做情緒的感知。我可以做教育上的評(píng)估,比如說小孩在上學(xué)過程中的專注度、接受度等等這些方面,都是可以去做的。當(dāng)然其實(shí)大家已經(jīng)看到笑臉快門這些非常普遍的錦上添花的應(yīng)用。另外一種是跟疾病、健康相關(guān)的,其實(shí)是泛情緒、泛情感的這部分,通過估計(jì)心率,不知道未來是不是存在這樣的可能性,可以測(cè)血糖、血壓,以前覺得技術(shù)上難度太大,現(xiàn)在看來其實(shí)都有可能,不是不能做。一旦當(dāng)非接觸式的通過視頻方式可以做,我相信可以帶來非常非常多的應(yīng)用。
梅濤:謝謝山老師。最后一個(gè)問題,我代表雷鋒網(wǎng)來提問,請(qǐng)各位嘉賓展望一下未來五年計(jì)算機(jī)視覺的發(fā)展方向,以及未來五年你覺得哪個(gè)方面可以更加深入我們的生活,哪些計(jì)算機(jī)視覺技術(shù)可以更加滲透我們的生活,給我們帶來更多便利?
任鵬:未來五年,我覺得傳感器技術(shù)會(huì)變,深度的傳感器可能會(huì)普及。多種數(shù)據(jù)源的融合,不只是視覺,多種數(shù)據(jù)源融合結(jié)合成產(chǎn)品解決問題,這種情況會(huì)越來越多。這是技術(shù)層面的。
當(dāng)然,算法也好,芯片、計(jì)算資源也好,肯定要符合摩爾定律,五年以后我覺得不會(huì)是瓶頸。因?yàn)槭昵拔易龅氖窃鰪?qiáng)現(xiàn)實(shí) AR,我覺得下一個(gè)五年增強(qiáng)現(xiàn)實(shí)會(huì)越來越普及。
梅濤:你認(rèn)為是增強(qiáng)現(xiàn)實(shí)。
詹東暉:我覺得未來五年工業(yè)視覺這一塊會(huì)有比較大的突破,因?yàn)槟壳斑@一塊不僅問題很多,而且市場(chǎng)剛需很大。另外,山老師提到 AI+醫(yī)療,醫(yī)療領(lǐng)域引入 AI 可以很大改變醫(yī)療的現(xiàn)狀。
魏京京:我們也是做工業(yè)設(shè)計(jì)的,非常同意詹總的觀點(diǎn)。我覺得分兩方面,第一方面是未來五年會(huì)有一大波機(jī)器替代人的過程,包括工業(yè)視覺的制造環(huán)節(jié)和服務(wù)環(huán)節(jié),很多 AI 算法會(huì)集成到產(chǎn)品里面把人的工作替代掉,這是不可逆轉(zhuǎn)、必然要形成的。另外一個(gè),現(xiàn)在 AI 算法比較重,后面有大批量服務(wù)器支撐,所以后面的趨勢(shì)是輕量化,輕量化到我們家庭和身邊,讓更多能夠觸碰到的功能帶到我們面前。一方面是我們后面看不見的很多人會(huì)被替代,另外是我們中間會(huì)出來很多大家比較驚訝的智能化產(chǎn)品。
趙京雷:我覺得未來幾年對(duì)人類生活影響非常大的計(jì)算機(jī)視覺的應(yīng)用,一定來自于受眾最廣的領(lǐng)域。哪個(gè)領(lǐng)域最廣?一定是手機(jī)。未來五年什么樣的視覺產(chǎn)品會(huì)成為爆品?大家只要看蘋果一代一代的會(huì)加什么樣的視覺功能就可以了。如果加刷臉,那刷臉就是爆品,人人都會(huì)刷臉,所有硬件都會(huì)通過刷臉去登錄。所以未來很簡(jiǎn)單,看蘋果這樣一些產(chǎn)品行業(yè)的大師怎么去思考視覺,在對(duì)人類生活影響最廣的領(lǐng)域的構(gòu)思。
山世光:我覺得是醫(yī)療,因?yàn)獒t(yī)療真的非常非常重要,每個(gè)人都會(huì)涉及到去醫(yī)院做檢查的問題,所以我覺得醫(yī)療肯定是非常大的一個(gè)市場(chǎng)。另外一個(gè)就是自動(dòng)駕駛,我不知道大家看不看好,我自己還是覺得未來五年里面,至少輔助的駕駛系統(tǒng)會(huì)逐漸進(jìn)入到幾乎所有的車上去,這會(huì)給大家?guī)砩顟B(tài)度、生活方式的變化,我相信一定會(huì)帶來。當(dāng)然,五年之后是不是真的全自動(dòng)駕駛不好說,全自動(dòng)駕駛在一些封閉的環(huán)境下面、可以拿到高精地圖的場(chǎng)景下面,我相信也是有非常大可能性的,所以我還是非??春眠@種。而且我相信自動(dòng)駕駛領(lǐng)域里面,視覺 Camera 這種方式應(yīng)該會(huì)超越雷達(dá)的方式,使得它能夠更快或者更有可能普及。
梅濤:謝謝世光,世光認(rèn)為自動(dòng)駕駛是下一個(gè)五年的熱點(diǎn)。我們的圓桌討論非常成功,再次感謝五位嘉賓的參與。其實(shí)人工智能離我們很近,計(jì)算機(jī)視覺離我們也很近,未來離我們并不遙遠(yuǎn),將來我們可以想象將來身邊圍繞各種各樣的機(jī)器人,醫(yī)療機(jī)器人、無人駕駛機(jī)器人、看護(hù)機(jī)器人、情感機(jī)器人,我們?nèi)祟悤?huì)變得更加聰明還是更加懶惰,我不知道,但是不管未來怎么發(fā)展,我們?nèi)诉€是會(huì)來到這個(gè)會(huì)場(chǎng),面對(duì)面的具有感情色彩的深入交流。感謝雷鋒網(wǎng),感謝 CCF。
以上為雷鋒網(wǎng)整理的圓桌全文,更多資訊請(qǐng)關(guān)注雷鋒網(wǎng)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章