CV+圓桌對話：算法不是唯一考量，創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

本文作者：奕欣

2017-07-15 15:18

專題：GAIR 2017

導(dǎo)語：雖然大會已經(jīng)接近尾聲，但現(xiàn)場依然座無虛席，觀眾們也幸運地看到了六位大牛時而輕松愉快、時而嚴肅認真的討論。

7 月 9 日下午，由中國計算機學(xué)會（CCF）主辦，雷鋒網(wǎng)與香港中文大學(xué)（深圳）承辦的第二屆CCF－GAIR全球人工智能與機器人峰會，進行到最后一天，CV+專場的圓桌論壇作為本次大會的最后一個議程順利進行。圓桌討論的主題是，計算機視覺滲透生活。本次圓桌由微軟亞洲研究院資深研究員梅濤博士擔任主持人，他幽默但犀利的主持風(fēng)格博得現(xiàn)場陣陣掌聲。

參與本次圓桌的五位圓桌嘉賓包括：中科院計算所研究員、中科視拓董事長兼 CTO 山世光、閱面科技 CEO 趙京雷、圖麟科技 CEO 魏京京、瑞為智能 CEO 詹東暉以及臻識科技 CEO 任鵬。

雖然大會已經(jīng)接近尾聲，但現(xiàn)場依然座無虛席，觀眾們也幸運地看到了六位大牛時而輕松愉快、時而嚴肅認真的討論。

雷鋒網(wǎng)整理了本次圓桌的討論全文。

梅濤：今天我們圓桌的主題是「計算機視覺滲透生活」。為什么今天選擇這個主題？因為我們覺得計算機視覺已經(jīng)滲透到我們生活無處不在的地方，滲透這個詞英文是「permeate」。計算機視覺已經(jīng)在改變我們生活的方方面面，我們有必要探討一下計算機視覺到底在我們生活中能夠產(chǎn)生什么樣的影響以及怎么落地。

今天我們會邀請到五位嘉賓，剛才我用好奇心給每個人起了一個外號，如果不當請原諒。因為做科研，總是喜歡做一些很創(chuàng)新的事情。

第一個嘉賓，剛才山老師說公司最小，所以請他第一個上臺，給山老師起名字叫「X man」，因為山老師剛才講了很多「X」（雷鋒網(wǎng) AI 科技評論按：山世光博士的演講題目為《X 數(shù)據(jù)驅(qū)動的 Seeta 平臺與技術(shù)》）。有請山老師。第二位嘉賓我起了個名字叫「憂郁的男子」，歡迎趙京雷趙總。趙總是畢業(yè)于上海交通大學(xué)的人工智能博士，現(xiàn)在是閱面科技的 CEO。第三位嘉賓我起的名字叫「Cool Man」，有請圖麟科技 CEO 魏京京，他是我的師弟。第四位嘉賓我給他起的名字叫「風(fēng)一樣的男子」，因為他穿著黑衣服，像個黑衣人一樣，他就是瑞為智能的 CEO 詹東暉。詹東暉博士是瑞為智能的創(chuàng)始人兼總經(jīng)理，十一年在華為的經(jīng)歷，創(chuàng)立了瑞為智能。最后一位嘉賓我們叫「Cooler Man」，因為他看起來比我?guī)煹芨?，有請臻識科技的 CEO 任鵬。（現(xiàn)場笑聲+掌聲）

今天有幾個話題給各位嘉賓準備，在座來聽課的各位老師和朋友也可以提出你們的問題，通過雷鋒網(wǎng)的同事給我傳達一下。

第一個話題比較簡單一點，大家覺得計算機視覺對我們生活產(chǎn)生了什么影響？大家可以結(jié)合自己的生活講一講你們的體會，我們從最小的公司開始吧，山總。（現(xiàn)場笑聲）

山世光：我最近經(jīng)常在演講的時候問大家一個問題，你今年刷了幾次臉？我相信在今年也許你會刷三五次，明年搞不好得三十到五十次了。為什么這么說呢？因為人臉識別，就像剛才說的，在過去幾年時間里面是計算機視覺里面最快落地的一個技術(shù)。我自己做人臉識別，我就不說「之一」了，這個技術(shù)確實在不斷滲透到我們?nèi)粘Ｉ罾?，大家可以看到出行方面，比如說坐高鐵、飛機，機場需要刷身份證，驗證你這個技術(shù)是不是能應(yīng)用。包括接下來幾年，我們有大量公司采用人臉識別的技術(shù)做員工的考勤和門禁。這一代考勤門禁跟上一代不一樣，三四年前我們家旁邊的門禁考勤都是人過去，還是要看著屏幕做考勤，未來將會是無感的考勤，我相信人臉識別會越來越多的滲透到日常生活中去。人臉識別就像門和鎖的關(guān)系一樣，你需要進入到某一種狀態(tài)，有這個權(quán)限就可以驗證你是你，這是幾乎無處不在的場景。我就說一下人臉識別，后面還有很多空間可以說。

梅濤：謝謝山老師，山老師認為人臉有很多因素。

趙京雷：「憂郁的男子」這個名字特別貼切，因為我這一年馬上要開始駕照年審了，我已經(jīng)被抓拍三次了，馬上要開始去學(xué)習(xí)了。

對我而言，計算機視覺對我而言不能說是好的改變，但是對車牌的識別（很重要），每天我們開進去停車場，這種技術(shù)很成熟，已經(jīng)潛移默化了，我們已經(jīng)意識不到這種技術(shù)的存在了，包括臻識科技也在做這種技術(shù)。我們生活中類似車牌識別的技術(shù)大量存在了。跟車牌識別相關(guān)的 OCR 技術(shù)，包括手機里面各種各樣的貼圖、美顏。說到美顏，好像在座的女生不是很多，只要是女生，我覺得這已經(jīng)是必備的。很多技術(shù)我們每天意識不到它的存在，我覺得這更是標準的這些技術(shù)的成熟。

反過來，我們思考一個問題，比如說山老師剛才談到的人臉識別，包括馬云，包括很多公司，每天都在講刷臉，為什么把它叫做一種技術(shù)呢？從這個角度考慮，我認為這個技術(shù)反而是不成熟的。過幾年以后，我們再也不講刷臉，每天很正常，我上街買一個東西，不需要站在那里一刷，付一下款就可以了，這個時候技術(shù)會真正走向成熟。

CV+圓桌對話：算法不是唯一考量，創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

梅濤：謝謝趙總，人工智能帶來很多便利，但是需要人們更加的自律，希望趙總以后不要再憂郁了。接下來請魏總談一談計算機視覺給你生活帶來什么改變。

魏京京：人工智能給我?guī)砗芏嘟梃b，我們平常感受到人工智能的點非常少，比如說我們用 FaceU 這種產(chǎn)品，還是比較簡單化的產(chǎn)品。其實 2C 和 2B 我們看了很多，但是真正 2C 落地非常難，大部分公司都在做 2B 的業(yè)務(wù)，2B 是做我們正在做我們用到的東西。如果說視覺改變生活，現(xiàn)在這個階段是非常隱藏的，你是看不到的，在每一個商品的背后是大量的服務(wù)和技術(shù)在里面，只是你感覺不到。后續(xù)的發(fā)展會從后端延展到前端，我們用的東西會慢慢感覺到有視覺的東西在里面，這個時間還很長?，F(xiàn)在 2B 的業(yè)務(wù)我們做不過來，還有很多需要挖掘，2B 的爆發(fā)點還在后面，我非?？春煤罄m(xù)三五年視覺在我們生活中顯現(xiàn)出來，大的關(guān)鍵的應(yīng)用機會非常多，我們創(chuàng)業(yè)公司先做 2B 的事情，慢慢技術(shù)、場景、用戶行為習(xí)慣和付費習(xí)慣成熟之后慢慢會到前端。

梅濤：魏總的意思是你認為人工智能先從 2B 業(yè)務(wù)開始，然后慢慢滲透到生活。

魏京京：對，先從 2B 滲透到產(chǎn)品，慢慢滲透到前端，包括 2C 的產(chǎn)品和應(yīng)用會越來越多，這是創(chuàng)業(yè)公司和產(chǎn)業(yè)發(fā)展的大的機會。

梅濤：下面請詹總講一下人工智能的變化。

詹東暉：我覺得如果從人工智能對生活的影響，最直觀的還是臻識科技他們做的車牌識別，以后每次進出停車場不用取卡。我們四位都做人臉識別，大家感受很多的還是刷卡，未來很多機場會增加人臉識別的登機，包括廈門碼頭，你去鼓浪嶼必須做人臉識別，包括未來做長途汽車，這些領(lǐng)域都會通過人臉識別技術(shù)的引入，讓整個生活變得更安全。

開始我們也做了剛才魏總講的 2B 的場景，這兩年我們開始在家電領(lǐng)域引入人工智能的技術(shù)，比如我們跟美的合作開發(fā)了智能空調(diào)的產(chǎn)品，現(xiàn)在已經(jīng)開始在賣場做銷售。你可以通過手勢、語音可以讓空調(diào)更智能的感知人的喜好，這是潛移默化的對生活的影響。我們?nèi)馂橹悄茏龅母氐氖?AI+零售的應(yīng)用，現(xiàn)在在很多門店，特別是在北上廣深很多門店逛街的時候，我們攝像頭已經(jīng)在分析你的喜好，包括分眾的媒體已經(jīng)有我們的一些攝像頭，這些已經(jīng)在間接的潛移默化的改變我們的生活方式。這是我做的一點補充。

梅濤：謝謝詹總，基本上你們會讓我們購物非常方便，也方便了商家。最后是任總，談一談你的看法。

任鵬：剛才兩位老總還介紹了我們公司。我們做的確實對大家當前的出行帶來很多方便，現(xiàn)在停車場的進出就已經(jīng)很方便了。其實還有一些很簡單的，大家已經(jīng)感覺不到的其實對生活改變更大。我想問大家每天會掃幾次碼？這是非常簡單的計算機視覺技術(shù)的應(yīng)用，里面的關(guān)鍵在于它的準確度，如果人臉識別真的像山老師講的那樣，準確度達到百萬分之一的時候，對大家的改變就完全不一樣了。一個技術(shù)要改變生活，還是在于這個技術(shù)的成熟度。如果不是走這個方向，可能會在娛樂方面，比如說在游戲方面改變生活。我們走的是工業(yè)化的路線，比如說安防的應(yīng)用、工業(yè)自動化的應(yīng)用，對算法的準確度要求是非常高的。現(xiàn)在隨著技術(shù)的發(fā)展，我相信我們技術(shù)的改變對大家生活的影響，可能不知不覺中大家的習(xí)慣就改變了，還不知道這是因為計算機視覺的改變。

梅濤：謝謝任總，謝謝五位嘉賓的講解。我自己感覺剛才問的問題比較簡單，我是比較喜歡提一些難的問題的，我對剛才問題的解答不夠滿意，因為他們在變相做廣告（現(xiàn)場笑），所以我接下來的問題稍微難一點。問題沒有變，我想問大家，你覺得計算機視覺能夠改變生活的哪個方面呢？但是得是除了你們業(yè)務(wù)以外的方面。把這個問題先提給詹總。

詹東暉：您的意思是在我們業(yè)務(wù)范圍之外。

梅濤：對，這才是真心話。

詹東暉：我覺得人工智能對生活的影響，這個趨勢肯定是必然的，只不過我們看它是在五年之內(nèi)、十年之內(nèi)能夠多深地改變我們的生活。我可能偏悲觀一些，在我們能看到的眼前三到五年時間，我覺得還不會給我們帶來很大的變化，比如說機器人，雖然現(xiàn)在機器人很火，但之前看起來很傻萌的機器人有沒有用處？好像沒有什么用處。

梅濤：大家可以看到，我第二個問題把他真心話問出來了。（笑聲+掌聲）

詹東暉：對，我認為還需要蠻長的一條路，在技術(shù)上面做更多突破和革新。剛才任總說到，對人臉識別來講，客觀來講，我們不吹牛的話，它還是能夠達到非常高的精準度，能不能把人臉識別作為唯一的取款方式，未來三到五年是不可能的。我們講陽光大道的同時，其實還是有很多挑戰(zhàn)存在的。

梅濤：這一點我深為贊同，謝謝詹總。誰自告奮勇第二個來講一講你的真心話。

趙京雷：這個問題非常有挑戰(zhàn)。對大部分視覺公司來說是有需求，然后賣技術(shù)。我覺得這是我們要思考的問題，我們成立一個公司，80% 是不做得，10% 或者 20% 要專注做這個才可以，首先要看我們專注的點是什么，我們在視覺上面，但是不代表我們不具備其他的能力，比如說 FDDB、LFW 技術(shù)我們公司目前排第一，我們也可以解決很多安防問題、金融問題等等，和人相關(guān)的東西我們都可以解決，但是有所為、有所不為，我們目前主要關(guān)注怎么思考山老師講的刷臉。

刷臉講了這么多年，在消費級范圍內(nèi)怎么能夠成為現(xiàn)實，有沒有具備創(chuàng)新性的產(chǎn)品出來，所以我們更多是基于對這個核心技術(shù)自己去做一些創(chuàng)新性的產(chǎn)品，希望能夠做一些能夠改變行業(yè)的產(chǎn)品，而不是做大家都能解決了的問題，解決不了的問題是大家沒有好思路，我們希望從自己意愿而言尋找這些思路和尋找方法，不是喊兩三年，大家針對這個問題一直停留在這個狀態(tài)，這是我們?nèi)プ龅?。反過來，某種意義上講，如果大部分人都能解決的問題我們不太會去做。如果問題很強，比如說在識別里面，怎么能夠在未來普及，怎么樣成為人人可用的技術(shù)，不只是掌握在政府、只是掌握在少數(shù)人手里的技術(shù)，我們希望更多的做這樣一些事情。

梅濤：謝謝。魏總，你有什么高見？

魏京京：剛才都說了一些虛話，現(xiàn)在說實在話。說心里話，從一開始我們做這個行業(yè)，從三年前到現(xiàn)在為止，我們對人工智能和這項技術(shù)的理解并沒有像外面媒體宣傳的那么酷、那么炫、那么反人類，它只是對軟件技術(shù)的爆發(fā)而已，對我們生活或者行業(yè)的改變，我覺得是潤物細無聲的改變。上一個潮流是在講互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)，互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的特點是爆發(fā)力度非常強，爆發(fā)出來的時間點非常短，比如說共享單車等等互聯(lián)網(wǎng)的產(chǎn)品。在人工智能這個產(chǎn)品，你希望在一年兩年或者三年五年有更新?lián)Q代變革的東西不太可能，不管在產(chǎn)業(yè)過程還是在我們生活過程中，它只是一個輔助手段，只不過把我們原來認為比較難被智能化的東西逐步開始智能化，但是這個過程也是非常緩慢或者非常逐步的。

我們給客戶做產(chǎn)品，一開始不是把所有東西都顛覆掉，只是在某一個環(huán)節(jié)能夠幫你節(jié)省人力、金錢或者時間效率，說實在話，這個東西沒有那么高大上，也沒有那么反人類，只是這個時間點出來一個很好的技術(shù)，給它插上一個翅膀，在每個行業(yè)慢慢顯現(xiàn)出它的價值。所以，這個行業(yè)的周期應(yīng)該比互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)長非常長的時間，我看好十年、二十年之后可以在技術(shù)革新和產(chǎn)業(yè)進步方面發(fā)揮更大的作用。

梅濤：魏總說了很多真心話，至少是有希望的。任總呢？

任鵬：我講一個改變生活的場景，我們也想做，但是技術(shù)還達不到。比如今天這個會場，如果安防領(lǐng)域的技術(shù)能識別出在場的每一位是誰，這會兒在講什么話，我覺得這個場景會對大家的生活有非常大的改變。

梅濤：你想干嘛？（現(xiàn)場笑）

任鵬：我們想做，但是這個比較有難度、比較有挑戰(zhàn)，受限于當前的技術(shù)。

梅濤：比如你知道各位的知識文化水平、受眾面，可能今天講得會不一樣。

任鵬：簡單一點，有點像上帝。做技術(shù)的可能會有這樣的想法和追求，但是實際上他對生活的改變可能是負面的，沒有隱私了，也有可能有的人的工作會失去，但是這種發(fā)展是擋不住的。

CV+圓桌對話：算法不是唯一考量，創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

梅濤：謝謝任總，最后有請我們最小的公司的山總。（現(xiàn)場笑）

山世光：我想跳出來計算機視覺講整個 AI 領(lǐng)域。這次大家注意到搜狗同傳這件事情，還是蠻有意思的，中文不太好，但是對英文，包括同傳比較好，包括今天聽醫(yī)療那邊講的，不用聽英語，看中文基本上能理解是什么意思。像這樣一個技術(shù)不是說多么成熟，但是如果不去用，更加不能走向我們的日常生活。對計算機視覺來說，需要比語音識別還要更晚一點，這是一個必然的現(xiàn)象，因為語音識別的好處是識別完以后變成文本，變成文本就有語義，直接可以跟互聯(lián)網(wǎng)掛鉤，這對計算機視覺來說，大多數(shù)場景里面我們看到圖像里面精確的語義比較少，我們希望把圖像里面盡可能多的語義盡可能精確地提取出來。當盡可能多的語義被提取出來以后，后面是有很多空間可以做的，但是相比語音識別我覺得會晚蠻久。如果不是人臉識別，還有很多，計算機視覺一定是潤物細無聲的作用。

如果非要說計算機視覺，最廣泛的應(yīng)用就是在鼠標領(lǐng)域。大家知道光學(xué)鼠標的原理，就知道光學(xué)鼠標在移動過程中是通過圖像匹配做移動位置的檢測的，大家天天都在用計算機視覺的產(chǎn)品，但是大家不覺得它是計算機視覺的產(chǎn)品。很多時候計算機視覺產(chǎn)品往往是錦上添花，潤物細無聲，你沒有感覺的時候讓你體會到技術(shù)給你帶來的好處。在醫(yī)療方面我非?？春茫矣X得未來自動這件事情很快會超過中國平均以上醫(yī)生的水平，對醫(yī)療的改變會非常大，當然政策上的原因，如果政策能夠突破，這是非常大的改變。

梅濤：剛才問這個問題我是希望大家能夠發(fā)散思維想一想，也許十年、二十年后大家可以去那個方向創(chuàng)業(yè)。

接下來的問題，請允許我作為主持人再問最后一個問題，待會兒大家可以準備一些非常難的問題。下一個問題很簡單，我想問大家，因為大家創(chuàng)業(yè)好幾年，踩過很多坑，我們在微軟做產(chǎn)品、做研發(fā)的時候也遇到好多坑，我想問大家，你覺得人工智能技術(shù)在落地過程中最大的難點是什么？希望大家簡潔明了的告訴我們你遇到的難點是什么，你覺得這個難點應(yīng)該朝哪個方向解決？

任鵬：我覺得最大的難點是閉環(huán)。這個閉環(huán)是指什么呢？市場的需求和當前的技術(shù)能達到的水平的閉環(huán)。做這個產(chǎn)品的時候，作為一個創(chuàng)業(yè)公司，你能把握的影響產(chǎn)業(yè)鏈的閉環(huán)，比如說取得數(shù)據(jù)，以數(shù)據(jù)來驅(qū)動，當前產(chǎn)品的結(jié)果和客戶市場的需求還有差距，你反過來怎么迭代？所以這個閉環(huán)是非常關(guān)鍵的。

舉個例子，安防行業(yè)，08 年我們剛剛開始創(chuàng)業(yè)的時候，客戶提了這樣一個需求，你們的算法能不能把場景里面的人、車都識別出來？過了九年，當前的技術(shù)是可以解決了，但是要批量化成本很高，客戶會不接受這個東西，他想的是，你們能不能把這個東西識別出來，又很便宜。所以，這個閉環(huán)是很難的，做產(chǎn)品的時候就有很多需要取舍和平衡的東西，要去平衡你的功能、性能，滿足客戶的指標、期望，最后在產(chǎn)品設(shè)計和成本相關(guān)的這些方面，其實一個核心就是閉環(huán)。

梅濤：任總認為閉環(huán)是一個難點。詹總呢？

詹東暉：我也同意任總的說法，閉環(huán)是一個難點，對商業(yè)場景來說，對人工智能的需求是存在的，但是為什么這么多年沒有什么應(yīng)用？最根本的原因是技術(shù)，這兩年比較火，因為深度學(xué)習(xí)的引入讓技術(shù)的性能上達到一個跳躍，我們發(fā)現(xiàn)很多場景似乎具備了可應(yīng)用的基礎(chǔ)，這距離人工智能要達到的目標是有差距的，但是不意味著不可用。如何讓這個技術(shù)和用戶需求達到一個平衡，這是一個難點。

另外，剛才提到深度學(xué)習(xí)，深度學(xué)習(xí)是一個很消耗處理資源的技術(shù)，很多時候一個問題是如何在一種低成本、高性價比的方案里面去實現(xiàn)。你可能做出一個很牛的識別相機，但是成本要 2 萬塊錢，這個相機可能就基本上沒有辦法銷售和商用。

舉個例子，我們在做 AI 放到零售的時候，做了快四年才推出第一代產(chǎn)品。從算法上來看，我們并沒有做太大的革新，這三四年都在做它的落地。從最開始很復(fù)雜的系統(tǒng)，要前端相機、后端服務(wù)器，那時候成本要大幾千塊錢、一兩萬塊錢，做到現(xiàn)在可以很低的成本，一兩個很小的攝像頭，可以完全不依賴網(wǎng)絡(luò)和云端，可以做復(fù)雜的智能學(xué)習(xí)的算法的實現(xiàn)，我們花了四年時間。因為這四年時間的投入，達到這樣一個落地化的產(chǎn)品，才使它具備開始規(guī)模的在商業(yè)應(yīng)用的情況。我覺得這里面很大的挑戰(zhàn)在于，算法本身已經(jīng)不是一個最主要的維度了，而是看怎么做落地化。

梅濤：關(guān)于落地化我自己感觸很深，因為我經(jīng)常遇到客戶，客戶經(jīng)常提出無理的要求，客戶說你能不能識別人臉做到 5 個 9、6 個 9？我說我可以識別出來黃曉明，但是識別不出來梅濤，這是兩個不一樣的場景。

魏京京：觀點基本類似，我們創(chuàng)業(yè)過程中最大的一個難點是怎么從飄在天上落到地下，因為視覺這個領(lǐng)域基本上是很高的技術(shù)壁壘或者帶著技術(shù)光環(huán)創(chuàng)業(yè)，否則做不了這個事情。通常是以我為主，客戶圍繞我來轉(zhuǎn)，我們也犯了這個錯誤，我們產(chǎn)品設(shè)計的時候以我為主，這是技術(shù)背景的公司很容易犯的問題。

我們慢慢從飄在天上到接受現(xiàn)實落到地下，跟之前兩位的理解是差不多的意思，最關(guān)鍵的不是你有什么技術(shù)，而是你把已有的技術(shù)跟他的痛點結(jié)合，這個問題不是技術(shù)的問題，基本上就是商業(yè)問題。你要做商業(yè)閉環(huán)，同時要跟已有的環(huán)節(jié)有合適的商業(yè)產(chǎn)品的設(shè)計，這個需要付出的努力不是做技術(shù)的來做的，而是你要接地氣，圍著客戶做討論、設(shè)計和服務(wù)，讓他慢慢接受你，這是很痛苦的，也是我們做技術(shù)創(chuàng)業(yè)需要轉(zhuǎn)換的地方。我原來也做過投資，看過很多以技術(shù)為背景的創(chuàng)業(yè)公司，這是很容易犯的一個問題。

梅濤：謝謝魏總，魏總說出很重要的一點，要服務(wù)客戶，要理解他的需求，要整天圍著客戶轉(zhuǎn)。（現(xiàn)場笑）

趙京雷：非常同意前面幾位嘉賓的觀點，這確實反映了技術(shù)創(chuàng)業(yè)遇到的比較大的難點或者痛點。從我們自身而言也是這樣，可以歸納為兩點：第一點，怎么樣管理客戶的期望，不一定是用戶的期望，因為大部分是 2B 的?？赡苁芎芏嗝襟w或者各方面的宣傳，如果不是做技術(shù)這個行業(yè)的，總是對 AI 能做的事期望太高了，不管是普通的小機器人或者對視覺技術(shù)期望太高，經(jīng)常有各種各樣的公司找過來說，我有這樣的需求，你能不能做。

第二點，計算機視覺不是萬能的，比如說我們一般說的視覺是 RGB，計算機視覺這兩年進步很大，在 RGB 普通鏡頭下，光線、角度各方面都有了比較大的進步，但是現(xiàn)在的技術(shù)發(fā)展的情況還不是所有問題都能解決。跟客戶解決的問題可能依賴計算平臺，依賴整個體系的聯(lián)合優(yōu)化，比如說有很多場景的客戶找到我們說，能不能幫我們做一件事，我們會問他，這個事情晚上要不要做？晚上要做。他是拿普通攝像頭，補光的時候，這是消費級的，你又不能拿燈去補光，這種情況怎么去管理，和客戶一起去梳理行業(yè)碰到的這樣一些需求，然后把它抽象出來，怎么樣用最好的芯片、最好的后臺系統(tǒng)結(jié)合算法一起去做，其實算法一定不是孤立的。

梅濤：謝謝趙總，其實我也很贊同，因為我發(fā)現(xiàn)用戶需求和期望有兩種，一種是用戶沒有期望到你算法能做到這一步，另外是用戶覺得這么低的要求算法做不到，其實用戶需要引導(dǎo)。

山世光：其實我特別不想同意他們幾位的觀點，但是在是沒有辦法不同意。（現(xiàn)場笑）我就不重復(fù)了，但是我的觀點是，最大的障礙還是技術(shù)不完美。我們所謂的技術(shù)完美，當然我們希望「快、準、穩(wěn)」?？焓请S便找一個很爛的芯片就可以做；準是什么情況下都能工作；穩(wěn)是不會出現(xiàn)差錯，這樣落地和閉環(huán)就不會出現(xiàn)難題了，但是我們現(xiàn)在真的做不到。比如剛才說的萬分之一，很多時候是達不到的，比如變換場景，晚上你非要用普通的攝像頭就是做不到，沒有辦法。我覺得真的還是技術(shù)上不完美，這也是這個領(lǐng)域并沒有到非常非常完美的馬上可以四處用的階段，在這個階段最難的是怎么去找到客戶的需求和技術(shù)的邊界能夠結(jié)合的應(yīng)用，再配合上其他的一些條件，能夠滿足用戶的需求。剛才幾位說得都對，技術(shù)不完美還是一個很大的障礙。

梅濤：其實我覺得不完美有時候也是一種完美，正因為不完美所以我們有很多機會。

山世光：對，上帝也不完美。

梅濤：謝謝大家。接下來把時間留給在座到場的聽眾，不知道有沒有非常難的問題？

聽眾：我想問一個很具體的問題，關(guān)于圖像識別領(lǐng)域的競爭差異化的問題?，F(xiàn)在有一種說法，在人臉識別、醫(yī)療讀圖領(lǐng)域，行業(yè)里面這兩個領(lǐng)域主要的公司用的技術(shù)都非常像，有人就說現(xiàn)在這些領(lǐng)域的發(fā)展變成不是拼技術(shù)，而是拼市場，去跑馬圈地，去融資和燒錢，不知道對這種情況臺上各位老總怎么看？

魏京京：你剛才提到圖像識別視覺差異化的問題。每家從圖像識別本身來說，從技術(shù)到落地中間的環(huán)節(jié)非常多，并不代表有圖像識別技術(shù)就既能在醫(yī)療領(lǐng)域做，又能在營銷領(lǐng)域做，又能在工業(yè)領(lǐng)域做，差的十萬八千里，這中間是顯現(xiàn)每家公司技術(shù)核心競爭力的。你要有技術(shù)落地，需要找數(shù)據(jù)源、找他的痛點，同時把商業(yè)閉環(huán)做好，不代表我直接說一個故事就有人給你錢，你就把這個事做成，中間的過程還是非常復(fù)雜的。我們做很多細分領(lǐng)域，每個細分領(lǐng)域少則半年，多則一年到一年半，中間需要打磨的東西非常多。

圖像識別雖然是有技術(shù)的通用性，但是到細分行業(yè)需要做的事情非常多，這個事情不僅僅是技術(shù)問題，技術(shù)只占 1/10 甚至更少的環(huán)節(jié)，因為機器學(xué)習(xí)的原理邏輯帶來技術(shù)壁壘本身不是特別高，很多時候需要你把商業(yè)的東西完備的提供給客戶，這是商業(yè)要做的事情，也是我們公司創(chuàng)業(yè)要做的事情。我們不是做學(xué)術(shù)，是真正做一個人家愿意買單的東西，要把這個價值鏈條梳理的更加清晰一點。

詹東暉：我簡單補充一下，我很同意，我的觀點是不會有所謂純粹的 AI 公司，AI 只是一個技術(shù)，對于我們在座的幾位來說也只是 AI 的創(chuàng)業(yè)者，每個人可能會選擇不同的落地行業(yè)、落地跑道。未來可能有人做安防，說誰是在安防領(lǐng)域做的最好的 AI 公司、誰是零售領(lǐng)域做的最好的 AI 公司。單純的計算機視覺技術(shù)的壁壘，對做得好的公司來講，這個壁壘越來越?jīng)]有差異化，做得好的就是看誰跑得更快，能夠更快讓技術(shù)和產(chǎn)品落到行業(yè)里面去，更深的鋪到這個行業(yè)，構(gòu)建一個更完整的行業(yè)壁壘，這可能會是一個更重要的地方。

趙京雷：我覺得這是一個蠻重要的問題，所以我補充兩句。其實大部分人都會問到這個問題，這家也在做、那家也在做，為什么還要做這一塊？我覺得這個事情分兩個階段，一個階段是人工智能技術(shù)底層還不是非常成熟，我們在做 AI 底層基礎(chǔ)設(shè)施鋪墊的階段，這個階段不像大家想象的那樣，比如說我們有開源的框架，把不同算法寫上去，大家跑出來的東西是一樣的。如果是這樣，F(xiàn)acebook 和 Google 這樣的大公司就不用收購這種基礎(chǔ)性的公司了。像剛才魏總談到了，每一個單項技術(shù)成熟在不同領(lǐng)域、某一個點成熟，在這個結(jié)點需要至少一年半到兩年的時間，比如說一家公司從無到有的模型上做，第一個是在云端能不能部署，在前端能不能部署，肯定需要一年半到兩年的優(yōu)化過程。

我覺得在這個階段，人工智能基礎(chǔ)設(shè)施快速落地的階段，不同公司的技術(shù)差異非常大，但是如果過了這個階段，我非常同意剛才談到的，這些技術(shù)不是絕對的壁壘，一年能算什么呢？未來人工智能的場合里面一年可能就是一瞬間，所以這里面技術(shù)肯定不是壁壘。那什么是壁壘？剛才各位已經(jīng)談到應(yīng)用領(lǐng)域，我覺得主要就是產(chǎn)品。像移動互聯(lián)網(wǎng)早期那樣，基礎(chǔ)設(shè)施和運營商很早出現(xiàn)，最終是什么樣的東西把不同的做這一塊的公司區(qū)分開來？一定是產(chǎn)品。比如說蘋果是爆品，iPhone 出來了。其實人工智能現(xiàn)在缺少爆品。有一些公司，不管做什么領(lǐng)域，能從這個領(lǐng)域里面把自己的爆品打造出來，我覺得這就是未來 AI 公司本質(zhì)的差異化所在的點。

梅濤：謝謝趙總。由于時間關(guān)系，可以再來一個問題。

聽眾：這個問題想請問一下山老師，剛才講到表情識別，識別表情到底干什么？我們是做行業(yè)應(yīng)用的，在行業(yè)里面的服務(wù)人員的微笑有一定的要求，微笑是比較簡單的事情，我的想法是通過這個表情我們在后臺再進行一些深度的應(yīng)用挖掘，比如說他的績效，企業(yè)可以根據(jù)這個做員工的關(guān)懷，這種勞動強度可能比較高，在后端進行進一步的挖掘，我想請教您的看法。

山世光：這是蠻好的問題。我覺得對 AI 感知人本身，除了認出他，還要了解他的意圖和情感，這一點是非常非常重要的。我們能夠想到有很多可以落地的應(yīng)用，比如說風(fēng)控，當然我不能做測謊，但是可以做情緒的感知。我可以做教育上的評估，比如說小孩在上學(xué)過程中的專注度、接受度等等這些方面，都是可以去做的。當然其實大家已經(jīng)看到笑臉快門這些非常普遍的錦上添花的應(yīng)用。另外一種是跟疾病、健康相關(guān)的，其實是泛情緒、泛情感的這部分，通過估計心率，不知道未來是不是存在這樣的可能性，可以測血糖、血壓，以前覺得技術(shù)上難度太大，現(xiàn)在看來其實都有可能，不是不能做。一旦當非接觸式的通過視頻方式可以做，我相信可以帶來非常非常多的應(yīng)用。

梅濤：謝謝山老師。最后一個問題，我代表雷鋒網(wǎng)來提問，請各位嘉賓展望一下未來五年計算機視覺的發(fā)展方向，以及未來五年你覺得哪個方面可以更加深入我們的生活，哪些計算機視覺技術(shù)可以更加滲透我們的生活，給我們帶來更多便利？

任鵬：未來五年，我覺得傳感器技術(shù)會變，深度的傳感器可能會普及。多種數(shù)據(jù)源的融合，不只是視覺，多種數(shù)據(jù)源融合結(jié)合成產(chǎn)品解決問題，這種情況會越來越多。這是技術(shù)層面的。

當然，算法也好，芯片、計算資源也好，肯定要符合摩爾定律，五年以后我覺得不會是瓶頸。因為十年前我做的是增強現(xiàn)實 AR，我覺得下一個五年增強現(xiàn)實會越來越普及。

梅濤：你認為是增強現(xiàn)實。

詹東暉：我覺得未來五年工業(yè)視覺這一塊會有比較大的突破，因為目前這一塊不僅問題很多，而且市場剛需很大。另外，山老師提到 AI+醫(yī)療，醫(yī)療領(lǐng)域引入 AI 可以很大改變醫(yī)療的現(xiàn)狀。

魏京京：我們也是做工業(yè)設(shè)計的，非常同意詹總的觀點。我覺得分兩方面，第一方面是未來五年會有一大波機器替代人的過程，包括工業(yè)視覺的制造環(huán)節(jié)和服務(wù)環(huán)節(jié)，很多 AI 算法會集成到產(chǎn)品里面把人的工作替代掉，這是不可逆轉(zhuǎn)、必然要形成的。另外一個，現(xiàn)在 AI 算法比較重，后面有大批量服務(wù)器支撐，所以后面的趨勢是輕量化，輕量化到我們家庭和身邊，讓更多能夠觸碰到的功能帶到我們面前。一方面是我們后面看不見的很多人會被替代，另外是我們中間會出來很多大家比較驚訝的智能化產(chǎn)品。

趙京雷：我覺得未來幾年對人類生活影響非常大的計算機視覺的應(yīng)用，一定來自于受眾最廣的領(lǐng)域。哪個領(lǐng)域最廣？一定是手機。未來五年什么樣的視覺產(chǎn)品會成為爆品？大家只要看蘋果一代一代的會加什么樣的視覺功能就可以了。如果加刷臉，那刷臉就是爆品，人人都會刷臉，所有硬件都會通過刷臉去登錄。所以未來很簡單，看蘋果這樣一些產(chǎn)品行業(yè)的大師怎么去思考視覺，在對人類生活影響最廣的領(lǐng)域的構(gòu)思。

山世光：我覺得是醫(yī)療，因為醫(yī)療真的非常非常重要，每個人都會涉及到去醫(yī)院做檢查的問題，所以我覺得醫(yī)療肯定是非常大的一個市場。另外一個就是自動駕駛，我不知道大家看不看好，我自己還是覺得未來五年里面，至少輔助的駕駛系統(tǒng)會逐漸進入到幾乎所有的車上去，這會給大家?guī)砩顟B(tài)度、生活方式的變化，我相信一定會帶來。當然，五年之后是不是真的全自動駕駛不好說，全自動駕駛在一些封閉的環(huán)境下面、可以拿到高精地圖的場景下面，我相信也是有非常大可能性的，所以我還是非常看好這種。而且我相信自動駕駛領(lǐng)域里面，視覺 Camera 這種方式應(yīng)該會超越雷達的方式，使得它能夠更快或者更有可能普及。

梅濤：謝謝世光，世光認為自動駕駛是下一個五年的熱點。我們的圓桌討論非常成功，再次感謝五位嘉賓的參與。其實人工智能離我們很近，計算機視覺離我們也很近，未來離我們并不遙遠，將來我們可以想象將來身邊圍繞各種各樣的機器人，醫(yī)療機器人、無人駕駛機器人、看護機器人、情感機器人，我們?nèi)祟悤兊酶勇斆鬟€是更加懶惰，我不知道，但是不管未來怎么發(fā)展，我們?nèi)诉€是會來到這個會場，面對面的具有感情色彩的深入交流。感謝雷鋒網(wǎng)，感謝 CCF。

以上為雷鋒網(wǎng)整理的圓桌全文，更多資訊請關(guān)注雷鋒網(wǎng)。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。