丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給奕欣
發(fā)送

0

CV+圓桌對話:算法不是唯一考量,創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

本文作者: 奕欣 2017-07-15 15:18 專題:GAIR 2017
導(dǎo)語:雖然大會已經(jīng)接近尾聲,但現(xiàn)場依然座無虛席,觀眾們也幸運地看到了六位大牛時而輕松愉快、時而嚴肅認真的討論。

CV+圓桌對話:算法不是唯一考量,創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

7 月 9 日下午,由中國計算機學(xué)會(CCF)主辦,雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的第二屆CCF-GAIR全球人工智能與機器人峰會,進行到最后一天,CV+專場的圓桌論壇作為本次大會的最后一個議程順利進行。圓桌討論的主題是,計算機視覺滲透生活。本次圓桌由微軟亞洲研究院資深研究員梅濤博士擔(dān)任主持人,他幽默但犀利的主持風(fēng)格博得現(xiàn)場陣陣掌聲。

參與本次圓桌的五位圓桌嘉賓包括:中科院計算所研究員、中科視拓董事長兼 CTO 山世光、閱面科技 CEO 趙京雷、圖麟科技 CEO 魏京京、瑞為智能 CEO 詹東暉以及臻識科技 CEO 任鵬。

雖然大會已經(jīng)接近尾聲,但現(xiàn)場依然座無虛席,觀眾們也幸運地看到了六位大牛時而輕松愉快、時而嚴肅認真的討論。

雷鋒網(wǎng)整理了本次圓桌的討論全文。

梅濤:今天我們圓桌的主題是「計算機視覺滲透生活」。為什么今天選擇這個主題?因為我們覺得計算機視覺已經(jīng)滲透到我們生活無處不在的地方,滲透這個詞英文是「permeate」。計算機視覺已經(jīng)在改變我們生活的方方面面,我們有必要探討一下計算機視覺到底在我們生活中能夠產(chǎn)生什么樣的影響以及怎么落地。

今天我們會邀請到五位嘉賓,剛才我用好奇心給每個人起了一個外號,如果不當(dāng)請原諒。因為做科研,總是喜歡做一些很創(chuàng)新的事情。

第一個嘉賓,剛才山老師說公司最小,所以請他第一個上臺,給山老師起名字叫「X man」,因為山老師剛才講了很多「X」(雷鋒網(wǎng) AI 科技評論按:山世光博士的演講題目為《X 數(shù)據(jù)驅(qū)動的 Seeta 平臺與技術(shù)》)。有請山老師。第二位嘉賓我起了個名字叫「憂郁的男子」,歡迎趙京雷趙總。趙總是畢業(yè)于上海交通大學(xué)的人工智能博士,現(xiàn)在是閱面科技的 CEO。第三位嘉賓我起的名字叫「Cool Man」,有請圖麟科技 CEO 魏京京,他是我的師弟。第四位嘉賓我給他起的名字叫「風(fēng)一樣的男子」,因為他穿著黑衣服,像個黑衣人一樣,他就是瑞為智能的 CEO 詹東暉。詹東暉博士是瑞為智能的創(chuàng)始人兼總經(jīng)理,十一年在華為的經(jīng)歷,創(chuàng)立了瑞為智能。最后一位嘉賓我們叫「Cooler Man」,因為他看起來比我?guī)煹芨?,有請臻識科技的 CEO 任鵬。(現(xiàn)場笑聲+掌聲)

今天有幾個話題給各位嘉賓準(zhǔn)備,在座來聽課的各位老師和朋友也可以提出你們的問題,通過雷鋒網(wǎng)的同事給我傳達一下。

第一個話題比較簡單一點,大家覺得計算機視覺對我們生活產(chǎn)生了什么影響?大家可以結(jié)合自己的生活講一講你們的體會,我們從最小的公司開始吧,山總。(現(xiàn)場笑聲)

山世光:我最近經(jīng)常在演講的時候問大家一個問題,你今年刷了幾次臉?我相信在今年也許你會刷三五次,明年搞不好得三十到五十次了。為什么這么說呢?因為人臉識別,就像剛才說的,在過去幾年時間里面是計算機視覺里面最快落地的一個技術(shù)。我自己做人臉識別,我就不說「之一」了,這個技術(shù)確實在不斷滲透到我們?nèi)粘I罾铮蠹铱梢钥吹匠鲂蟹矫?,比如說坐高鐵、飛機,機場需要刷身份證,驗證你這個技術(shù)是不是能應(yīng)用。包括接下來幾年,我們有大量公司采用人臉識別的技術(shù)做員工的考勤和門禁。這一代考勤門禁跟上一代不一樣,三四年前我們家旁邊的門禁考勤都是人過去,還是要看著屏幕做考勤,未來將會是無感的考勤,我相信人臉識別會越來越多的滲透到日常生活中去。人臉識別就像門和鎖的關(guān)系一樣,你需要進入到某一種狀態(tài),有這個權(quán)限就可以驗證你是你,這是幾乎無處不在的場景。我就說一下人臉識別,后面還有很多空間可以說。

梅濤:謝謝山老師,山老師認為人臉有很多因素。

趙京雷:「憂郁的男子」這個名字特別貼切,因為我這一年馬上要開始駕照年審了,我已經(jīng)被抓拍三次了,馬上要開始去學(xué)習(xí)了。

對我而言,計算機視覺對我而言不能說是好的改變,但是對車牌的識別(很重要),每天我們開進去停車場,這種技術(shù)很成熟,已經(jīng)潛移默化了,我們已經(jīng)意識不到這種技術(shù)的存在了,包括臻識科技也在做這種技術(shù)。我們生活中類似車牌識別的技術(shù)大量存在了。跟車牌識別相關(guān)的 OCR 技術(shù),包括手機里面各種各樣的貼圖、美顏。說到美顏,好像在座的女生不是很多,只要是女生,我覺得這已經(jīng)是必備的。很多技術(shù)我們每天意識不到它的存在,我覺得這更是標(biāo)準(zhǔn)的這些技術(shù)的成熟。

反過來,我們思考一個問題,比如說山老師剛才談到的人臉識別,包括馬云,包括很多公司,每天都在講刷臉,為什么把它叫做一種技術(shù)呢?從這個角度考慮,我認為這個技術(shù)反而是不成熟的。過幾年以后,我們再也不講刷臉,每天很正常,我上街買一個東西,不需要站在那里一刷,付一下款就可以了,這個時候技術(shù)會真正走向成熟。

CV+圓桌對話:算法不是唯一考量,創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

梅濤:謝謝趙總,人工智能帶來很多便利,但是需要人們更加的自律,希望趙總以后不要再憂郁了。接下來請魏總談一談計算機視覺給你生活帶來什么改變。

魏京京:人工智能給我?guī)砗芏嘟梃b,我們平常感受到人工智能的點非常少,比如說我們用 FaceU 這種產(chǎn)品,還是比較簡單化的產(chǎn)品。其實 2C 和 2B 我們看了很多,但是真正 2C 落地非常難,大部分公司都在做 2B 的業(yè)務(wù),2B 是做我們正在做我們用到的東西。如果說視覺改變生活,現(xiàn)在這個階段是非常隱藏的,你是看不到的,在每一個商品的背后是大量的服務(wù)和技術(shù)在里面,只是你感覺不到。后續(xù)的發(fā)展會從后端延展到前端,我們用的東西會慢慢感覺到有視覺的東西在里面,這個時間還很長?,F(xiàn)在 2B 的業(yè)務(wù)我們做不過來,還有很多需要挖掘,2B 的爆發(fā)點還在后面,我非??春煤罄m(xù)三五年視覺在我們生活中顯現(xiàn)出來,大的關(guān)鍵的應(yīng)用機會非常多,我們創(chuàng)業(yè)公司先做 2B 的事情,慢慢技術(shù)、場景、用戶行為習(xí)慣和付費習(xí)慣成熟之后慢慢會到前端。

梅濤:魏總的意思是你認為人工智能先從 2B 業(yè)務(wù)開始,然后慢慢滲透到生活。

魏京京:對,先從 2B 滲透到產(chǎn)品,慢慢滲透到前端,包括 2C 的產(chǎn)品和應(yīng)用會越來越多,這是創(chuàng)業(yè)公司和產(chǎn)業(yè)發(fā)展的大的機會。

梅濤:下面請詹總講一下人工智能的變化。

詹東暉:我覺得如果從人工智能對生活的影響,最直觀的還是臻識科技他們做的車牌識別,以后每次進出停車場不用取卡。我們四位都做人臉識別,大家感受很多的還是刷卡,未來很多機場會增加人臉識別的登機,包括廈門碼頭,你去鼓浪嶼必須做人臉識別,包括未來做長途汽車,這些領(lǐng)域都會通過人臉識別技術(shù)的引入,讓整個生活變得更安全。

開始我們也做了剛才魏總講的 2B 的場景,這兩年我們開始在家電領(lǐng)域引入人工智能的技術(shù),比如我們跟美的合作開發(fā)了智能空調(diào)的產(chǎn)品,現(xiàn)在已經(jīng)開始在賣場做銷售。你可以通過手勢、語音可以讓空調(diào)更智能的感知人的喜好,這是潛移默化的對生活的影響。我們?nèi)馂橹悄茏龅母氐氖?AI+零售的應(yīng)用,現(xiàn)在在很多門店,特別是在北上廣深很多門店逛街的時候,我們攝像頭已經(jīng)在分析你的喜好,包括分眾的媒體已經(jīng)有我們的一些攝像頭,這些已經(jīng)在間接的潛移默化的改變我們的生活方式。這是我做的一點補充。

梅濤:謝謝詹總,基本上你們會讓我們購物非常方便,也方便了商家。最后是任總,談一談你的看法。

任鵬:剛才兩位老總還介紹了我們公司。我們做的確實對大家當(dāng)前的出行帶來很多方便,現(xiàn)在停車場的進出就已經(jīng)很方便了。其實還有一些很簡單的,大家已經(jīng)感覺不到的其實對生活改變更大。我想問大家每天會掃幾次碼?這是非常簡單的計算機視覺技術(shù)的應(yīng)用,里面的關(guān)鍵在于它的準(zhǔn)確度,如果人臉識別真的像山老師講的那樣,準(zhǔn)確度達到百萬分之一的時候,對大家的改變就完全不一樣了。一個技術(shù)要改變生活,還是在于這個技術(shù)的成熟度。如果不是走這個方向,可能會在娛樂方面,比如說在游戲方面改變生活。我們走的是工業(yè)化的路線,比如說安防的應(yīng)用、工業(yè)自動化的應(yīng)用,對算法的準(zhǔn)確度要求是非常高的。現(xiàn)在隨著技術(shù)的發(fā)展,我相信我們技術(shù)的改變對大家生活的影響,可能不知不覺中大家的習(xí)慣就改變了,還不知道這是因為計算機視覺的改變。

梅濤:謝謝任總,謝謝五位嘉賓的講解。我自己感覺剛才問的問題比較簡單,我是比較喜歡提一些難的問題的,我對剛才問題的解答不夠滿意,因為他們在變相做廣告(現(xiàn)場笑),所以我接下來的問題稍微難一點。問題沒有變,我想問大家,你覺得計算機視覺能夠改變生活的哪個方面呢?但是得是除了你們業(yè)務(wù)以外的方面。把這個問題先提給詹總。

詹東暉:您的意思是在我們業(yè)務(wù)范圍之外。

梅濤:對,這才是真心話。

詹東暉:我覺得人工智能對生活的影響,這個趨勢肯定是必然的,只不過我們看它是在五年之內(nèi)、十年之內(nèi)能夠多深地改變我們的生活。我可能偏悲觀一些,在我們能看到的眼前三到五年時間,我覺得還不會給我們帶來很大的變化,比如說機器人,雖然現(xiàn)在機器人很火,但之前看起來很傻萌的機器人有沒有用處?好像沒有什么用處。

梅濤:大家可以看到,我第二個問題把他真心話問出來了。(笑聲+掌聲)

詹東暉:對,我認為還需要蠻長的一條路,在技術(shù)上面做更多突破和革新。剛才任總說到,對人臉識別來講,客觀來講,我們不吹牛的話,它還是能夠達到非常高的精準(zhǔn)度,能不能把人臉識別作為唯一的取款方式,未來三到五年是不可能的。我們講陽光大道的同時,其實還是有很多挑戰(zhàn)存在的。

梅濤:這一點我深為贊同,謝謝詹總。誰自告奮勇第二個來講一講你的真心話。

趙京雷:這個問題非常有挑戰(zhàn)。對大部分視覺公司來說是有需求,然后賣技術(shù)。我覺得這是我們要思考的問題,我們成立一個公司,80% 是不做得,10% 或者 20% 要專注做這個才可以,首先要看我們專注的點是什么,我們在視覺上面,但是不代表我們不具備其他的能力,比如說 FDDB、LFW 技術(shù)我們公司目前排第一,我們也可以解決很多安防問題、金融問題等等,和人相關(guān)的東西我們都可以解決,但是有所為、有所不為,我們目前主要關(guān)注怎么思考山老師講的刷臉。

刷臉講了這么多年,在消費級范圍內(nèi)怎么能夠成為現(xiàn)實,有沒有具備創(chuàng)新性的產(chǎn)品出來,所以我們更多是基于對這個核心技術(shù)自己去做一些創(chuàng)新性的產(chǎn)品,希望能夠做一些能夠改變行業(yè)的產(chǎn)品,而不是做大家都能解決了的問題,解決不了的問題是大家沒有好思路,我們希望從自己意愿而言尋找這些思路和尋找方法,不是喊兩三年,大家針對這個問題一直停留在這個狀態(tài),這是我們?nèi)プ龅?。反過來,某種意義上講,如果大部分人都能解決的問題我們不太會去做。如果問題很強,比如說在識別里面,怎么能夠在未來普及,怎么樣成為人人可用的技術(shù),不只是掌握在政府、只是掌握在少數(shù)人手里的技術(shù),我們希望更多的做這樣一些事情。

梅濤:謝謝。魏總,你有什么高見?

魏京京:剛才都說了一些虛話,現(xiàn)在說實在話。說心里話,從一開始我們做這個行業(yè),從三年前到現(xiàn)在為止,我們對人工智能和這項技術(shù)的理解并沒有像外面媒體宣傳的那么酷、那么炫、那么反人類,它只是對軟件技術(shù)的爆發(fā)而已,對我們生活或者行業(yè)的改變,我覺得是潤物細無聲的改變。上一個潮流是在講互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng),互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的特點是爆發(fā)力度非常強,爆發(fā)出來的時間點非常短,比如說共享單車等等互聯(lián)網(wǎng)的產(chǎn)品。在人工智能這個產(chǎn)品,你希望在一年兩年或者三年五年有更新?lián)Q代變革的東西不太可能,不管在產(chǎn)業(yè)過程還是在我們生活過程中,它只是一個輔助手段,只不過把我們原來認為比較難被智能化的東西逐步開始智能化,但是這個過程也是非常緩慢或者非常逐步的。

我們給客戶做產(chǎn)品,一開始不是把所有東西都顛覆掉,只是在某一個環(huán)節(jié)能夠幫你節(jié)省人力、金錢或者時間效率,說實在話,這個東西沒有那么高大上,也沒有那么反人類,只是這個時間點出來一個很好的技術(shù),給它插上一個翅膀,在每個行業(yè)慢慢顯現(xiàn)出它的價值。所以,這個行業(yè)的周期應(yīng)該比互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)長非常長的時間,我看好十年、二十年之后可以在技術(shù)革新和產(chǎn)業(yè)進步方面發(fā)揮更大的作用。

梅濤:魏總說了很多真心話,至少是有希望的。任總呢?

任鵬:我講一個改變生活的場景,我們也想做,但是技術(shù)還達不到。比如今天這個會場,如果安防領(lǐng)域的技術(shù)能識別出在場的每一位是誰,這會兒在講什么話,我覺得這個場景會對大家的生活有非常大的改變。

梅濤:你想干嘛?(現(xiàn)場笑)

任鵬:我們想做,但是這個比較有難度、比較有挑戰(zhàn),受限于當(dāng)前的技術(shù)。

梅濤:比如你知道各位的知識文化水平、受眾面,可能今天講得會不一樣。

任鵬:簡單一點,有點像上帝。做技術(shù)的可能會有這樣的想法和追求,但是實際上他對生活的改變可能是負面的,沒有隱私了,也有可能有的人的工作會失去,但是這種發(fā)展是擋不住的。

CV+圓桌對話:算法不是唯一考量,創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

梅濤:謝謝任總,最后有請我們最小的公司的山總。(現(xiàn)場笑)

山世光:我想跳出來計算機視覺講整個 AI 領(lǐng)域。這次大家注意到搜狗同傳這件事情,還是蠻有意思的,中文不太好,但是對英文,包括同傳比較好,包括今天聽醫(yī)療那邊講的,不用聽英語,看中文基本上能理解是什么意思。像這樣一個技術(shù)不是說多么成熟,但是如果不去用,更加不能走向我們的日常生活。對計算機視覺來說,需要比語音識別還要更晚一點,這是一個必然的現(xiàn)象,因為語音識別的好處是識別完以后變成文本,變成文本就有語義,直接可以跟互聯(lián)網(wǎng)掛鉤,這對計算機視覺來說,大多數(shù)場景里面我們看到圖像里面精確的語義比較少,我們希望把圖像里面盡可能多的語義盡可能精確地提取出來。當(dāng)盡可能多的語義被提取出來以后,后面是有很多空間可以做的,但是相比語音識別我覺得會晚蠻久。如果不是人臉識別,還有很多,計算機視覺一定是潤物細無聲的作用。

如果非要說計算機視覺,最廣泛的應(yīng)用就是在鼠標(biāo)領(lǐng)域。大家知道光學(xué)鼠標(biāo)的原理,就知道光學(xué)鼠標(biāo)在移動過程中是通過圖像匹配做移動位置的檢測的,大家天天都在用計算機視覺的產(chǎn)品,但是大家不覺得它是計算機視覺的產(chǎn)品。很多時候計算機視覺產(chǎn)品往往是錦上添花,潤物細無聲,你沒有感覺的時候讓你體會到技術(shù)給你帶來的好處。在醫(yī)療方面我非??春?,我覺得未來自動這件事情很快會超過中國平均以上醫(yī)生的水平,對醫(yī)療的改變會非常大,當(dāng)然政策上的原因,如果政策能夠突破,這是非常大的改變。

梅濤:剛才問這個問題我是希望大家能夠發(fā)散思維想一想,也許十年、二十年后大家可以去那個方向創(chuàng)業(yè)。

接下來的問題,請允許我作為主持人再問最后一個問題,待會兒大家可以準(zhǔn)備一些非常難的問題。下一個問題很簡單,我想問大家,因為大家創(chuàng)業(yè)好幾年,踩過很多坑,我們在微軟做產(chǎn)品、做研發(fā)的時候也遇到好多坑,我想問大家,你覺得人工智能技術(shù)在落地過程中最大的難點是什么?希望大家簡潔明了的告訴我們你遇到的難點是什么,你覺得這個難點應(yīng)該朝哪個方向解決?

任鵬:我覺得最大的難點是閉環(huán)。這個閉環(huán)是指什么呢?市場的需求和當(dāng)前的技術(shù)能達到的水平的閉環(huán)。做這個產(chǎn)品的時候,作為一個創(chuàng)業(yè)公司,你能把握的影響產(chǎn)業(yè)鏈的閉環(huán),比如說取得數(shù)據(jù),以數(shù)據(jù)來驅(qū)動,當(dāng)前產(chǎn)品的結(jié)果和客戶市場的需求還有差距,你反過來怎么迭代?所以這個閉環(huán)是非常關(guān)鍵的。

舉個例子,安防行業(yè),08 年我們剛剛開始創(chuàng)業(yè)的時候,客戶提了這樣一個需求,你們的算法能不能把場景里面的人、車都識別出來?過了九年,當(dāng)前的技術(shù)是可以解決了,但是要批量化成本很高,客戶會不接受這個東西,他想的是,你們能不能把這個東西識別出來,又很便宜。所以,這個閉環(huán)是很難的,做產(chǎn)品的時候就有很多需要取舍和平衡的東西,要去平衡你的功能、性能,滿足客戶的指標(biāo)、期望,最后在產(chǎn)品設(shè)計和成本相關(guān)的這些方面,其實一個核心就是閉環(huán)。

梅濤:任總認為閉環(huán)是一個難點。詹總呢?

詹東暉:我也同意任總的說法,閉環(huán)是一個難點,對商業(yè)場景來說,對人工智能的需求是存在的,但是為什么這么多年沒有什么應(yīng)用?最根本的原因是技術(shù),這兩年比較火,因為深度學(xué)習(xí)的引入讓技術(shù)的性能上達到一個跳躍,我們發(fā)現(xiàn)很多場景似乎具備了可應(yīng)用的基礎(chǔ),這距離人工智能要達到的目標(biāo)是有差距的,但是不意味著不可用。如何讓這個技術(shù)和用戶需求達到一個平衡,這是一個難點。

另外,剛才提到深度學(xué)習(xí),深度學(xué)習(xí)是一個很消耗處理資源的技術(shù),很多時候一個問題是如何在一種低成本、高性價比的方案里面去實現(xiàn)。你可能做出一個很牛的識別相機,但是成本要 2 萬塊錢,這個相機可能就基本上沒有辦法銷售和商用。

舉個例子,我們在做 AI 放到零售的時候,做了快四年才推出第一代產(chǎn)品。從算法上來看,我們并沒有做太大的革新,這三四年都在做它的落地。從最開始很復(fù)雜的系統(tǒng),要前端相機、后端服務(wù)器,那時候成本要大幾千塊錢、一兩萬塊錢,做到現(xiàn)在可以很低的成本,一兩個很小的攝像頭,可以完全不依賴網(wǎng)絡(luò)和云端,可以做復(fù)雜的智能學(xué)習(xí)的算法的實現(xiàn),我們花了四年時間。因為這四年時間的投入,達到這樣一個落地化的產(chǎn)品,才使它具備開始規(guī)模的在商業(yè)應(yīng)用的情況。我覺得這里面很大的挑戰(zhàn)在于,算法本身已經(jīng)不是一個最主要的維度了,而是看怎么做落地化。

梅濤:關(guān)于落地化我自己感觸很深,因為我經(jīng)常遇到客戶,客戶經(jīng)常提出無理的要求,客戶說你能不能識別人臉做到 5 個 9、6 個 9?我說我可以識別出來黃曉明,但是識別不出來梅濤,這是兩個不一樣的場景。

魏京京:觀點基本類似,我們創(chuàng)業(yè)過程中最大的一個難點是怎么從飄在天上落到地下,因為視覺這個領(lǐng)域基本上是很高的技術(shù)壁壘或者帶著技術(shù)光環(huán)創(chuàng)業(yè),否則做不了這個事情。通常是以我為主,客戶圍繞我來轉(zhuǎn),我們也犯了這個錯誤,我們產(chǎn)品設(shè)計的時候以我為主,這是技術(shù)背景的公司很容易犯的問題。

我們慢慢從飄在天上到接受現(xiàn)實落到地下,跟之前兩位的理解是差不多的意思,最關(guān)鍵的不是你有什么技術(shù),而是你把已有的技術(shù)跟他的痛點結(jié)合,這個問題不是技術(shù)的問題,基本上就是商業(yè)問題。你要做商業(yè)閉環(huán),同時要跟已有的環(huán)節(jié)有合適的商業(yè)產(chǎn)品的設(shè)計,這個需要付出的努力不是做技術(shù)的來做的,而是你要接地氣,圍著客戶做討論、設(shè)計和服務(wù),讓他慢慢接受你,這是很痛苦的,也是我們做技術(shù)創(chuàng)業(yè)需要轉(zhuǎn)換的地方。我原來也做過投資,看過很多以技術(shù)為背景的創(chuàng)業(yè)公司,這是很容易犯的一個問題。

梅濤:謝謝魏總,魏總說出很重要的一點,要服務(wù)客戶,要理解他的需求,要整天圍著客戶轉(zhuǎn)。(現(xiàn)場笑)

趙京雷:非常同意前面幾位嘉賓的觀點,這確實反映了技術(shù)創(chuàng)業(yè)遇到的比較大的難點或者痛點。從我們自身而言也是這樣,可以歸納為兩點:第一點,怎么樣管理客戶的期望,不一定是用戶的期望,因為大部分是 2B 的??赡苁芎芏嗝襟w或者各方面的宣傳,如果不是做技術(shù)這個行業(yè)的,總是對 AI 能做的事期望太高了,不管是普通的小機器人或者對視覺技術(shù)期望太高,經(jīng)常有各種各樣的公司找過來說,我有這樣的需求,你能不能做。

第二點,計算機視覺不是萬能的,比如說我們一般說的視覺是 RGB,計算機視覺這兩年進步很大,在 RGB 普通鏡頭下,光線、角度各方面都有了比較大的進步,但是現(xiàn)在的技術(shù)發(fā)展的情況還不是所有問題都能解決。跟客戶解決的問題可能依賴計算平臺,依賴整個體系的聯(lián)合優(yōu)化,比如說有很多場景的客戶找到我們說,能不能幫我們做一件事,我們會問他,這個事情晚上要不要做?晚上要做。他是拿普通攝像頭,補光的時候,這是消費級的,你又不能拿燈去補光,這種情況怎么去管理,和客戶一起去梳理行業(yè)碰到的這樣一些需求,然后把它抽象出來,怎么樣用最好的芯片、最好的后臺系統(tǒng)結(jié)合算法一起去做,其實算法一定不是孤立的。

梅濤:謝謝趙總,其實我也很贊同,因為我發(fā)現(xiàn)用戶需求和期望有兩種,一種是用戶沒有期望到你算法能做到這一步,另外是用戶覺得這么低的要求算法做不到,其實用戶需要引導(dǎo)。

山世光:其實我特別不想同意他們幾位的觀點,但是在是沒有辦法不同意。(現(xiàn)場笑)我就不重復(fù)了,但是我的觀點是,最大的障礙還是技術(shù)不完美。我們所謂的技術(shù)完美,當(dāng)然我們希望「快、準(zhǔn)、穩(wěn)」??焓请S便找一個很爛的芯片就可以做;準(zhǔn)是什么情況下都能工作;穩(wěn)是不會出現(xiàn)差錯,這樣落地和閉環(huán)就不會出現(xiàn)難題了,但是我們現(xiàn)在真的做不到。比如剛才說的萬分之一,很多時候是達不到的,比如變換場景,晚上你非要用普通的攝像頭就是做不到,沒有辦法。我覺得真的還是技術(shù)上不完美,這也是這個領(lǐng)域并沒有到非常非常完美的馬上可以四處用的階段,在這個階段最難的是怎么去找到客戶的需求和技術(shù)的邊界能夠結(jié)合的應(yīng)用,再配合上其他的一些條件,能夠滿足用戶的需求。剛才幾位說得都對,技術(shù)不完美還是一個很大的障礙。

梅濤:其實我覺得不完美有時候也是一種完美,正因為不完美所以我們有很多機會。

山世光:對,上帝也不完美。

梅濤:謝謝大家。接下來把時間留給在座到場的聽眾,不知道有沒有非常難的問題?

聽眾:我想問一個很具體的問題,關(guān)于圖像識別領(lǐng)域的競爭差異化的問題?,F(xiàn)在有一種說法,在人臉識別、醫(yī)療讀圖領(lǐng)域,行業(yè)里面這兩個領(lǐng)域主要的公司用的技術(shù)都非常像,有人就說現(xiàn)在這些領(lǐng)域的發(fā)展變成不是拼技術(shù),而是拼市場,去跑馬圈地,去融資和燒錢,不知道對這種情況臺上各位老總怎么看?

魏京京:你剛才提到圖像識別視覺差異化的問題。每家從圖像識別本身來說,從技術(shù)到落地中間的環(huán)節(jié)非常多,并不代表有圖像識別技術(shù)就既能在醫(yī)療領(lǐng)域做,又能在營銷領(lǐng)域做,又能在工業(yè)領(lǐng)域做,差的十萬八千里,這中間是顯現(xiàn)每家公司技術(shù)核心競爭力的。你要有技術(shù)落地,需要找數(shù)據(jù)源、找他的痛點,同時把商業(yè)閉環(huán)做好,不代表我直接說一個故事就有人給你錢,你就把這個事做成,中間的過程還是非常復(fù)雜的。我們做很多細分領(lǐng)域,每個細分領(lǐng)域少則半年,多則一年到一年半,中間需要打磨的東西非常多。

圖像識別雖然是有技術(shù)的通用性,但是到細分行業(yè)需要做的事情非常多,這個事情不僅僅是技術(shù)問題,技術(shù)只占 1/10 甚至更少的環(huán)節(jié),因為機器學(xué)習(xí)的原理邏輯帶來技術(shù)壁壘本身不是特別高,很多時候需要你把商業(yè)的東西完備的提供給客戶,這是商業(yè)要做的事情,也是我們公司創(chuàng)業(yè)要做的事情。我們不是做學(xué)術(shù),是真正做一個人家愿意買單的東西,要把這個價值鏈條梳理的更加清晰一點。

詹東暉:我簡單補充一下,我很同意,我的觀點是不會有所謂純粹的 AI 公司,AI 只是一個技術(shù),對于我們在座的幾位來說也只是 AI 的創(chuàng)業(yè)者,每個人可能會選擇不同的落地行業(yè)、落地跑道。未來可能有人做安防,說誰是在安防領(lǐng)域做的最好的 AI 公司、誰是零售領(lǐng)域做的最好的 AI 公司。單純的計算機視覺技術(shù)的壁壘,對做得好的公司來講,這個壁壘越來越?jīng)]有差異化,做得好的就是看誰跑得更快,能夠更快讓技術(shù)和產(chǎn)品落到行業(yè)里面去,更深的鋪到這個行業(yè),構(gòu)建一個更完整的行業(yè)壁壘,這可能會是一個更重要的地方。

趙京雷:我覺得這是一個蠻重要的問題,所以我補充兩句。其實大部分人都會問到這個問題,這家也在做、那家也在做,為什么還要做這一塊?我覺得這個事情分兩個階段,一個階段是人工智能技術(shù)底層還不是非常成熟,我們在做 AI 底層基礎(chǔ)設(shè)施鋪墊的階段,這個階段不像大家想象的那樣,比如說我們有開源的框架,把不同算法寫上去,大家跑出來的東西是一樣的。如果是這樣,F(xiàn)acebook 和 Google 這樣的大公司就不用收購這種基礎(chǔ)性的公司了。像剛才魏總談到了,每一個單項技術(shù)成熟在不同領(lǐng)域、某一個點成熟,在這個結(jié)點需要至少一年半到兩年的時間,比如說一家公司從無到有的模型上做,第一個是在云端能不能部署,在前端能不能部署,肯定需要一年半到兩年的優(yōu)化過程。

我覺得在這個階段,人工智能基礎(chǔ)設(shè)施快速落地的階段,不同公司的技術(shù)差異非常大,但是如果過了這個階段,我非常同意剛才談到的,這些技術(shù)不是絕對的壁壘,一年能算什么呢?未來人工智能的場合里面一年可能就是一瞬間,所以這里面技術(shù)肯定不是壁壘。那什么是壁壘?剛才各位已經(jīng)談到應(yīng)用領(lǐng)域,我覺得主要就是產(chǎn)品。像移動互聯(lián)網(wǎng)早期那樣,基礎(chǔ)設(shè)施和運營商很早出現(xiàn),最終是什么樣的東西把不同的做這一塊的公司區(qū)分開來?一定是產(chǎn)品。比如說蘋果是爆品,iPhone 出來了。其實人工智能現(xiàn)在缺少爆品。有一些公司,不管做什么領(lǐng)域,能從這個領(lǐng)域里面把自己的爆品打造出來,我覺得這就是未來 AI 公司本質(zhì)的差異化所在的點。

梅濤:謝謝趙總。由于時間關(guān)系,可以再來一個問題。

聽眾:這個問題想請問一下山老師,剛才講到表情識別,識別表情到底干什么?我們是做行業(yè)應(yīng)用的,在行業(yè)里面的服務(wù)人員的微笑有一定的要求,微笑是比較簡單的事情,我的想法是通過這個表情我們在后臺再進行一些深度的應(yīng)用挖掘,比如說他的績效,企業(yè)可以根據(jù)這個做員工的關(guān)懷,這種勞動強度可能比較高,在后端進行進一步的挖掘,我想請教您的看法。

山世光:這是蠻好的問題。我覺得對 AI 感知人本身,除了認出他,還要了解他的意圖和情感,這一點是非常非常重要的。我們能夠想到有很多可以落地的應(yīng)用,比如說風(fēng)控,當(dāng)然我不能做測謊,但是可以做情緒的感知。我可以做教育上的評估,比如說小孩在上學(xué)過程中的專注度、接受度等等這些方面,都是可以去做的。當(dāng)然其實大家已經(jīng)看到笑臉快門這些非常普遍的錦上添花的應(yīng)用。另外一種是跟疾病、健康相關(guān)的,其實是泛情緒、泛情感的這部分,通過估計心率,不知道未來是不是存在這樣的可能性,可以測血糖、血壓,以前覺得技術(shù)上難度太大,現(xiàn)在看來其實都有可能,不是不能做。一旦當(dāng)非接觸式的通過視頻方式可以做,我相信可以帶來非常非常多的應(yīng)用。

梅濤:謝謝山老師。最后一個問題,我代表雷鋒網(wǎng)來提問,請各位嘉賓展望一下未來五年計算機視覺的發(fā)展方向,以及未來五年你覺得哪個方面可以更加深入我們的生活,哪些計算機視覺技術(shù)可以更加滲透我們的生活,給我們帶來更多便利?

任鵬:未來五年,我覺得傳感器技術(shù)會變,深度的傳感器可能會普及。多種數(shù)據(jù)源的融合,不只是視覺,多種數(shù)據(jù)源融合結(jié)合成產(chǎn)品解決問題,這種情況會越來越多。這是技術(shù)層面的。

當(dāng)然,算法也好,芯片、計算資源也好,肯定要符合摩爾定律,五年以后我覺得不會是瓶頸。因為十年前我做的是增強現(xiàn)實 AR,我覺得下一個五年增強現(xiàn)實會越來越普及。

梅濤:你認為是增強現(xiàn)實。

詹東暉:我覺得未來五年工業(yè)視覺這一塊會有比較大的突破,因為目前這一塊不僅問題很多,而且市場剛需很大。另外,山老師提到 AI+醫(yī)療,醫(yī)療領(lǐng)域引入 AI 可以很大改變醫(yī)療的現(xiàn)狀。

魏京京:我們也是做工業(yè)設(shè)計的,非常同意詹總的觀點。我覺得分兩方面,第一方面是未來五年會有一大波機器替代人的過程,包括工業(yè)視覺的制造環(huán)節(jié)和服務(wù)環(huán)節(jié),很多 AI 算法會集成到產(chǎn)品里面把人的工作替代掉,這是不可逆轉(zhuǎn)、必然要形成的。另外一個,現(xiàn)在 AI 算法比較重,后面有大批量服務(wù)器支撐,所以后面的趨勢是輕量化,輕量化到我們家庭和身邊,讓更多能夠觸碰到的功能帶到我們面前。一方面是我們后面看不見的很多人會被替代,另外是我們中間會出來很多大家比較驚訝的智能化產(chǎn)品。

趙京雷:我覺得未來幾年對人類生活影響非常大的計算機視覺的應(yīng)用,一定來自于受眾最廣的領(lǐng)域。哪個領(lǐng)域最廣?一定是手機。未來五年什么樣的視覺產(chǎn)品會成為爆品?大家只要看蘋果一代一代的會加什么樣的視覺功能就可以了。如果加刷臉,那刷臉就是爆品,人人都會刷臉,所有硬件都會通過刷臉去登錄。所以未來很簡單,看蘋果這樣一些產(chǎn)品行業(yè)的大師怎么去思考視覺,在對人類生活影響最廣的領(lǐng)域的構(gòu)思。

山世光:我覺得是醫(yī)療,因為醫(yī)療真的非常非常重要,每個人都會涉及到去醫(yī)院做檢查的問題,所以我覺得醫(yī)療肯定是非常大的一個市場。另外一個就是自動駕駛,我不知道大家看不看好,我自己還是覺得未來五年里面,至少輔助的駕駛系統(tǒng)會逐漸進入到幾乎所有的車上去,這會給大家?guī)砩顟B(tài)度、生活方式的變化,我相信一定會帶來。當(dāng)然,五年之后是不是真的全自動駕駛不好說,全自動駕駛在一些封閉的環(huán)境下面、可以拿到高精地圖的場景下面,我相信也是有非常大可能性的,所以我還是非??春眠@種。而且我相信自動駕駛領(lǐng)域里面,視覺 Camera 這種方式應(yīng)該會超越雷達的方式,使得它能夠更快或者更有可能普及。

梅濤:謝謝世光,世光認為自動駕駛是下一個五年的熱點。我們的圓桌討論非常成功,再次感謝五位嘉賓的參與。其實人工智能離我們很近,計算機視覺離我們也很近,未來離我們并不遙遠,將來我們可以想象將來身邊圍繞各種各樣的機器人,醫(yī)療機器人、無人駕駛機器人、看護機器人、情感機器人,我們?nèi)祟悤兊酶勇斆鬟€是更加懶惰,我不知道,但是不管未來怎么發(fā)展,我們?nèi)诉€是會來到這個會場,面對面的具有感情色彩的深入交流。感謝雷鋒網(wǎng),感謝 CCF。

以上為雷鋒網(wǎng)整理的圓桌全文,更多資訊請關(guān)注雷鋒網(wǎng)。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

CV+圓桌對話:算法不是唯一考量,創(chuàng)業(yè)公司的商業(yè)閉環(huán)才是最大難點 | CCF-GAIR 2017

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說