1
本文作者: 李尊 | 2016-10-30 12:18 |
雖然說(shuō)當(dāng)下幾乎各行各業(yè)都在擁抱人工智能,但你是否知道人工智能曾經(jīng)有過(guò)一段時(shí)間被忽視,且只能以數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等其他稱呼來(lái)進(jìn)行代替?
近日由網(wǎng)易科技和網(wǎng)易智能主辦的第七季 “網(wǎng)易開(kāi)物沙龍” 在浙江大學(xué)召開(kāi)了題為“AI將引發(fā)生活大爆炸?”的主題沙龍,其中線性資本創(chuàng)始人王淮從投資人的角度發(fā)表了演講。
王淮提出投資人工智能更看重三大要素:
大數(shù)據(jù)
深度方法
應(yīng)用場(chǎng)景
其中,大數(shù)據(jù)應(yīng)該是大規(guī)模、結(jié)構(gòu)化并且被標(biāo)注好的;而應(yīng)用場(chǎng)景則要有決策整合,要么能達(dá)到更快的效率或者更好的決策質(zhì)量。王淮認(rèn)為投資盡量避免投入無(wú)法形成自由大量的高質(zhì)量額數(shù)據(jù)公司,從而避免數(shù)據(jù)孤島效應(yīng)。深度并不是投資人關(guān)注的重點(diǎn),投資人要看到的是有用的算法;應(yīng)用場(chǎng)景在商業(yè)上的點(diǎn)要夠細(xì),能用一兩個(gè)簡(jiǎn)單的指標(biāo)來(lái)去衡量。
另外王淮還建議學(xué)者型創(chuàng)業(yè)者,應(yīng)該多注重銷(xiāo)售團(tuán)隊(duì)的建設(shè),這是成功的必要條件,也是一個(gè)鴻溝。
王淮認(rèn)為明年AI泡沫到頂點(diǎn),資本會(huì)越堆越大,5年內(nèi)會(huì)有一個(gè)擠泡沫的過(guò)程。
演講實(shí)錄:
謝謝大家,我從投資人的角度談?wù)勎覀兺兑恍〢I項(xiàng)目之后的感受,有一些經(jīng)驗(yàn),還有一些是教訓(xùn)。
以投資人的身份在跟大家分享之前,我想加一句其實(shí)我原來(lái)是做技術(shù)的。
除了剛才提到的做過(guò)很多前端后端的事情之外,我最后兩年做的都是跟現(xiàn)在稱之為人工智能。那個(gè)時(shí)候不敢叫人工智能,因?yàn)槟莻€(gè)年代叫人工智能大家一定覺(jué)得你在忽悠,我們那時(shí)候叫數(shù)據(jù)挖掘,最多叫機(jī)器學(xué)習(xí)。
人工智能這個(gè)詞應(yīng)該是過(guò)去兩年才真正的從沒(méi)有變成老鼠過(guò)街人人喊打的狀態(tài),以前大家是不怎么敢提的。像我們以前讀書(shū)的時(shí)候,我們翻到人工智能那章的時(shí)候老師說(shuō)這個(gè)東西不重要、過(guò)吧,都是屬于這種狀態(tài)。在工業(yè)圈的時(shí)候,以前手下有三個(gè)KGD,這種你就用數(shù)據(jù)模型之類(lèi)來(lái)干活就行了,千萬(wàn)不要提NOP,這種亂七八糟的各種模型,還是用很多傳統(tǒng)統(tǒng)計(jì)學(xué)習(xí)的方式。
我最后負(fù)責(zé)的是大數(shù)據(jù)反欺詐,我不知道有多少人創(chuàng)業(yè)的?都是學(xué)生是嗎?在杭州我們投過(guò)一家公司做的非常不錯(cuò),做大數(shù)據(jù)反欺詐的公司。那家公司的創(chuàng)始人原來(lái)是阿里巴巴負(fù)責(zé)風(fēng)控的工程總監(jiān),我以前干的事跟他干的基本一模一樣,我們也是他天使+輪的投資人。進(jìn)入分享經(jīng)驗(yàn)和教訓(xùn)之前,可能先講講人工智能整個(gè)流程當(dāng)中的一些必要步驟,這可能會(huì)對(duì)于我待會(huì)分享的東西有比較清晰的結(jié)構(gòu)。
簡(jiǎn)單的分成這三大塊
第一塊是數(shù)據(jù)源。
第二塊是當(dāng)中算法的處理,所謂的人工智能處理的方法。
第三塊是應(yīng)用,最后處理完?yáng)|西要發(fā)生作用才行的。
數(shù)據(jù)這塊典型的三個(gè)大的特征我們認(rèn)為是,一個(gè)規(guī)模要大,小孩子你只要給他一個(gè)蘋(píng)果的照片,再讓它看蘋(píng)果問(wèn)題不大,但是機(jī)器不行。結(jié)構(gòu)化數(shù)據(jù),尤其在深度學(xué)習(xí)出現(xiàn)之前的可能更多的是像做反欺詐的時(shí)候,很多都是1是1、2是2,都是結(jié)構(gòu)化的數(shù)據(jù)。第三是標(biāo)注好的,什么是好人什么是壞人,他是什么特征,這個(gè)都要標(biāo)注好,深度學(xué)習(xí)理論就是機(jī)器識(shí)圖,這是過(guò)去兩三年產(chǎn)生成熟的技術(shù)。人的人臉在哪里,蘋(píng)果在哪里,你要標(biāo)注好。
第二塊方法論,典型的這兩類(lèi)屬于機(jī)器學(xué)習(xí)的。原來(lái)統(tǒng)計(jì)的學(xué)習(xí)方法,更多的可能叫回歸算法、決策樹(shù)、SVM,我們以前大部分是這套。現(xiàn)在比較流行的深度學(xué)習(xí)是過(guò)去兩三年才真正成熟進(jìn)入到主流的視野當(dāng)中,這些做人臉的都是在過(guò)去兩三年起來(lái)的,以前都沒(méi)有他們的生意可做的,大部分都是在學(xué)??蒲薪嵌?。還有一個(gè)是叫Buzz規(guī)則,深度學(xué)習(xí)之前那是規(guī)則系統(tǒng),更土了。
第三個(gè)很重要的是我們投資人關(guān)注的應(yīng)用場(chǎng)景,搞了一堆數(shù)據(jù),搞了一堆處理,完了之后不能解決商業(yè)實(shí)質(zhì)解決的問(wèn)題。要么比別人的商業(yè)決策更快,要么讓決策質(zhì)量更高。如果做不到這個(gè),這個(gè)東西沒(méi)人愿意買(mǎi)單,你沒(méi)有辦法依賴你剛才在數(shù)據(jù)處理技術(shù)上面建立的優(yōu)勢(shì)去實(shí)現(xiàn)我們稱之為產(chǎn)品到商品的轉(zhuǎn)變過(guò)程,如果這點(diǎn)沒(méi)實(shí)現(xiàn)的話,這家公司是不可投的,再牛也沒(méi)用。
從數(shù)據(jù)這個(gè)角度,我分享一點(diǎn)經(jīng)驗(yàn)。
該做什么?
我們這里面有一個(gè)比較堅(jiān)持的看法是說(shuō)有一個(gè)原始數(shù)據(jù)積累的強(qiáng)策略,這個(gè)什么意思呢?就典型的這些做大部分做人工智能的公司都存在這兩個(gè)大的問(wèn)題:數(shù)據(jù)不是你的,應(yīng)用場(chǎng)景不是你的。你強(qiáng)的是有這種原來(lái)所積累的處理的能力,那些算法能力,調(diào)優(yōu)能力。數(shù)據(jù)不是你的就意味著你是無(wú)源之水,很多事情干不了,業(yè)務(wù)不屬于你的,付錢(qián)這一段,這個(gè)時(shí)間決策點(diǎn)是別人的,你要求著人家,像絕大多數(shù)的公司起點(diǎn)都是很困難的。如果沒(méi)有特殊的方法,有兩種我們看到典型的方法:一種你有歷史的數(shù)據(jù)積累,像我們投的中科院計(jì)算所專(zhuān)注在人臉識(shí)別19年了。我們把整個(gè)實(shí)驗(yàn)室商業(yè)化了,這個(gè)合作應(yīng)該是中科院計(jì)算所50年來(lái)第一次跟商業(yè)化的VC合作。他們歷史上跟華為還有跟政府,咱們出入境的時(shí)候人臉都要掃一圈的,都是上一代的技術(shù),這是有歷史的數(shù)據(jù)積累。另外你技術(shù)很強(qiáng),別人愿意用你,同盾就是這樣的,是阿里巴巴原來(lái)負(fù)責(zé)風(fēng)控的工程總監(jiān),出來(lái)之后大家覺(jué)得干這個(gè)事情你是最好的最牛的,我愿意試你,而且最開(kāi)始走的路徑找的是電商,然后再找的是互聯(lián)網(wǎng)金融的,基本上中國(guó)的所有的P2P、在線金融的公司都是它的客戶。再后面走的銀行政府,你看它的一步一步是越來(lái)越困難的,因?yàn)槟阍胶竺娴娜怂疥P(guān)注的是你之前有什么客戶我不要做你的吃螃蟹的人。所以你要通過(guò)這樣強(qiáng)能力的輸出一步一步的獲得這些初始用戶,再一步一步拓展出去,到今天他們有五千家,我們投他的時(shí)候就幾家客戶。
不該做什么?
想了半天覺(jué)得這家公司這群人他沒(méi)有辦法形成大量的高質(zhì)量的數(shù)據(jù),這里面有幾個(gè)關(guān)健詞,我們認(rèn)為在普遍的數(shù)據(jù)源當(dāng)中有一個(gè)數(shù)據(jù)孤島效應(yīng),什么意思呢?
首先提到一點(diǎn)很多人認(rèn)為數(shù)據(jù)在BAT,這是極大的誤會(huì)。我做一個(gè)不恰當(dāng)?shù)谋确?,我們抬頭看天空的時(shí)候,晚上看到某一個(gè)角度只有那幾顆很亮的星星,如果有最好的望遠(yuǎn)鏡看上去,后面有幾十幾百億恒星,典型的大家看到很多數(shù)據(jù)在BAT。但是在中國(guó)是屬于幾百萬(wàn)到幾千萬(wàn)用戶群體的APP的這些公司他們有這些的數(shù)據(jù),但是不一定有處理能力。還有一個(gè)很典型的,他們有很多用戶數(shù)據(jù)的重疊,只不過(guò)你并不知道,因?yàn)槟銢](méi)有身份識(shí)別數(shù)據(jù)。而且你如果能夠把這些數(shù)據(jù)結(jié)合起來(lái)是有機(jī)會(huì)打破數(shù)據(jù)孤島效應(yīng),實(shí)現(xiàn)我們認(rèn)為的數(shù)據(jù)清洗加融合。還有一個(gè)標(biāo)注,融合完之后A公司跟B公司看到的是同一個(gè),你在A公司看到30個(gè)特征,但是Y公司看到的是另外25種特征,湊到一起,重疊的渠道,你會(huì)看到40個(gè)特征,你會(huì)比任何一家公司的數(shù)據(jù)價(jià)值高。標(biāo)注什么意思呢?你知道他是好人壞人,你這邊知道是壞人,另外一邊不知道,你融合在一起,可以把看到的東西提供出來(lái)。當(dāng)然上面有算法,通過(guò)這些方式你提高了數(shù)據(jù)的質(zhì)量。你如果想了半天想不出來(lái)它有辦法打破數(shù)據(jù)孤島效應(yīng),沒(méi)有辦法他研究的數(shù)據(jù)通過(guò)打破孤島效應(yīng)之后提高數(shù)據(jù)的質(zhì)量的話,那這些公司也是不可用的。
在算法層面,我們有比較強(qiáng)烈的看法。我們其實(shí)并不關(guān)心深度不深度,我們只關(guān)心有用的算法。所謂有用的算法就是提高決策質(zhì)量,提高決策速度。在商業(yè)上的點(diǎn)一定要夠細(xì),細(xì)到可以用一兩個(gè)很簡(jiǎn)單的指標(biāo)去衡量。像同盾干的就是幫銀行提高你能夠抓住壞人的準(zhǔn)確度,當(dāng)然銀行有自己的指標(biāo),叫KQ什么之類(lèi)的,有點(diǎn)忘掉了,它有嚴(yán)格的定義,你的方法能把這個(gè)提高就是好的算法。像我們投的桃樹(shù),是幫銀行提高貸后風(fēng)控,應(yīng)不應(yīng)該給你發(fā)放貸款,應(yīng)該以什么樣的利率這樣的一些問(wèn)題。銀行有它的一套系統(tǒng),如果能夠幫它以更低的成本把貸款發(fā)出去,那你就是一個(gè)好的算法。
人工智能這幾年很火,人工智能不等同于深度學(xué)習(xí),但是的確在深度學(xué)習(xí)這個(gè)事流行之前人工智能這個(gè)詞是不流行的。
在算法這邊不應(yīng)該做什么呢?不應(yīng)該為了智能而智能。
這塊有兩個(gè)領(lǐng)域是典型在我們做投資的時(shí)候看到的,很多人忽悠這個(gè)概念,其實(shí)是扯淡為主,基本上不是真正的智能。第一個(gè)叫做智能設(shè)計(jì),很多是把很多設(shè)計(jì)師手里的規(guī)則自動(dòng)化,沙發(fā)對(duì)面放一個(gè)電視,臥室也是,床頭柜這些無(wú)非是有什么元素可以選的,把它搭配起來(lái),是規(guī)則驅(qū)動(dòng)的。因?yàn)槲覀冊(cè)谶@里面投過(guò)一家非常成功的公司,它有這個(gè)概念,我為了準(zhǔn)備PPT,我在其它地方講過(guò),我還說(shuō)你要兜底這個(gè)智能到什么程度,他說(shuō)主要是用詞問(wèn)題,我最早的時(shí)候提到的規(guī)則系統(tǒng)的一個(gè)自動(dòng)化并非真正的智能設(shè)計(jì),沒(méi)有什么美感設(shè)計(jì)感的。智能投顧,大部分是原來(lái)的主題基金換了一個(gè)臉,跟真正的理解你這個(gè)人的投資需求跟理解市場(chǎng)上的投資機(jī)會(huì)整合起來(lái)提供一個(gè)適合你的投資方案。這種在美國(guó)做的非常成熟,各種原因,有些不是技術(shù)的原因,管控的原因,并非一個(gè)全局優(yōu)化的方案,所以我們認(rèn)為不能稱之為智能投顧。
應(yīng)用我也不展開(kāi),我們投的東西一定要有潛在的應(yīng)用場(chǎng)景,有一個(gè)緊密的結(jié)合。因?yàn)槿斯ぶ悄茴I(lǐng)域有個(gè)特點(diǎn),它跟學(xué)術(shù)關(guān)聯(lián)性比較高。所以我們看待這個(gè)問(wèn)題的時(shí)候典型的是這么一個(gè)面,科研出發(fā),然后到技術(shù)是一步,技術(shù)到產(chǎn)品是另外一步,然后產(chǎn)品只有有機(jī)會(huì)變成商品,而不是我們投的已經(jīng)商品化,有機(jī)會(huì)變成商品,你要賣(mài)得出去而且有一定的量,這才是真正有機(jī)會(huì)成功的。我們投的地平線機(jī)器人,這是很著名的一家公司,也是典型的原來(lái)想從泛的角度,后來(lái)還是落實(shí)到非常結(jié)實(shí)的應(yīng)用場(chǎng)景,從商品角度怎么形成一個(gè)科考的可理解的應(yīng)用解決,形成一個(gè)有很多人愿意買(mǎi)的商品。
最后一點(diǎn)是不該做什么,不投數(shù)據(jù)商業(yè)模式牽強(qiáng)的。這里提幾個(gè)原來(lái)大家看To C這塊的理念很不一樣的我們的一些投資邏輯。
第一個(gè)對(duì)很多數(shù)據(jù)公司的建議是,你提供數(shù)據(jù)這種賣(mài)不了太多錢(qián),你要提供別人基于你這個(gè)平臺(tái)能夠做什么。
第二個(gè)我就不重復(fù)了,更好的決策,更快的決策,解決實(shí)際問(wèn)題。
第三個(gè)是一定要羊毛出在羊身上,不像我們To C的時(shí)候說(shuō)羊毛出在豬身上,讓狗買(mǎi)單,這個(gè)事情在To B人工智能行不通。大多數(shù)多多少少會(huì)走到To B的業(yè)務(wù)模式,To C成功的極少。今日頭條算半個(gè)。銷(xiāo)售團(tuán)隊(duì)的建設(shè),這個(gè)也是很多學(xué)者型的創(chuàng)業(yè)的人很難躍過(guò)的一個(gè)創(chuàng)業(yè)時(shí)候要成功的必要條件,是一個(gè)鴻溝。
話說(shuō)了那么多,我們?cè)趪?guó)內(nèi)的早期基金當(dāng)中是非常多的,也是做的比較早的。雖然現(xiàn)在我們認(rèn)為這里面泡沫很大,但是智能相關(guān)的投資才剛剛開(kāi)始,這個(gè)領(lǐng)域的話至少我們認(rèn)為還有5年的時(shí)間可以有很熱鬧的投資跟創(chuàng)業(yè)的機(jī)會(huì)存在。這是我今天的分享,感謝大家。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。