1
本文作者: 李尊 | 2016-10-30 12:18 |
雖然說當下幾乎各行各業(yè)都在擁抱人工智能,但你是否知道人工智能曾經有過一段時間被忽視,且只能以數(shù)據(jù)挖掘、機器學習等其他稱呼來進行代替?
近日由網(wǎng)易科技和網(wǎng)易智能主辦的第七季 “網(wǎng)易開物沙龍” 在浙江大學召開了題為“AI將引發(fā)生活大爆炸?”的主題沙龍,其中線性資本創(chuàng)始人王淮從投資人的角度發(fā)表了演講。
王淮提出投資人工智能更看重三大要素:
大數(shù)據(jù)
深度方法
應用場景
其中,大數(shù)據(jù)應該是大規(guī)模、結構化并且被標注好的;而應用場景則要有決策整合,要么能達到更快的效率或者更好的決策質量。王淮認為投資盡量避免投入無法形成自由大量的高質量額數(shù)據(jù)公司,從而避免數(shù)據(jù)孤島效應。深度并不是投資人關注的重點,投資人要看到的是有用的算法;應用場景在商業(yè)上的點要夠細,能用一兩個簡單的指標來去衡量。
另外王淮還建議學者型創(chuàng)業(yè)者,應該多注重銷售團隊的建設,這是成功的必要條件,也是一個鴻溝。
王淮認為明年AI泡沫到頂點,資本會越堆越大,5年內會有一個擠泡沫的過程。
演講實錄:
謝謝大家,我從投資人的角度談談我們投一些AI項目之后的感受,有一些經驗,還有一些是教訓。
以投資人的身份在跟大家分享之前,我想加一句其實我原來是做技術的。
除了剛才提到的做過很多前端后端的事情之外,我最后兩年做的都是跟現(xiàn)在稱之為人工智能。那個時候不敢叫人工智能,因為那個年代叫人工智能大家一定覺得你在忽悠,我們那時候叫數(shù)據(jù)挖掘,最多叫機器學習。
人工智能這個詞應該是過去兩年才真正的從沒有變成老鼠過街人人喊打的狀態(tài),以前大家是不怎么敢提的。像我們以前讀書的時候,我們翻到人工智能那章的時候老師說這個東西不重要、過吧,都是屬于這種狀態(tài)。在工業(yè)圈的時候,以前手下有三個KGD,這種你就用數(shù)據(jù)模型之類來干活就行了,千萬不要提NOP,這種亂七八糟的各種模型,還是用很多傳統(tǒng)統(tǒng)計學習的方式。
我最后負責的是大數(shù)據(jù)反欺詐,我不知道有多少人創(chuàng)業(yè)的?都是學生是嗎?在杭州我們投過一家公司做的非常不錯,做大數(shù)據(jù)反欺詐的公司。那家公司的創(chuàng)始人原來是阿里巴巴負責風控的工程總監(jiān),我以前干的事跟他干的基本一模一樣,我們也是他天使+輪的投資人。進入分享經驗和教訓之前,可能先講講人工智能整個流程當中的一些必要步驟,這可能會對于我待會分享的東西有比較清晰的結構。
簡單的分成這三大塊
第一塊是數(shù)據(jù)源。
第二塊是當中算法的處理,所謂的人工智能處理的方法。
第三塊是應用,最后處理完東西要發(fā)生作用才行的。
數(shù)據(jù)這塊典型的三個大的特征我們認為是,一個規(guī)模要大,小孩子你只要給他一個蘋果的照片,再讓它看蘋果問題不大,但是機器不行。結構化數(shù)據(jù),尤其在深度學習出現(xiàn)之前的可能更多的是像做反欺詐的時候,很多都是1是1、2是2,都是結構化的數(shù)據(jù)。第三是標注好的,什么是好人什么是壞人,他是什么特征,這個都要標注好,深度學習理論就是機器識圖,這是過去兩三年產生成熟的技術。人的人臉在哪里,蘋果在哪里,你要標注好。
第二塊方法論,典型的這兩類屬于機器學習的。原來統(tǒng)計的學習方法,更多的可能叫回歸算法、決策樹、SVM,我們以前大部分是這套?,F(xiàn)在比較流行的深度學習是過去兩三年才真正成熟進入到主流的視野當中,這些做人臉的都是在過去兩三年起來的,以前都沒有他們的生意可做的,大部分都是在學??蒲薪嵌?。還有一個是叫Buzz規(guī)則,深度學習之前那是規(guī)則系統(tǒng),更土了。
第三個很重要的是我們投資人關注的應用場景,搞了一堆數(shù)據(jù),搞了一堆處理,完了之后不能解決商業(yè)實質解決的問題。要么比別人的商業(yè)決策更快,要么讓決策質量更高。如果做不到這個,這個東西沒人愿意買單,你沒有辦法依賴你剛才在數(shù)據(jù)處理技術上面建立的優(yōu)勢去實現(xiàn)我們稱之為產品到商品的轉變過程,如果這點沒實現(xiàn)的話,這家公司是不可投的,再牛也沒用。
從數(shù)據(jù)這個角度,我分享一點經驗。
該做什么?
我們這里面有一個比較堅持的看法是說有一個原始數(shù)據(jù)積累的強策略,這個什么意思呢?就典型的這些做大部分做人工智能的公司都存在這兩個大的問題:數(shù)據(jù)不是你的,應用場景不是你的。你強的是有這種原來所積累的處理的能力,那些算法能力,調優(yōu)能力。數(shù)據(jù)不是你的就意味著你是無源之水,很多事情干不了,業(yè)務不屬于你的,付錢這一段,這個時間決策點是別人的,你要求著人家,像絕大多數(shù)的公司起點都是很困難的。如果沒有特殊的方法,有兩種我們看到典型的方法:一種你有歷史的數(shù)據(jù)積累,像我們投的中科院計算所專注在人臉識別19年了。我們把整個實驗室商業(yè)化了,這個合作應該是中科院計算所50年來第一次跟商業(yè)化的VC合作。他們歷史上跟華為還有跟政府,咱們出入境的時候人臉都要掃一圈的,都是上一代的技術,這是有歷史的數(shù)據(jù)積累。另外你技術很強,別人愿意用你,同盾就是這樣的,是阿里巴巴原來負責風控的工程總監(jiān),出來之后大家覺得干這個事情你是最好的最牛的,我愿意試你,而且最開始走的路徑找的是電商,然后再找的是互聯(lián)網(wǎng)金融的,基本上中國的所有的P2P、在線金融的公司都是它的客戶。再后面走的銀行政府,你看它的一步一步是越來越困難的,因為你越后面的人他越關注的是你之前有什么客戶我不要做你的吃螃蟹的人。所以你要通過這樣強能力的輸出一步一步的獲得這些初始用戶,再一步一步拓展出去,到今天他們有五千家,我們投他的時候就幾家客戶。
不該做什么?
想了半天覺得這家公司這群人他沒有辦法形成大量的高質量的數(shù)據(jù),這里面有幾個關健詞,我們認為在普遍的數(shù)據(jù)源當中有一個數(shù)據(jù)孤島效應,什么意思呢?
首先提到一點很多人認為數(shù)據(jù)在BAT,這是極大的誤會。我做一個不恰當?shù)谋确剑覀兲ь^看天空的時候,晚上看到某一個角度只有那幾顆很亮的星星,如果有最好的望遠鏡看上去,后面有幾十幾百億恒星,典型的大家看到很多數(shù)據(jù)在BAT。但是在中國是屬于幾百萬到幾千萬用戶群體的APP的這些公司他們有這些的數(shù)據(jù),但是不一定有處理能力。還有一個很典型的,他們有很多用戶數(shù)據(jù)的重疊,只不過你并不知道,因為你沒有身份識別數(shù)據(jù)。而且你如果能夠把這些數(shù)據(jù)結合起來是有機會打破數(shù)據(jù)孤島效應,實現(xiàn)我們認為的數(shù)據(jù)清洗加融合。還有一個標注,融合完之后A公司跟B公司看到的是同一個,你在A公司看到30個特征,但是Y公司看到的是另外25種特征,湊到一起,重疊的渠道,你會看到40個特征,你會比任何一家公司的數(shù)據(jù)價值高。標注什么意思呢?你知道他是好人壞人,你這邊知道是壞人,另外一邊不知道,你融合在一起,可以把看到的東西提供出來。當然上面有算法,通過這些方式你提高了數(shù)據(jù)的質量。你如果想了半天想不出來它有辦法打破數(shù)據(jù)孤島效應,沒有辦法他研究的數(shù)據(jù)通過打破孤島效應之后提高數(shù)據(jù)的質量的話,那這些公司也是不可用的。
在算法層面,我們有比較強烈的看法。我們其實并不關心深度不深度,我們只關心有用的算法。所謂有用的算法就是提高決策質量,提高決策速度。在商業(yè)上的點一定要夠細,細到可以用一兩個很簡單的指標去衡量。像同盾干的就是幫銀行提高你能夠抓住壞人的準確度,當然銀行有自己的指標,叫KQ什么之類的,有點忘掉了,它有嚴格的定義,你的方法能把這個提高就是好的算法。像我們投的桃樹,是幫銀行提高貸后風控,應不應該給你發(fā)放貸款,應該以什么樣的利率這樣的一些問題。銀行有它的一套系統(tǒng),如果能夠幫它以更低的成本把貸款發(fā)出去,那你就是一個好的算法。
人工智能這幾年很火,人工智能不等同于深度學習,但是的確在深度學習這個事流行之前人工智能這個詞是不流行的。
在算法這邊不應該做什么呢?不應該為了智能而智能。
這塊有兩個領域是典型在我們做投資的時候看到的,很多人忽悠這個概念,其實是扯淡為主,基本上不是真正的智能。第一個叫做智能設計,很多是把很多設計師手里的規(guī)則自動化,沙發(fā)對面放一個電視,臥室也是,床頭柜這些無非是有什么元素可以選的,把它搭配起來,是規(guī)則驅動的。因為我們在這里面投過一家非常成功的公司,它有這個概念,我為了準備PPT,我在其它地方講過,我還說你要兜底這個智能到什么程度,他說主要是用詞問題,我最早的時候提到的規(guī)則系統(tǒng)的一個自動化并非真正的智能設計,沒有什么美感設計感的。智能投顧,大部分是原來的主題基金換了一個臉,跟真正的理解你這個人的投資需求跟理解市場上的投資機會整合起來提供一個適合你的投資方案。這種在美國做的非常成熟,各種原因,有些不是技術的原因,管控的原因,并非一個全局優(yōu)化的方案,所以我們認為不能稱之為智能投顧。
應用我也不展開,我們投的東西一定要有潛在的應用場景,有一個緊密的結合。因為人工智能領域有個特點,它跟學術關聯(lián)性比較高。所以我們看待這個問題的時候典型的是這么一個面,科研出發(fā),然后到技術是一步,技術到產品是另外一步,然后產品只有有機會變成商品,而不是我們投的已經商品化,有機會變成商品,你要賣得出去而且有一定的量,這才是真正有機會成功的。我們投的地平線機器人,這是很著名的一家公司,也是典型的原來想從泛的角度,后來還是落實到非常結實的應用場景,從商品角度怎么形成一個科考的可理解的應用解決,形成一個有很多人愿意買的商品。
最后一點是不該做什么,不投數(shù)據(jù)商業(yè)模式牽強的。這里提幾個原來大家看To C這塊的理念很不一樣的我們的一些投資邏輯。
第一個對很多數(shù)據(jù)公司的建議是,你提供數(shù)據(jù)這種賣不了太多錢,你要提供別人基于你這個平臺能夠做什么。
第二個我就不重復了,更好的決策,更快的決策,解決實際問題。
第三個是一定要羊毛出在羊身上,不像我們To C的時候說羊毛出在豬身上,讓狗買單,這個事情在To B人工智能行不通。大多數(shù)多多少少會走到To B的業(yè)務模式,To C成功的極少。今日頭條算半個。銷售團隊的建設,這個也是很多學者型的創(chuàng)業(yè)的人很難躍過的一個創(chuàng)業(yè)時候要成功的必要條件,是一個鴻溝。
話說了那么多,我們在國內的早期基金當中是非常多的,也是做的比較早的。雖然現(xiàn)在我們認為這里面泡沫很大,但是智能相關的投資才剛剛開始,這個領域的話至少我們認為還有5年的時間可以有很熱鬧的投資跟創(chuàng)業(yè)的機會存在。這是我今天的分享,感謝大家。
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。