0
本文作者: 李詩 | 2018-04-10 14:22 |
近來,吳恩達、林元慶等AI界大牛紛紛辭職創(chuàng)業(yè),想要以AI賦能傳統(tǒng)行業(yè),受到極大的關(guān)注。他們這些有著領(lǐng)先的AI技術(shù)水平、豐富行業(yè)經(jīng)驗的大牛投身創(chuàng)業(yè)的思考和選擇,對創(chuàng)業(yè)者和行業(yè)人士都有著極大的價值。
雷鋒網(wǎng)了解到,云腦科技CEO張本宇也是一位重量級的創(chuàng)業(yè)者。在2015年,張本宇就率先創(chuàng)辦了云腦科技,致力于在AI與傳統(tǒng)行業(yè)之間建立橋梁。由于其平日較為低調(diào),很少詳細說明其創(chuàng)業(yè)的動機和他對行業(yè)的思考,此次,雷鋒網(wǎng)在張本宇從美國回來的間隙,特意約其見面,深入了解了他選擇AI+傳統(tǒng)領(lǐng)域創(chuàng)業(yè)的原因,云腦科技目前的新技術(shù)和新進展等,期望促進行業(yè)交流。
張本宇,深耕人工智能領(lǐng)域19年,申請及授予150項美國專利,在國際一流期刊及會議上發(fā)表的45篇論文已被引用超過6000次。創(chuàng)新工場AI工程院副院長王詠剛將其評價為“人工智能華人科學(xué)家中排名前10 位大牛之一”。
談起“人工智能華人科學(xué)家中排名前10位大?!边@個稱號,張本宇顯得十分不好意思。他說,畢竟自己進入AI早,也發(fā)表了很多論文,所以有些優(yōu)勢。對于這個稱號不必太認真。
和一些踏著AI風(fēng)口入場的人不同,張本宇是AI科班出身,在AI領(lǐng)域一待就是19年。
張本宇在少年時就迷上了人工智能。張本宇第一次接觸人工智能,來源于一款打著“人工生命”旗號的小游戲,通過編寫程序,可以讓一只小鳥沿著一定規(guī)則向前飛行,這個有意思的小游戲使得人工智能在張本宇心里扎下根。1995年,張本宇通過高考,進入了北京大學(xué)計算機專業(yè)。隨后,1999年,他在北大攻讀了人工智能碩士,踏上了AI的征程。
大學(xué)期間,張本宇曾在互聯(lián)網(wǎng)領(lǐng)域的小黃埔“ChinaRen”社區(qū)工作,這個社區(qū)培養(yǎng)了新浪、搜狐互聯(lián)網(wǎng)門戶的那批人,例如后來的王小川。讀研期間,張本宇首次創(chuàng)業(yè),與好友一起打造了一款融入AI技術(shù)的語音聊天室產(chǎn)品。這次創(chuàng)業(yè)的經(jīng)歷,也為他現(xiàn)在的創(chuàng)業(yè)埋下了一顆種子。
張本宇回憶道,在讀書的時候,人工智能還處在低谷時期,即使是在北大,張本宇也只能學(xué)到一些很老的方法。2002年,張本宇從北大畢業(yè),去了微軟亞洲研究院(MSRA)?!?000年前后國內(nèi)做計算機相關(guān)的研究最好的就是MSRA,當(dāng)時對研究感興趣的人基本都在那邊?!?在微軟亞洲研究院期間,針對“如何讓機器學(xué)習(xí)人工智能來幫助解決搜索”、“如何讓機器通過代碼處理大量的數(shù)據(jù)”這兩個問題,張本宇花費了長達六年時間鉆研國際最先進的論點,積累了深厚的學(xué)術(shù)知識。
2008年,張本宇期望能將學(xué)術(shù)付諸實踐。張本宇先是在Google工作,從事搜索廣告優(yōu)化。2010年,F(xiàn)acebook社交帝國初具雛形,其大量可用于AI研究的社交數(shù)據(jù)吸引了張本宇。據(jù)稱,他曾經(jīng)帶領(lǐng)團隊開發(fā)了Facebook中占據(jù)利潤來源90%以上的信息流廣告業(yè)務(wù)。在2013年,移動互聯(lián)網(wǎng)迅速崛起,Google成立新項目Google Now,致力于在手機中加入真正的智能,張本宇又被挖回Google Now項目。在吳恩達看來,AI誕生于數(shù)據(jù),張本宇的工作經(jīng)歷幾乎就是追著數(shù)據(jù)在跑,哪里的數(shù)據(jù)多,數(shù)據(jù)有價值,他就去哪里。
相對于計算機視覺等AI方向,張本宇所在的數(shù)據(jù)挖掘、語言處理領(lǐng)域成熟得要早一些。在Google做搜索、在Facebook做信息流和推薦,都與互聯(lián)網(wǎng)和用戶接觸緊密,張本宇的研究和工作也一直圍繞著如何用AI為消費者創(chuàng)造價值,這些需要研究用戶行為數(shù)據(jù)、有時間先后關(guān)系的序列數(shù)據(jù)(sequence Data)、文本數(shù)據(jù)等。這些經(jīng)歷為他日后的創(chuàng)業(yè)奠定了技術(shù)和商業(yè)的基礎(chǔ)。
2015年,他離開谷歌,毅然選擇回國創(chuàng)業(yè)。
“2015年,AI已經(jīng)成熟,可以走出互聯(lián)網(wǎng)去落地更多的應(yīng)用場景,或者說AI已經(jīng)能夠跳出這些少數(shù)巨頭。”張本宇回憶到,其實在研究生期間創(chuàng)業(yè)后,他一直都有創(chuàng)業(yè)的想法,每次換工作的時候都是有創(chuàng)業(yè)的機會,但是此前AI還不成熟,如果出來創(chuàng)業(yè)或許只能做一家以數(shù)據(jù)分析為核心的咨詢公司。
對于張本宇來說,2015年是很好的創(chuàng)業(yè)時機。首先,深度學(xué)習(xí)已經(jīng)具備向互聯(lián)網(wǎng)之外滲透的能力;其次,國內(nèi)大數(shù)據(jù)基礎(chǔ)設(shè)施的建立已經(jīng)有了幾年,許多行業(yè)已經(jīng)是屬于有數(shù)據(jù)的階段,同時大數(shù)據(jù)也有了一定的計算基礎(chǔ)平臺;最后,AI算法本身已經(jīng)發(fā)展到了一定的階段。
這時候,張本宇覺得,是時候了。于是,他和聯(lián)合創(chuàng)始人龍志勇一起創(chuàng)辦了致力于將AI與傳統(tǒng)行業(yè)連接的 “云腦科技”。
張本宇希望把AI從互聯(lián)網(wǎng)帶出來,去升級傳統(tǒng)行業(yè),那他必然會面對的第一個問題就是:從互聯(lián)網(wǎng)的數(shù)據(jù)中生長出來的人工智能,與傳統(tǒng)行業(yè)有極大的斷層。
目前,我們已經(jīng)熟知了百度的智能廣告平臺、今日頭條的精準(zhǔn)推薦,這些都完全基于互聯(lián)網(wǎng)上的用戶數(shù)據(jù)。傳統(tǒng)行業(yè)雖然也有數(shù)據(jù),但是大多數(shù)都分散在不同的時間和場景中,難以利用。張本宇發(fā)現(xiàn),不同的行業(yè)在利用AI時有一些共性的問題: “數(shù)據(jù)如何選擇和導(dǎo)入?”、模型和技術(shù)如何組合?”和“輸出如何集成到業(yè)務(wù)?”。
在看到這些問題以及共性后,云腦科技定位為——打造人工智能與行業(yè)的橋梁。借用軟件領(lǐng)域的術(shù)語,云腦科技將這個橋梁稱為“中間件”。在與不同的傳統(tǒng)企業(yè)的合作中,云腦科技主要負責(zé)AI數(shù)據(jù)處理、建模策略、業(yè)務(wù)集成,并將其打造成可以組合的行業(yè)AI中間件嵌入到提供給終端客戶的PaaS/SaaS平臺或者服務(wù)中。
目前,云腦科技已經(jīng)推出了四款A(yù)I(X)產(chǎn)品,覆蓋通信行業(yè)、金融科技、人才教育、能源制造四個領(lǐng)域。為了更好地理解云腦科技的業(yè)務(wù)模式,張本宇詳細介紹了云腦科技與銀聯(lián)合作的案例。銀聯(lián)有大量的用戶行為數(shù)據(jù)都是極難處理的Sequence Data,正好是張本宇最擅長的領(lǐng)域。云腦科技基于銀聯(lián)的消費數(shù)據(jù),自動學(xué)習(xí)并動態(tài)更新用戶全景個性化智能模型。利用這一模型,可以根據(jù)銀聯(lián)已有的消費用戶群,自動發(fā)現(xiàn)相似的新用戶,從而以更低的成本,更好的轉(zhuǎn)化率來獲取高價值顧客。當(dāng)時云腦科技與傳統(tǒng)的協(xié)同過濾的算法進行過對比,人工智能的推薦方式帶來的到店率提高了5-10倍。目前,在云腦科技與銀聯(lián)合作提供的“智慧觸達Farcaster”平臺上,已有汽車、房地產(chǎn)、化妝品等行業(yè)客戶。
為了深入不同的行業(yè),云腦科技內(nèi)部有來自各個傳統(tǒng)行業(yè)的專家,與AI技術(shù)專家一起為傳統(tǒng)行業(yè)找到解決他們的痛點的方案。
云腦科技作為一家人工智能行業(yè)平臺公司,在深度學(xué)習(xí)、增強學(xué)習(xí)、NLP、知識圖譜等技術(shù)上都已經(jīng)有大規(guī)模項目成功實踐經(jīng)驗。但是,張本宇這個人工智能老兵出征創(chuàng)業(yè)后,并不打算一直依賴于帶出來的“存貨”,云腦科技還在不斷探索新的專利技術(shù)。在此次的深度訪談中,張本宇還介紹了兩大新技術(shù)。
當(dāng)然,這些新的專利技術(shù)也是圍繞著同一個核心:如何讓AI更好地與傳統(tǒng)行業(yè)結(jié)合。
張本宇談到,AI與傳統(tǒng)行業(yè)結(jié)合需要攻克兩大難點:數(shù)據(jù)隱私保護與深度模型可解釋性。
云腦科技的數(shù)據(jù)隱私保護專利被稱為——BrainSync專利技術(shù)。數(shù)據(jù)的取得來源分為終端的隱私數(shù)據(jù)與云端的公開數(shù)據(jù)。傳統(tǒng)方法是終端上的數(shù)據(jù)先上傳至云端,隨后利用云端統(tǒng)一到的所有數(shù)據(jù),訓(xùn)練出一個模型。因為能夠獲取到大量的有效數(shù)據(jù),訓(xùn)練出的模型才會比較精準(zhǔn)。但在這種條件下,人們終端設(shè)備的信息隱私得不到保障。
云腦利用獨家的BrainSync專利技術(shù)統(tǒng)一“小腦”模型成為一個“大腦”。由于終端模型中是無法提取到原數(shù)據(jù)的,用戶的隱私既能得到保障,訓(xùn)練到的模型“大腦”又不失精準(zhǔn)。可以說,BrainSync解決了數(shù)據(jù)隱私與模型精準(zhǔn)此消彼長的矛盾。
第二個技術(shù)是深度模型可解釋性。雖然深度學(xué)習(xí)模型一般被當(dāng)做黑箱來使用,但是很多場景下要求對AI決策的可解釋性。利用AI給傳統(tǒng)行業(yè)做決策時,很多用戶都希望能知道AI為什么能給出這個答案,做出這個選擇。就像是美國的法律要求自動駕駛系統(tǒng)能夠為自己的操作決策給出合理的解釋,例如當(dāng)時為什么沒能避開行人。還有一個更為極端的例子:如果AI決定要割去病人的一顆腎,但并不能夠給予出任何理由,它得出的結(jié)論便不能被信服、不能被采用。
云腦科技針對這類需求,在模型上的設(shè)計進行了改進,在保留了模型表達能力的基礎(chǔ)上,增加了可解釋性。張本宇以云腦科技在招聘上的合作舉了一個例子。一個JD的一條要求是: “喜歡追求新事物”,而一份求職者的簡歷描述為:“我知道雖然我的接受能力是一般的,但更重要的是,我喜歡學(xué)習(xí)新的東西,那樣使我快樂”。云腦科技將簡歷中的這句話按照不同的單元形成不同的字段語義——“雖然接受能力一般” “接受能力一般但喜歡” “一般但喜歡學(xué)習(xí)新”“喜歡學(xué)習(xí)新的東西”,這些語義分別與“喜歡追求新事物”的卷積相撞,“喜歡學(xué)習(xí)新的東西”這一語義成為最佳匹配。類似這樣,JD上下文的每一句話都能夠與求職者簡歷上下文的每一句話進行精準(zhǔn)分析,并得出最終的匹配值。這樣,云腦可以幫助HR推薦到匹配值最大的簡歷。這就意味著,在招聘行業(yè)中,云腦科技的產(chǎn)品不僅能夠幫助HR找到最符合的應(yīng)聘者、幫助應(yīng)聘者找到最符合的HR,同時還能夠給予雙方一份詳細的建議理由。
云腦科技目前在中國和美國均設(shè)有團隊。張本宇的美國團隊負責(zé)核心算法研發(fā),聯(lián)合創(chuàng)始人龍志勇負責(zé)的中國團隊則直接和行業(yè)客戶對接。
雷鋒網(wǎng)與張本宇的這次深入訪談也是恰巧抓住了他回國開會的間隙。雷鋒網(wǎng)也了解到,云腦科技目前的業(yè)務(wù)體量已經(jīng)達到千萬量級,他們正在尋求新一輪的融資。
在此前,2015年,云腦科技的技術(shù)研發(fā)團隊在硅谷成立時,獲得了峰瑞資本領(lǐng)投的千萬級天使輪融資,2017年完成由翊翎資本、美國中經(jīng)合集團等共同投資的數(shù)千萬元人民幣A輪融資。
對于下一輪的融資,張本宇表現(xiàn)得更加自信,他希望能夠?qū)で笈c自己的理念一致的投資者,能夠在AI上有所堅持。
相關(guān)文章:
林元慶創(chuàng)立行業(yè)AI解決方案公司Aibee獲1.65億元人民幣天使輪融資
重磅 | 吳恩達之后,林元慶也離開百度,將投身AI創(chuàng)業(yè)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。