0
本文作者: 李雨晨 | 2021-10-20 10:15 |
“Think big”是領(lǐng)創(chuàng)智信技術(shù)研發(fā)負責(zé)人王芳林在采訪中提及次數(shù)最多的詞匯,某種程度而言,它已經(jīng)成為了這家公司基因的一部分。五年前,正是這組基因的內(nèi)生動力驅(qū)使著這家初出茅廬的初創(chuàng)公司,將目光放得更長遠,率先瞄準(zhǔn)了東南亞市場,并穩(wěn)步擴張到南亞、非洲和拉丁美洲。
如今,領(lǐng)創(chuàng)智信已經(jīng)先后在新加坡、中國、印度、印尼、越南、菲律賓設(shè)立辦公室,服務(wù)超過800家行業(yè)客戶,成為了新加坡獨立科技創(chuàng)業(yè)企業(yè)中最耀眼的明星之一。
對于王芳林來說,“think big”至少有兩個維度的涵義:
首先,在宏觀戰(zhàn)略層面要立足高遠?!氨热缥覀冊O(shè)計一款產(chǎn)品,首先要思考它是否有機會拓展到全球。如果可以服務(wù)全球客戶,我們應(yīng)該怎樣來制定戰(zhàn)略,團隊?wèi)?yīng)該是什么樣的人員配比,跟合作伙伴要建立怎樣的合作機制?!?/p>
其次,在微觀技術(shù)實現(xiàn)層面,也要有全局思維。比如開發(fā)算法模型時,要先把橫向和縱向的相關(guān)因素都思考清楚,而不是只看到眼前的一畝三分地。
王芳林的全局思維和他的職業(yè)發(fā)展路徑不無關(guān)系。加入領(lǐng)創(chuàng)智信前,王芳林在新加坡本土的一家創(chuàng)業(yè)公司擔(dān)任CTO,是個純粹的技術(shù)派。2017開始,王芳林和領(lǐng)創(chuàng)智信的創(chuàng)始團隊接觸,但考慮到當(dāng)時離開對原公司影響較大而作罷。而在經(jīng)過一年多的觀察后,王芳林最終選擇了加入。
領(lǐng)創(chuàng)智信技術(shù)研發(fā)負責(zé)人 王芳林
入職之初,王芳林的角色是某條AI產(chǎn)品線的負責(zé)人?!坝悬c類似一個小型CEO的角色,不僅要管產(chǎn)品和研發(fā),有時候還要和商務(wù)團隊一起推動產(chǎn)品的商業(yè)化。”
后來隨著公司發(fā)展壯大,為集中力量辦大事,更好地服務(wù)客戶,資源整合逐漸被提上日程。組織架構(gòu)調(diào)整后,王芳林重新回到研發(fā)崗位,但這段特殊的經(jīng)歷卻給他打下了深刻的烙印,使他看待問題有了新的視角?!耙苍S正是因為這近三年全棧式的職業(yè)經(jīng)歷,我現(xiàn)在會主動地去做全局思維,和包括產(chǎn)品、運營、商務(wù)在內(nèi)的兄弟團隊合作起來會更加容易和順暢?!?/p>
商場如戰(zhàn)場,作為一名久經(jīng)沙場的老兵,王芳林自然懂得“兵無常勢,水無常形”的道理。市場瞬息萬變,不管戰(zhàn)略規(guī)劃做的多么細致周到,終歸是趕不上變化。所以他的“think big”其實還有后半句,那就是“act small”。
“作為創(chuàng)業(yè)公司,我覺得最重要的是不要怕犯錯。方向性的東西是比較容易想到的,但它適不適合你當(dāng)前所處的市場環(huán)境,這是書本和方法論沒辦法解決的問題。所以你需要做的就是小步快跑、快速試錯,通過不斷總結(jié)和復(fù)盤來驗證策略并讓自己迅速成長。”
加入領(lǐng)創(chuàng)智信三年,王芳林看著公司一步步發(fā)展壯大。如今他帶領(lǐng)的技術(shù)研發(fā)部門已經(jīng)擁有70多人的規(guī)模,雖算不上龐大,但也已經(jīng)五臟俱全。
王芳林向雷鋒網(wǎng)介紹,他的部門包含四個團隊——工程團隊、數(shù)據(jù)標(biāo)注團隊、AI團隊和數(shù)據(jù)科學(xué)團隊,各自有不同的分工。
數(shù)據(jù)標(biāo)注團隊,顧名思義,其主要職責(zé)就是給數(shù)據(jù)加上標(biāo)簽。
目前行業(yè)內(nèi)的數(shù)據(jù)標(biāo)注團隊主要有三種類型:一是AI公司自建的數(shù)據(jù)標(biāo)注團隊,二是專業(yè)的數(shù)據(jù)標(biāo)注平臺,三是承接數(shù)據(jù)標(biāo)注服務(wù)的外包公司,三者各有優(yōu)劣。
AI公司自建團隊的人員素質(zhì)更好、效率更高,但數(shù)據(jù)標(biāo)注需求并不固定,維持一支龐大的數(shù)據(jù)標(biāo)注團隊性價比往往不高。
專業(yè)的數(shù)據(jù)標(biāo)注平臺相比自建團隊擁有完善的產(chǎn)業(yè)鏈,具有盈利能力,能較好地平衡成本和質(zhì)量。
此外,在國內(nèi)三四線城市也存在一些承接數(shù)據(jù)標(biāo)注服務(wù)的外包公司,由于勞動力成本較低,他們在價格上最具優(yōu)勢,但在標(biāo)注質(zhì)量和效率上存在許多不足。
領(lǐng)創(chuàng)智信的數(shù)據(jù)標(biāo)注團隊在建立時就希望能夠發(fā)揮東南亞的低成本、高素質(zhì)的人力優(yōu)勢,結(jié)合自身的AI經(jīng)驗,除了服務(wù)公司內(nèi)部AI團隊,也要具備承接外部項目的能力,結(jié)合三種不同類型數(shù)據(jù)標(biāo)注團隊的優(yōu)勢。
領(lǐng)創(chuàng)智信的數(shù)據(jù)標(biāo)注團隊負責(zé)人張新田認為,隨著AI技術(shù)逐步發(fā)展和深入,數(shù)據(jù)標(biāo)注勢必將從簡單類數(shù)據(jù)標(biāo)注轉(zhuǎn)向?qū)I(yè)性數(shù)據(jù)標(biāo)注,對標(biāo)注人員的專業(yè)知識提出更高要求,數(shù)據(jù)的標(biāo)注模式也將由勞動密集型轉(zhuǎn)向AI輔助人力標(biāo)注的新型模式。
因此,未來擁有專業(yè)數(shù)據(jù)標(biāo)注能力的企業(yè)將展現(xiàn)出巨大優(yōu)勢。目前,領(lǐng)創(chuàng)智信已經(jīng)在AI輔助標(biāo)注方面取得了初步成果?!案鶕?jù)我們統(tǒng)計,AI輔助人工標(biāo)注的方法可以將我們的效率提升75%?!?/p>
有了更好的數(shù)據(jù)基礎(chǔ)和規(guī)模,才能為專注于AI算法模型的AI團隊和聚焦于信用評分模型的數(shù)據(jù)科學(xué)團隊提供更好的“養(yǎng)分”。
AI團隊負責(zé)人余江波介紹,在領(lǐng)創(chuàng)智信聚焦的東南亞市場,計算機視覺等技術(shù)有著非常廣闊的應(yīng)用前景,尤其是在金融風(fēng)控、反欺詐等領(lǐng)域。東南亞的金融體系發(fā)展起步較晚,各機構(gòu)之間猶如信息孤島,缺乏關(guān)聯(lián),很難實現(xiàn)統(tǒng)一化、集中式的征信管理。銀行賬戶和信用卡持有率偏低,以及官方身份驗證相關(guān)技術(shù)基礎(chǔ)設(shè)施缺失,導(dǎo)致在做風(fēng)控和征信時缺少相關(guān)技術(shù)與數(shù)據(jù)。
因此,引入計算機視覺等人工智能技術(shù)以防范各種金融風(fēng)險就成為當(dāng)?shù)叵嚓P(guān)行業(yè)用戶的迫切需求。
除了計算機視覺,信用評分模型也是金融機構(gòu)應(yīng)用AI技術(shù)頻率最高的領(lǐng)域之一。判斷一個信用評分模型好壞,穩(wěn)定性是考量的重要維度之一。
數(shù)據(jù)科學(xué)團隊負責(zé)人王爭光介紹,領(lǐng)創(chuàng)智信的數(shù)據(jù)科學(xué)團隊會從兩個方面入手來保障模型的穩(wěn)定性:一是覆蓋盡可能多的樣本,二是選擇具有持續(xù)穩(wěn)定性的數(shù)據(jù)特征來建模。
信用評分模型中的很多數(shù)據(jù)特征都是跟時間強相關(guān)的,因此選擇具有持續(xù)穩(wěn)定性的特征至關(guān)重要。特征的持續(xù)穩(wěn)定性可以分成兩個維度來看:一是分布的穩(wěn)定性,即該特征在一段比較長的時間內(nèi),走勢是比較穩(wěn)定的;二是效果的穩(wěn)定性,即一個特征現(xiàn)在是有效的,一年后依然有效。
通過這兩種方式,目前領(lǐng)創(chuàng)智信的信用評分保證了模型的穩(wěn)定性,同時AUC也可以實現(xiàn)業(yè)界領(lǐng)先的效果。
數(shù)據(jù)標(biāo)注團隊、AI團隊和數(shù)據(jù)科學(xué)團隊各具特色,不過單純從規(guī)模來看,人數(shù)最多的還是工程團隊,作為連接內(nèi)外部的橋梁,工程團隊肩負著雙重使命。
一方面,領(lǐng)創(chuàng)智信有先進的算法和模型,但最終交付給客戶,還需要將其轉(zhuǎn)化成簡單易用的服務(wù)。工程團隊負責(zé)人張云樂介紹,領(lǐng)創(chuàng)智信的產(chǎn)品交付有兩種模式:
一種是云上部署的SaaS服務(wù),用戶登錄賬號后就可以非常簡單方便地調(diào)用接口;另一種是私有化的本地部署,可以在安全合規(guī)的內(nèi)網(wǎng)環(huán)境下快捷訪問API。
“無論哪一種交付模式,客戶都無需理解模型文件的內(nèi)容,就可以輕松調(diào)用其背后的能力?!?/p>
另一方面,AI數(shù)據(jù)標(biāo)注團隊、CV+NLP團隊和數(shù)據(jù)科學(xué)團隊內(nèi)部也有很多可以協(xié)作的地方,工程團隊就承擔(dān)一個中臺、連通器的作用。“比如CV+NLP團隊的OCR、人臉識別等產(chǎn)品會產(chǎn)生很多結(jié)構(gòu)化的數(shù)據(jù),是數(shù)據(jù)科學(xué)團隊可以直接拿去用的。數(shù)據(jù)中臺的作用就是把我們對數(shù)據(jù)的所有需求統(tǒng)一起來,實現(xiàn)內(nèi)部共享”。
各個團隊在開發(fā)和訓(xùn)練模型時需要處理大量數(shù)據(jù),最常見的需求之一就是從數(shù)據(jù)中提取特征。為幫助大家更加方便地提取和管理特征,提高開發(fā)效率,領(lǐng)創(chuàng)智信的工程團隊正在嘗試搭建一個特征平臺?;谔卣髌脚_,開發(fā)團隊僅需要簡單編程就可以獲取到數(shù)據(jù)特征,實現(xiàn)低代碼的敏捷開發(fā)。
技術(shù)研發(fā)負責(zé)人王芳林介紹,目前領(lǐng)創(chuàng)智信的技術(shù)研發(fā)團隊仍在快速擴充當(dāng)中,預(yù)計年底會增加到上百人的規(guī)模。
在一個快速成長的團隊中,如何迅速讓新成員融入進來,把大家擰成一股繩,對于管理者來說是個不小的挑戰(zhàn)。從結(jié)果來看,王芳林勝任得還不錯,團隊?wèi)?zhàn)斗力十足,已經(jīng)成了公司快速成長的重要引擎之一。
王芳林認為,企業(yè)管理可以劃分成兩個大的維度——戰(zhàn)略和組織能力。戰(zhàn)略決定了航行的方向和目標(biāo),而組織能力是這艘輪船能否有足夠動力快速駛向終點的關(guān)鍵。
他向雷鋒網(wǎng)表示,在大型企業(yè)里,管理者傾向于通過文化和規(guī)則來提升組織力,而在領(lǐng)創(chuàng)智信這樣的創(chuàng)業(yè)公司,有一個因素比文化和規(guī)則更加重要,那就是企業(yè)和個人成長的協(xié)同一致性。
“很多人可能覺得這個很難,或者沒有把它的優(yōu)先級放得那么高,或者沒有決心去做,但其實這才是非常重要的組織成長的驅(qū)動力。思考整個團隊的發(fā)展方向,制定流程和組織架構(gòu)時,這是我要考慮的核心要素之一?!?/p>
在技術(shù)研發(fā)團隊的支撐下,領(lǐng)創(chuàng)智信已經(jīng)將業(yè)務(wù)觸角延伸到了多個領(lǐng)域,不過金融行業(yè)仍是其最主要的賽道。
王芳林表示,金融是AI技術(shù)應(yīng)用最早的領(lǐng)域之一,信用評分和身份驗證等技術(shù)很早就在歐美落地了。近年來,隨著數(shù)字化程度不斷提升,基于結(jié)構(gòu)化數(shù)據(jù)進行線上反欺詐的需求也日趨旺盛。
盡管金融行業(yè)是AI的“先行示范區(qū)”,可東南亞地區(qū)互聯(lián)網(wǎng)化程度較低的現(xiàn)狀還是給金融AI技術(shù)的普及帶來了一定的挑戰(zhàn)。在國內(nèi),金融機構(gòu)非核心業(yè)務(wù)上云已經(jīng)是非常普遍的事情,而在東南亞地區(qū)受限于監(jiān)管,更多采用的仍然是傳統(tǒng)IDC的部署形式,不僅成本高昂,效率也有待提升。
同時,由于網(wǎng)絡(luò)基礎(chǔ)設(shè)施較差,領(lǐng)創(chuàng)智信在部署產(chǎn)品時也需要針對性地做很多優(yōu)化。比如,針對圖像、視頻等多媒體信息,如何在最大限度減少對帶寬消耗的情況下,實現(xiàn)精準(zhǔn)的識別和判定。這些經(jīng)驗需要長期實踐和總結(jié)才能一步步沉淀。
王芳林介紹,盡管深度學(xué)習(xí)技術(shù)是當(dāng)前人工智能領(lǐng)域最大的熱門,但在金融信用評分和反欺詐方面并沒有特別廣泛的應(yīng)用。相反,傳統(tǒng)機器學(xué)習(xí)技術(shù)要更加常見。其中一個主要原因是因為金融是一個強監(jiān)管的行業(yè),要求算法模型具備可解釋性,而深度學(xué)習(xí)模型大多數(shù)情況下仍然是一個“黑盒子”。
同時,深度學(xué)習(xí)算法就像一個以數(shù)據(jù)為食的“巨獸”,需要大量數(shù)據(jù)的“飼喂”才能得到較好的運用效果。但金融行業(yè)受限于監(jiān)管,企業(yè)能夠使用的數(shù)據(jù)仍然比較稀缺。
不過他也樂觀地表示,“深度學(xué)習(xí)算法在監(jiān)管要求不高的領(lǐng)域仍大有可為,而且隨著數(shù)據(jù)的積累和技術(shù)的迭代,未來深度學(xué)習(xí)算法也一定可以被解釋得更加合理清晰,并在金融行業(yè)占有一席之地?!?/p>
AI團隊負責(zé)人江波介紹,為了解決數(shù)據(jù)標(biāo)簽稀缺的問題,除了使用傳統(tǒng)的遷移學(xué)習(xí)技術(shù)外,領(lǐng)創(chuàng)智信也在積極探索數(shù)據(jù)合成、半監(jiān)督/無監(jiān)督、主動學(xué)習(xí)等當(dāng)下熱門的人工智能前沿技術(shù)。
以圖像識別領(lǐng)域的遷移學(xué)習(xí)為例,目前網(wǎng)絡(luò)上有很多公開的圖像數(shù)據(jù)集。這些數(shù)據(jù)可以作為“第一手資料”,幫助數(shù)據(jù)積累薄弱的初創(chuàng)公司迅速完成模型訓(xùn)練的“冷啟動”。
領(lǐng)創(chuàng)智信經(jīng)過近4年服務(wù)大量客戶的實踐經(jīng)驗,已經(jīng)積累了不少數(shù)據(jù),這些不同國家的數(shù)據(jù)通過遷移學(xué)習(xí),可以幫助其在進入一個新市場時,迅速開發(fā)出適應(yīng)新市場特性的模型和產(chǎn)品。
“就拿OCR來說,基于我們過去的數(shù)據(jù)積累,如果要開發(fā)一個新的證件識別產(chǎn)品,只需要1天。”
企業(yè)進入新的行業(yè)或市場時,除了面對數(shù)據(jù)稀缺的難題,也要經(jīng)歷對算法設(shè)計泛化能力的考驗。
為了讓算法模型具有更好的泛化能力,領(lǐng)創(chuàng)智信在做算法開發(fā)時就會強調(diào)算法模型的可復(fù)用性,抽出一些通用的模塊。后續(xù)做進一步的產(chǎn)品開發(fā)時,只要將這些泛化的抽象模塊像搭樂高積木一樣搭起來,再針對不同客戶進行上層的定制化開發(fā),就能取得較為理想的效果。
作為一家深耕東南亞的出海企業(yè),相比技術(shù)上的挑戰(zhàn),領(lǐng)創(chuàng)智信遭遇更多的還是業(yè)務(wù)上的難題。
和國內(nèi)市場相比,海外市場的客戶更注重產(chǎn)品全生命周期的標(biāo)準(zhǔn)化和合規(guī)性。但東南亞地區(qū)國家數(shù)量眾多,不同國家之間的宗教、文化、政治、經(jīng)濟和技術(shù)基礎(chǔ)設(shè)施差異顯著,這又導(dǎo)致他們對于產(chǎn)品標(biāo)準(zhǔn)化和合規(guī)性的需求是不完全相同的。
王芳林說到,“早期我在做AI產(chǎn)品線的時候,非常強調(diào)標(biāo)準(zhǔn)化。但后來逐漸發(fā)現(xiàn)不同國家的客戶在其特有的監(jiān)管要求下,普遍擁有定制化的需求,這時候就不得不去做一些調(diào)整和改變?!?/p>
領(lǐng)創(chuàng)智信找到平衡點是,用標(biāo)準(zhǔn)化的方式做產(chǎn)品中間最通用、核心的部分,同時引入合作伙伴比如本地的系統(tǒng)集成商,客戶定制化需求交給合作伙伴,達到客戶、合作伙伴、自己的三贏。
某種程度而言,領(lǐng)創(chuàng)智信已經(jīng)初步構(gòu)建起了自己的生態(tài),而“標(biāo)準(zhǔn)化產(chǎn)品+ISV定制開發(fā)”正是其生態(tài)的根本內(nèi)核。再深一步說,這也是對于金融這個行業(yè)的認知和實踐不斷深入的過程。
在AI獨角獸們紛紛遭遇發(fā)展瓶頸的當(dāng)下,領(lǐng)創(chuàng)智信能在短短五年內(nèi)就在東南亞市場闖出一片天,絕不是用“幸運”兩個字就能輕松解釋的。
事實上,它已經(jīng)在快速奔跑和大量的市場實踐中總結(jié)出了自己獨特的價值觀和方法論。王芳林將其歸功于公司的三個“Centric”文化——Customer Centric、Data Centric、People Centric。強調(diào)對客戶需求的滿足,以數(shù)據(jù)為中心,同時注重人才培養(yǎng),尋求企業(yè)和員工成長的協(xié)同一致性。
王芳林表示,未來公司還將繼續(xù)圍繞這三大核心價值向前推進。至于下一個五年,他們能達到怎樣的新高度,時間會慢慢給出答案。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。