0
| 本文作者: 李菁瑛 | 2020-08-18 12:19 | 專題:CCF-GAIR 2020 全球人工智能與機器人峰會 |
雷鋒網(wǎng)按:2020 年 8 月 7 日,全球人工智能和機器人峰會(CCF-GAIR 2020)正式開幕。CCF-GAIR 2020 峰會由中國計算機學會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(深圳)聯(lián)合承辦,鵬城實驗室、深圳市人工智能與機器人研究院協(xié)辦。
從 2016 年的學產(chǎn)結合,2017 年的產(chǎn)業(yè)落地,2018 年的垂直細分,2019 年的人工智能 40 周年,峰會一直致力于打造國內(nèi)人工智能和機器人領域規(guī)模最大、規(guī)格最高、跨界最廣的學術、工業(yè)和投資平臺。
在GAIR大會的第三天上午,企業(yè)服務專場迎來了循環(huán)智能聯(lián)合創(chuàng)始人楊植麟,為大家?guī)砹司始姵实难葜v。

楊植麟的演講主題為《NLP在企業(yè)銷售場景的應用與挑戰(zhàn)》。他提到,目前NLP在企業(yè)銷售場景的應用現(xiàn)狀是對話機器人落地最快,銷售輔助系統(tǒng)落地最難。要想解決銷售輔助系統(tǒng)落地難的問題,一是要提升技術基礎,即深度學習和自然語言處理技術;二要通過先進的工程技術和靈活的產(chǎn)品設計,降低部署成本;三要深入企業(yè)內(nèi)部銷售流程的業(yè)務實踐。
楊植麟表示,當前企業(yè)銷售場景的一大痛點是隨著銷售業(yè)務和產(chǎn)品的動態(tài)變化,語義標簽也需要頻繁調(diào)整,但語義點的標注成本居高不下。除了技術能力,突破坐席輔助系統(tǒng)的前提是洞悉銷售與客戶的溝通過程與結果之間的關系。通過分析溝通過程與結果之間的關系,就能知道某一場景下講到某部分內(nèi)容有助于成單。
他還提到了AI輔助銷售溝通和營收增長的全流程應用,包括線索篩選、坐席輔助、執(zhí)行監(jiān)督、銷售對練。
以下為楊植麟的現(xiàn)場演講內(nèi)容,雷鋒網(wǎng)作了不改變原意的編輯及整理:
大家好,非常榮幸參加這個活動,先從一個故事講起。2018年的夏天我到谷歌實習,實習前,推薦我的學長跟我說,你到谷歌有一兩千個TPU可以用,你想想這個暑假要干什么。我整天輾轉(zhuǎn)反側,難以入眠,因為我在學校只能用10個GPU,那我能用這么多的TPU做什么。當時在NLP領域是沒有答案的,即使給你再多計算資源,也沒有人知道如何才能在NLP領域取得更大的突破。但是從2018年至今,NLP領域經(jīng)歷了一個非常大的變化,從Transformer、ELMO、BERT、XLNet、GPT-3等模型,完成了一系列突破性的轉(zhuǎn)變,解鎖了很多真實的應用場景。我今天就想分享下在企業(yè)銷售場景的應用,會發(fā)現(xiàn)以前做不到的場景、做不到的效果,現(xiàn)在可以完成和實現(xiàn)更好的效果和解鎖新的場景。
我先介紹一下循環(huán)智能這個公司,創(chuàng)始團隊來自于清華大學和CMU,之前在谷歌、Facebook、微軟等公司做過前沿的研究,獲得了紅杉資本等機構的融資,主要業(yè)務是開展企業(yè)服務,通過幫助企業(yè)提升銷售過程中的效率,以此提升整體的業(yè)績和銷售轉(zhuǎn)化率,服務目標主要是中大型銷售/客服中心的客戶。
在這個場景的應用主要分成兩類:
第一類是替代人的工作,就是現(xiàn)在落地比較好的對話機器人。對話機器人分為幾種,如外呼機器人、文本機器人等。這部分機器人做的事情,從附加值來說是比較低的,因為它相對來說是低重復、低社交的工作,比如回訪、收集信息等偏簡單的任務。
還有一類是在營銷鏈條里高社交、低重復的部分,稱為銷售輔助。在銷售全流程當中,你要做很艱難且非常重要的決策,包括篩選線索、給用戶推薦產(chǎn)品,要知道什么時候用什么話術,這在銷售流程里面具備極高的附加值。這部分的技術難度非常高,一直沒有被突破。我們看到新的預訓練、語音識別的提升技術帶來突破后,可以在這些場景進行解鎖。

之前銷售輔助為什么沒有得到很好的應用?主要是面臨以下幾個挑戰(zhàn):一是如何得到高準確率的語音識別;二是語義理解如何做到高準確和高召回率;三是如何通過性能優(yōu)化做到低延時和高并發(fā);四是通過降低運營成本,使得邊際成本降下來,并進行快速配置。

首先是語音識別。語音識別在很多場景得以落地,但在電話、在線的語音系統(tǒng)里,由于采樣率和各種延時要求的影響,目前還有很多問題尚待解決。
2019年,我們提出了Transformer-XL模型,一開始應用于序列建模上,作為自然語言處理的任務,后來創(chuàng)新性地用到語音識別,這在行業(yè)里面是屬于首次。它跟傳統(tǒng)的語音識別模型不同之處在于,現(xiàn)在不再需要把聲學模型和語言模型拆分,就可以提升端到端優(yōu)化、快速部署的能力。

這個是我們在真實的商業(yè)銀行的落地測試案例,可以發(fā)現(xiàn)對于領域數(shù)據(jù)的擬合能力會遠遠超過傳統(tǒng)RNN/CNN+CTC的效果,可以達到超過90%的準確率。這在低采樣率、低延時的實時呼叫中心的 語音識別問題上,是一個比較好的成績。

其次是語義理解。這個在輔助場景中更難落地,因為在人與人溝通過程當中涉及更高級的話術,更多用戶的意圖,而不僅僅是機器人場景中做一些簡單的回訪或問題采集。這時需要更準確的語義理解。
在語義理解方面使用了我們自研的XLNet模型,發(fā)表在2019年7月,在20項任務上的表現(xiàn)超過了BERT,在18項取得了SOTA第二的成績。發(fā)表了不到一年里引用量超過1000,是2019年NLP研究中全球引用量最高的paper。在實際落地時,我們對這個模型做了進一步的優(yōu)化和提升,就有了隨后XLNet-2的落地。
它結合了傳統(tǒng)兩大自然語言建模陣營的優(yōu)點:第一個陣營是自編碼,主要做的事情是對輸入加噪聲,試圖重現(xiàn);第二種是自回歸,預測序列未來會發(fā)生什么事情。

這是真實的案例,XLNet在語義點上它有2-10倍的提升,一方面是召回率,另一方面是準確率,得到更多的樣本情況下,準確率是更高的,找到符合想要的語義的意思。
第三個方面是性能優(yōu)化。性能優(yōu)化是多維度的算法和工程相結合的問題,比如說在呼叫中心里面就要實時地識別客戶的意圖和話術推薦,需要對并發(fā)和延遲有非常高的要求。經(jīng)過優(yōu)化,現(xiàn)在可以做到在1萬塊錢的GPU上并發(fā)100路,單卡有8卡無CPU瓶頸,接近線性加速。這在兩年前是幾乎不可能的,當時我們評估下來的成本是有幾百萬,但經(jīng)過我們后來的一系列技術優(yōu)化,現(xiàn)在1萬塊錢可以支持100路,假設我是幾千人的呼叫中心,這個成本也是相當?shù)偷摹?/p>

另一方面,可以做到端到端極低的轉(zhuǎn)寫延遲。來自兩個層面:一是算法的優(yōu)化。可以重用在歷史的片斷和結果,使得實時語音轉(zhuǎn)寫時不需要重新計算,這個可以大幅度降低轉(zhuǎn)寫的成本。二是在工程上,不管從數(shù)據(jù)調(diào)度還是底層JIT Inference,都做了大量的優(yōu)化來降低速度,使得系統(tǒng)能夠在遠低于市場平均水平做到低延時、高并發(fā)的轉(zhuǎn)寫。
第四個方面,也是非常關鍵的問題,如何降低部署和運維的成本。
舉一個保險行業(yè)的例子,推出新業(yè)務時,就需要調(diào)整和配置新的話術,但此時都需要收集和生產(chǎn)標注成本,這個中間的成本非常高。我們看到交付客戶時,供應商需要有10個人團隊在客戶那邊駐廠,客戶也需要有5個人全職配置這個東西。這就很難規(guī)模化,邊際成本非常高,就很難用SaaS的商業(yè)模式運行。為了滿足這個訴求,我們就必須去最大限度降低標注和生產(chǎn)的邊際成本。
為此,我們采用了一系列的技術優(yōu)化,包括Active Learning、Multi-Task Learning、預訓練等技術降低標注成本、提升標注效率,我們現(xiàn)在能通過非常低的成本生產(chǎn)新的語音標簽。比如,使用Active Learning可以砍掉80%的標注,原來100個,現(xiàn)在只需要20個標注就能完成同樣的效果。以前是10個人,現(xiàn)在就砍成1-2個人,業(yè)務也不需要專門的團隊負責,就可以實時配置。

最近有一些新的模型出現(xiàn),比如說大家關注的GPT-3,其中基于少樣本學習的能力,可以擴大模型和數(shù)據(jù)的量級,從而提升效果。
另外一個角度,從場景化方面,如何基于預訓練模式,通過對場景化的算法優(yōu)化,在特定場景下用很少的標記數(shù)據(jù)也能做到。這是我們最近的新工作,通過在類的表征空間里優(yōu)化少樣本學習的效率,使得比世界級的研究機構更好的水平。這個是我們僅僅標注樣本的情況下,就能做到80%的表現(xiàn)。
剛剛說的是技術能力,包括語言識別、語義理解、如何降低部署和運營成本。除此之外,還需要對這個場景有更深刻的理解,才能真正讓AI去賦能和提升銷售的轉(zhuǎn)化率,這就需要打通溝通的過程和溝通的結果。
溝通的過程,如何做信息的傳遞和價值的傳遞,傳統(tǒng)的做法是讓銷售運營去配置很多的策略、寫很多模板等。這里會有兩個問題:一是完全基于人工的先驗規(guī)則,從來沒有經(jīng)過數(shù)據(jù)驗證,也不知道這樣做到底好不好;二是也不知道銷售到底是不是這樣做的,所有的會話數(shù)據(jù)對于銷售主管來說,就是一個黑盒子,之前沒有任何技術手段可以洞察和了解這個過程當中到底發(fā)生了什么,到底是不是我想的這樣。
我們要做的事情是打通溝通過程和結果之間的橋梁,用數(shù)據(jù)驅(qū)動的方式尋找溝通過程中與溝通結果相結合的環(huán)節(jié),以完成效率的提升。
比如在教育行業(yè),我們通過數(shù)據(jù)驅(qū)動的方式找到最優(yōu)的流程,再結合業(yè)務的知識,連接過程的結果。比如了解說這里不同的話術之間,對于成單率的影響是多少。
具備了剛剛說的條件,第一個條件是頂尖的技術,足夠解鎖這些應用的技術;第二個是要有行業(yè)的know-how,要知道過程和結果是如何連接,有了兩個之后就能打造營收-增長的閉環(huán)。閉環(huán)有三個節(jié)點:首先對銷售過程進行洞察和分析;然后通過分析的結果,提升銷售的能力;除了提升銷售能力之外,還給銷售進行輔助和指導。通過形成這樣的閉環(huán),去整體來提升銷售的業(yè)績。

在這個閉環(huán)中可以打造很多不同的應用,包括做線索的篩選、實時輔助的系統(tǒng)、執(zhí)行力監(jiān)督、銷售的培訓。這些長在閉環(huán)上的應用,就依托于以上提及核心的技術,以及對溝通過程和結果的連接。
第一個應用是線索評分。
我們在銷售流程里會有兩種不同的線索:一是公函線索;二是私函線索。公函線索有一個特點,它是歷史上有跟進和溝通過程,但最后沒有轉(zhuǎn)化的線索。這些線索存在最大問題是跟進效率比較低,很多時候我們只是用人工簡單的策略找到想要跟進的線索。通過這樣的手工策略是很難判斷,需要精確篩選哪些是高意向線索,才能大幅度提升銷售效率。私函線索也是一樣的問題,私函有幾百個線索,由于人的精力是有限的,如何合理分配精力,把重點的精力和最高標準的流程用到最先優(yōu)先級的客戶,提升線索轉(zhuǎn)化率的關鍵節(jié)點。我們會結合客戶歷史的溝通數(shù)據(jù)、客戶歷史的行為、畫像,通過中間的AI模型的pipeline來預測意向度,做產(chǎn)品推薦和預測業(yè)務相關的指標,以此提升銷售的效率。

以保險行業(yè)為例,我們最終實現(xiàn)成單率提升2.68倍,每通通時提升1.62倍。將不同方法在不同行業(yè)、不同客戶進行驗證,最終驗證公函成單率提升2-3倍以上。這是通過剛剛一套技術方法論能顯著地提升銷售業(yè)績。
第二個是坐席輔助系統(tǒng)。
在我們了解到溝通過程對結果產(chǎn)生影響之后,機器就能在溝通過程當中對坐席進行實時的輔助,實時輔助也是基于剛剛說的低延時、高準確的核心AI能力來打造的。另外,過程和結果之間怎么打通?我們要基于數(shù)百萬小時的行業(yè)語音數(shù)據(jù),從里面挖掘、提取和驗證中間有哪些話術和流程。有些需要擺脫模板的思維,不是人工專家定義了這樣的模板效果就會更好,而是通過數(shù)據(jù)驅(qū)動和生成模型相結合,去真正做到結果和過程的關聯(lián)。

實際的落地案例就有兩個主要效果:一是針對銷售的新人。銷售行業(yè)的新人流失率非常高,銷售新人的業(yè)績就會成為瓶頸。發(fā)現(xiàn)用了這個東西之后,新人業(yè)績可以增長更快。二是對全體的坐席。有的銷售坐席工作司齡有一定年限,但是實際上能力還是有很多可以提升的地方,跟公司的銷冠比起來有很多可以提升的內(nèi)容。這時我們把(支持給到)銷售行業(yè)里的銷冠,轉(zhuǎn)移到那些可能有很大提升空間的人身上,從而幫助整個團隊提升效率和團隊業(yè)績。
光做實時輔助還不夠,現(xiàn)在銷售管理非常大的痛點,就是只知道結果,而不知道過程,不知道到底團隊的問題在哪里。這時就需要通過AI的標簽和整套畫像體系來分析到底最需要關注哪些坐席和快速定位一些問題。借助執(zhí)行力監(jiān)督系統(tǒng),我們把問題定位和管理效率提升到原來的800%以上。
總結一下,我們希望打造完整的解決方案,不光是在低附加值的場景替代人,不光是通過機器人節(jié)省成本,而是通過一整套的銷售決策、輔助系統(tǒng),來全流程地用AI賦能,真正做到高附加值上提升業(yè)績。對于一個企業(yè)來說,大部分情況下,提升業(yè)績的價值會遠遠大于替代人力節(jié)省成本的價值。

這個是我們完整的架構,從底層上會做很多技術優(yōu)化,包括少樣本學習、快速推理、可解釋的預測、主動的學習、話術的挖掘,以此支持上面全流程的銷售的決策的應用,來達到提升銷售轉(zhuǎn)化率和銷售效率的結果。
我們目前服務的行業(yè)主要集中在金融、保險、教育等行業(yè)。
我今天的演講就到此,謝謝大家。
會后,楊植麟接受了雷鋒網(wǎng)的專訪,以下為Q&A環(huán)節(jié)。
問:從去年到現(xiàn)在的一年時間里,您主要做了哪些工作呢?無論是從研究上還是從產(chǎn)品的落地上,有沒有哪些徹底推翻的一些想法,或者說驗證過的正確的一些理論?
答:我覺得很重要的一個方向是去降低部署交付的成本。很多時候傳統(tǒng)SaaS模式為什么成立,是因為它的邊際成本非常低,基本上所有的客戶都在云上,用同一個軟件去交付不同的客戶。所以新來一個客戶,邊際成本特別低。但是AI在這個場景中不完全成立,因為一是很多大客戶需要私有化部署,二是對于新的公司,語義標簽是需要重新標注,它交付上的邊際成本會比較高,會導致整個行業(yè)的利潤率就沒有那么高。
我剛才說它的交付成本產(chǎn)生有兩個原因:一個是私有化部署,還有很多定制的需求,第二個是說去邊際的標注成本。為此我們分別從產(chǎn)品和技術兩方面去解決,一方面提供通用 API、智能模塊的封裝,更加微服務化,更加支持二次開發(fā)和靈活定制,這其實就相當于把標準產(chǎn)品和項目解決方案結合起來。
其次是降低AI的邊際成本,我們會去做預訓練模型,包括像XLNet、主動學習、多任務學習、小樣本學習,其實都是為了去解決這樣的一個問題。
這兩個方面我覺得是我可能是最近很長一段時間比較最關注的問題。
問:行業(yè)場景上的落地是當下非常關注的這樣一個話題,循環(huán)智能也是致力于用自然語言處理技術為企業(yè)銷售提供服務,從落地的角度,在這一年你們最大的進展有哪些?或者是在哪些環(huán)節(jié)上取得了一個大幅度的提升,是否符合您的預期?
答:我覺得進展還是很大的,尤其是在打通銷售的過程和結果方面。因為以前其實對話過程完全是個黑盒子,沒有人有能力或者意識去分析這個數(shù)據(jù),找到中間到底是哪些要素是跟結果是關聯(lián)的。NLP就是去做了這樣一件事情,比如可以把歷史上所有會話的記錄,不管是文本還是語音,通過結構化處理,跟結果做映射,這樣就可以解鎖很多場景,包括實時輔助、對話機器人、執(zhí)行力監(jiān)督等。
問:教育金融互聯(lián)網(wǎng)行業(yè)目前是循環(huán)智能最主要的幾大落地的行業(yè),從這些行業(yè)里你們發(fā)現(xiàn)了怎樣的用戶訴求的特征,這對于你們試圖利用NLP技術改善行業(yè)里面的銷售流程,或者是銷售人員溝通方面有怎樣的一個幫助?
答:我覺得最大的訴求就是不僅要做到降本,而且要做到增效。
從2017年至今,大部分的應用主要還是在對話機器人,能做的事情主要就是替代人,降低人力成本,但它沒有辦法做到業(yè)績的提升。相比之下,人力成本的降低跟業(yè)績的提升,邊際利潤是非常少的。對于整個產(chǎn)業(yè)來講,提升也非常有限,只是讓更多的人失業(yè)了。
我覺得增效還是很重要,最后導致的結果就是會提升整體的業(yè)績,這也是當下企業(yè)最大的訴求。增效訴求怎么來的?是因為很多流量現(xiàn)在越來越貴,企業(yè)只能去增效,所有的資源都要去最大化地應用?,F(xiàn)在剛好出現(xiàn)了這一波技術新要素,能夠通過Transformer、預訓練等真正做到績效的提升。
對我們來講,我們現(xiàn)在也很注重對價值的衡量。不管是去做線索的打分,還是去做實時輔助,我們現(xiàn)在都會去嚴格做很多ABtest,然后結果量化產(chǎn)品到底能帶來多少價值。我覺得這個是企業(yè)最關注的事情,而且是一個我們很大的實踐經(jīng)驗。
問:疫情給你們帶來了哪些機遇和挑戰(zhàn)呢?在新基建的推動下,循環(huán)智能又打算扮演一個怎樣的角色?
答:先說挑戰(zhàn),挑戰(zhàn)就是我覺得影響可能是暫時的,之前會有一定影響,整個行業(yè)對外的IT采購沒有跑那么快,很多客戶的流程會受到影響,但我們現(xiàn)在方案都基本上已經(jīng)恢復了。
機遇的話,我覺得主要是很多數(shù)據(jù)采集會更加完善,我們其實是非常依賴于數(shù)據(jù)的采集,而所有行業(yè)轉(zhuǎn)型都要先經(jīng)過數(shù)字化,再去做智能化。
我們現(xiàn)在發(fā)現(xiàn),很多行業(yè)其實沒有數(shù)字化這個過程,沒有數(shù)據(jù),AI就基本上什么都做不了。我覺得疫情促使了很多事情去往線上走,線上化勢必會帶來一個結果就是,現(xiàn)在有更多數(shù)據(jù)能夠被采集起來,所以從長期來看,我覺得對我們是一個利好,當然它可能需要一定的周期。
注:自然語言處理(NLP)是計算機科學,人工智能,語言學關注計算機和人類(自然)語言之間的相互作用的領域。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章