0
本文作者: 何思思 | 2023-06-02 10:50 |
作者丨何思思
編輯丨林覺民
“在ChatGPT出現(xiàn)之前,我們就已經(jīng)認識到大模型是個大趨勢,決定把公司已有產品的底層核心引擎全部轉移到大模型上,” 北京中關村科金技術有限公司技術副總裁張杰如是說。
這或許是很多人無法理解的,畢竟彼時大模型的概念還沒在國內流行開來。
而讓中關村科金下定決心全面擁抱大模型的原因在于,大模型并非新事物,早在2017年就有了Transformer的架構,次年谷歌就基于該架構推出了BERT大模型,并在產業(yè)界產生了不小反響。
反觀中關村科金的業(yè)務和產品,我們不難發(fā)現(xiàn),區(qū)別于其他To B公司,自2014年成立以來,中關村科金就選擇以對話式AI為核心技術,專注于企業(yè)服務賽道提供對話場景服務,其不僅注重底層技術的自研,還強調下場做應用。
自帶AI基因,或許也是中關村科金較早擁抱大模型的原因之一。
大模型方面,中關村科金也在沿著之前的路徑走:一是自研領域大模型,二是做上層應用。
緣何做領域大模型而非通用大模型?
張杰告訴AI科技評論,從長遠來看,通用大模型確實能給行業(yè)帶來巨大的價值,但從目前來看,通用大模型在處理專業(yè)問題方面還不是很聰明,不能滿足企業(yè)對專業(yè)性、合規(guī)性、規(guī)?;男枨蟆O喾搭I域大模型不僅不需要依賴大算力,還能切實解決領域內某幾類細分場景的問題。
至于備受業(yè)界關注的模型參數(shù)規(guī)模問題,張杰表示,主要結合實際場景的應用情況,比如財富管理領域的大模型只需要50 億參數(shù)規(guī)模就能很好的用于營銷、客服等場景,那就沒必要做成1000億參數(shù) ,避免用大炮打蚊子,節(jié)省算力消耗的資源。
在進行領域模型探索的同時,中關村科金也沒有忽略應用層。AI科技評論了解到,目前中關村科金已有的產品如智能外呼、智能客服、智能質檢、智能陪練等產品通過自研的對話引擎已全面擁抱大模型。
此外,中關村科金還結合企業(yè)的痛點問題和客戶共創(chuàng)了多個有場景代表性的試點項目,例如:推出了虛擬員工助手,幫助企業(yè)打造“超級員工”,在營銷文案生成、客服問答、坐席助手等場景,助力企業(yè)營銷服價值提升,已經(jīng)在業(yè)內有了很好的落地。
當然張杰也坦言,通用大模型已經(jīng)火到了一定程度,目前C端應用火爆,“但在B端企業(yè)服務賽道,很少有人意識到大模型未來會對企業(yè)的生產關系帶來很大影響?!?/span>
以下是AI科技評論和張杰的對話:
不會為了追求風口,做一些姿勢大于效果的創(chuàng)新
AI科技評論:AI技術發(fā)展速度很快,過去兩年公司的AI技術路線做了哪些調整?
張杰:過去兩年最大的技術路線調整就是把公司已有產品的底層核心引擎全面替換成大模型。
AI科技評論:所以去年您就預見了大模型會是下一個風口?
張杰:大模型帶來的研究范式的巨變是必然現(xiàn)象。大模型不是ChatGPT出來之后才有的,2017年就已經(jīng)有了transformer的架構,2018年谷歌基于Transformer推出了BERT模型,只是當時參數(shù)規(guī)模比較小,叫預訓練語言模型?,F(xiàn)在為什么叫大模型,是因為它的參數(shù)越來越大了。
BERT出來后對學術界、產業(yè)界影響都很大,因為它的通用性比較好。BERT是判別式模型,GPT是生成式模型。隨著GPT能力的不斷提升,很多學術研究的子方向的特殊性都沒了,研究范式開始趨向于統(tǒng)一。
最初GPT的技術路線還是非主流的,但OpenAI一直堅持生成式模型的路線,沒想到現(xiàn)在生成式的任務效果這么好,變成主流了。很多序列標注、分類任務都可以轉成生成式的任務。
AI科技評論:為什么要做這樣的調整?
張杰:我們是一家務實經(jīng)營的科技公司,過去多年都是連續(xù)盈利的,科技創(chuàng)新唯有苦練內功,所以我們不會為了追求風口做一些姿勢大于效果的技術。
那為什么要把產品全部轉移到大模型上面?因為效果好、成本低。訓練一個模型類似于培養(yǎng)一名學生,之前的技術路線是按場景任務定制專用的模型,需要大量標注數(shù)據(jù),相當于“只刷題、不看書”的思路,這樣的方式培養(yǎng)出來的學生在考試時只會做相似的題型,遇到新題型就答不好了。而大模型的思路是“先大量看書、再少量做題”,模型本身的通用性較好,學到了知識體系,面對新題型時給少數(shù)幾個樣例甚至不給樣例就能答對。從而使得我們的產品可復用程度高、定制化的交付成本降低。
AI科技評論:產品需要重構嗎?
張杰:這要看產品里包含哪些功能。如果產品里包含了很多需要人工配置領域知識的模塊,比如關鍵詞、相似問、問答對等,那就需要重構。如果產品在行業(yè)屬性與工具能力解耦方面做的很好了,重構代價就會比較低。
AI科技評論:率先做了哪些場景的應用?
張杰:我們已有的產品主要是圍繞企業(yè)服務賽道的對話場景,比如說外呼營銷機器人、客服機器人、智能質檢、智能陪練、辦公助手等。
比如,通過呼叫中心將銷售過程錄下來,采用ASR語音轉寫技術將錄音轉成文本;再通過對話文本挖掘出用戶的意圖;隨著對話過程不斷進行,大模型可以實時生成流程圖譜,給銷售提供對話建議,分析潛在的話題引導方向,提升銷售人員的營銷技能,提高成單率和用戶的留存率。
AI科技評論:市場接受度如何?
張杰:這取決于產品是否能給客戶帶來價值。
簡單介紹一個代表性的應用案例,以前在一個新場景構建外呼機器人,大概需要2~3周時間,且需要非常熟練的話術師才行。但現(xiàn)在,借助一個構造好的領域大模型,只需大約1-2天時間就可以成功交付,能明顯降低交付成本,加快交付效率。
與傳統(tǒng)的智能客服相比,大模型進一步降低了開發(fā)和運維成本。以前,各種場景都需要算法工程師標注數(shù)據(jù)以訓練特定任務的模型,因此開發(fā)成本較高?,F(xiàn)在,大模型本身的通用性好,不再需要很多算法工程師標數(shù)據(jù),可以直接拿過來用,有時稍微標幾條數(shù)據(jù)就夠了。企業(yè)部署外呼機器人、客服系統(tǒng)的成本會大大降低。原有30個話術師的工作量,現(xiàn)在2人即可完成,而且語義理解準確度從85%提升至94% 。所以看到這個實際效果后,客戶的接受度還是很高的。
AI科技評論:相對來說,哪些客戶對大模型技術的接受度更高一些?
張杰:一些客戶是行業(yè)龍頭企業(yè),之前嘗到了數(shù)字化轉型帶來的紅利,這次也更愿意嘗試。有些客戶是排在行業(yè)頭部但不是龍頭,想彎道超車。
這些企業(yè)的共同點就是關注投入產出比、合規(guī)性、安全性,如果這項新技術不能帶來顯著的經(jīng)營效益,那么在企業(yè)內部也很難立項通過。
從有經(jīng)驗積累的行業(yè)出發(fā),找契機深入其他領域
AI科技評論:中關村科金為什么選擇從金融行業(yè)嘗試大模型應用?
張杰:與其他行業(yè)相比,金融行業(yè)對于數(shù)字化轉型項目的接受度更高、場景需求更明確、智能化手段帶來的商業(yè)價值更明顯。并且像頭部金融企業(yè)對于服務品質、響應速度各方面要求都很高,需要合作伙伴能夠迅速和他一起共創(chuàng),這時候腰部企業(yè)看到成功案例后,再去復制就很快了。
AI科技評論:是不是很難?畢竟對數(shù)據(jù)方面的要求比較高?
張杰:數(shù)據(jù)方面的要求可以細分來看,是容易獲取的公域數(shù)據(jù)還是很難獲取的私域數(shù)據(jù)、是成本低的隱性標注數(shù)據(jù)還是成本高的顯性標注數(shù)據(jù)。To B場景下,訓練一個領域模型更要有一些高質量的、小規(guī)模的數(shù)據(jù),但數(shù)據(jù)標注成本比較高,不是每家AI公司都有能力自建團隊去做,這是我們能做大模型應用的一個門檻和優(yōu)勢。
把這些高質量的領域常識數(shù)據(jù)灌到大模型里訓練,就可以讓模型具備更多的領域知識,學到領域的語言特色,對領域數(shù)據(jù)的理解能力和生成能力也會提升。除了將通用大模型這個“文科生”變成領域專家外,我們還通過領域prompt工程組件讓它能有效的處理特定場景下的任務,具備場景技能。
AI科技評論:客戶愿意把自己的數(shù)據(jù)拿出來訓練嗎?
張杰:像銀行自有的數(shù)據(jù)是需要我們去銀行駐場訓練的。其實這里面有個誤區(qū)。如果想要訓練大模型,不能只用企業(yè)機構自身已有的數(shù)據(jù),還需要公域的數(shù)據(jù),比如,金融大模型需要行業(yè)研究報告、財經(jīng)類新聞、上市公司財報、專家解讀等。這些數(shù)據(jù)如何篩選、如何讓模型即學到領域知識又不至于忘記通用常識、如何將領域知識與場景具體問題關聯(lián)起來等等,這些問題都需要做探索和積累。目前高質量數(shù)據(jù)一部分是精心篩選后的公域數(shù)據(jù),另外一部分是小規(guī)模高質量私域數(shù)據(jù)。
另外很多公司還沒有完全意識到,不僅是原始數(shù)據(jù)有價值,歸納總結出來的抽象知識也是非常有價值的。就好比太陽系8大行星過去 100 年在天空中的軌跡數(shù)據(jù),這些原始數(shù)據(jù)的價值可能比不上萬有引力定律這一條抽象知識。
AI科技評論:之后會做哪些應用?會主動選擇一些場景突破嗎?
張杰:還是要看契機,很多時候技術是共通的,但具體做什么場景要看機緣。我們也一直在不斷尋找各行各業(yè)的客戶和我們一起共創(chuàng)的機會。目前我們在金融、公安、醫(yī)保、健康領域有一些落地場景,未來會繼續(xù)深挖這些領域大模型的復雜推理能力,讓模型不但具有專業(yè)性、具備專業(yè)的事實判斷能力,還要具備自主的過程判斷能力,成為具備跨場景的虛擬辦公助手。
大模型有泡沫在,C端火爆,B端落地還需時日
AI科技評論:在大模型選擇上有什么標準嗎?
張杰:這個對我們來說還是很有挑戰(zhàn)的,我們嘗試了目前市面上各種開源模型,快速研究、測試和訓練。這些都需要結合不同的業(yè)務場景需求,很耗時間和人力。
我們積累了一套工具,能快速的跑出一些指標,指標體系包括模型本身的內在屬性、通用語言能力、領域特定任務。這些指標需要提前構建大量測試集,就像學生考試一樣,可以在考試系統(tǒng)進行隨機抽題。
AI科技評論:怎么看待大模型目前的發(fā)展局面?
張杰:大模型的應用分C端和B端。目前C端還是非?;鸨?,C端可能更多的是圍繞創(chuàng)意和生成,尤其是圖片、語音、視頻等多媒體生成,各類工具和創(chuàng)意層出不窮。而B端主要關注對話場景和推理能力兩大方面,目前真正商用落地的優(yōu)秀案例不多。
AI科技評論:也就是說大模型還是有一定泡沫存在的?
張杰:大潮之下泡沫肯定是有的,但從長遠來看,它確實能給行業(yè)帶來巨大的增值和機遇。大模型火爆出圈,也有助于讓更多人認識到AI的價值,減少了向客戶做科普的成本,加速了AI商業(yè)化的進程。
AI科技評論:為什么B端還很少有落地的?
張杰:因為畢竟是商用,門檻比較高,模型的過程判斷邏輯和最終生成的內容要有可解釋性、可控性,要符合公序良俗、符合行業(yè)規(guī)范、遵循公司內部的標準流程,要對可能出現(xiàn)的風險有體系化的應對策略。另外,新技術的試點驗證和大面積推廣總要有個過程。
AI科技評論:就像您說的C端應用場景可能會更多,未來會做C端嗎?
張杰:目前我們還未看到C端有特別好的變現(xiàn)場景,但我們的產品也是可以To C的。
就拿保險行業(yè)來說,現(xiàn)在全國有幾百萬保險代理人,這些保險代理人會在保險公司間流動,有些還是獨立保險代理人。保險大模型產品作為代理人助手,既可以應用于保險公司的業(yè)務,又可以直接讓代理人使用。
做好流程挖掘,有了領域知識庫,才能做好領域模型
AI科技評論:大模型是不是更利好中關村科金這類有AI能力的服務商的發(fā)展?
張杰:對于服務商來講有利有弊。服務商提供的工具或服務,如果本身的價值或特殊性不夠,那會被大模型的能力升級淹沒。如果廠商在數(shù)據(jù)敏感度高、流程邏輯性強、可解釋性要求高的行業(yè)內,既有行業(yè)經(jīng)驗積累、又有大模型技術能力和產品化能力,那肯定是利好的。AI能力不是唯一的關鍵,它是必要非充分條件。因為B端企業(yè)接受AI這是必然的,AI的門檻也是逐年降低的。
AI科技評論:這是不是意味著通用大模型還很難解決某個細分領域的問題?
張杰:只能說現(xiàn)在的通用大模型在知識復雜度高的行業(yè)里,還不能直接應用。通用大模型是經(jīng)歷過素質教育的文科生,要成為領域專家還需要做領域適配。
AI科技評論:所以您更傾向于做領域大模型?
張杰:對,領域大模型是我們正在做的事情。其實領域大模型從一定意義上來說也是通用模型,它即需要保持通用的常識和推理,又需要具備領域內的專業(yè)知識和技能。領域大模型一定會是大模型技術商用化的未來。
AI科技評論:貴司具備哪些研發(fā)領域模型的優(yōu)勢呢?
張杰:中關村科金過去8年積累了很多數(shù)據(jù),并且這些數(shù)據(jù)每天都在不斷增加?,F(xiàn)在我們私域的對話數(shù)據(jù),人工對話每天超過30萬通,機器對話每天超過200萬通。這些是我們獨有的。除了原始數(shù)據(jù),還有一些更抽象的、價值更高的場景話術模板,這些知識結合了AI心理學、自主代理等技術。我們的領域模型現(xiàn)在已經(jīng)可以做到單周迭代、單卡推理了。
AI科技評論:在大模型方面中關村科金還一直強調知識庫的概念,為什么?
張杰:關于這個我總結了一個公式,企業(yè)對話引擎=(大模型+知識庫)*人機交互。
大模型的語言理解能力和生成能力比較強,但它不適合記憶標準流程類的知識和海量低頻的領域事實性的知識,這些東西還是應該放在知識庫里面,它們之間有交互。
比如你經(jīng)歷過大學四年的專業(yè)教育后,會掌握一些領域內的通識能力,知道一件事應該怎么做,但每個步驟可能還要去查一些資料,書本上的知識點你并不需要全部都死記硬背下來。人是不太適合背百科全書的,大腦之外還應該有一個知識庫,實現(xiàn)能力互補。
AI科技評論:中關村科金在大模型方面的的愿景是什么?
張杰:幫助企業(yè)去培養(yǎng)“超級員工”。大模型就像是一個智商較高、理解能力很強、過目不忘的“文科生”,我們在這個底子很好的“文科生”基礎之上,注入企業(yè)的領域知識,讓大模型能夠理解領域知識,成為一個具備領域知識的“普通員工”。再依托專業(yè)的產品設計,不斷和人類專家進行閉環(huán)反饋。基于人類專家的反饋,它能夠不斷地學習提升,逐步成為“超級員工”。未來這些“超級員工”能幫企業(yè)改造內部的新型生產關系。
之前企業(yè)可能是一個樹狀的管理結構,從上面董事會到下面的各個部門,一層一層往下是金字塔式的。未來大模型帶來的啟示是,它可以獨立承擔一些任務,不單單是體力勞動的替代,還能替代一些簡單的腦力勞動。
未來企業(yè)的組織結構將呈現(xiàn)紡錘形,上層是人類經(jīng)營者負責做重大決策和戰(zhàn)略,中間層真正負責干活的是AI了,但有時候也不能完全交給AI,需要少數(shù)的業(yè)務專家會指導機器或與機器協(xié)同互補。所以會是“人— 機—人”的架構。
我們相信,未來一定是人機協(xié)同的。隨著大模型重構企業(yè)組織架構、重塑企業(yè)生產關系,從短期來看,一些不產生價值的、中間的職能崗位,可能會很快將被機器取代掉。長期來看,關于價值判斷、規(guī)則制定、以及關乎人性和心理的工作,是大模型不能取代的。
(雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng)))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。