丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給朱可軒
發(fā)送

0

思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風景

本文作者: 朱可軒   2024-12-18 16:23
導語:生成式智能與任務執(zhí)行智能,是兩種路線目標。

作者丨朱可軒

編輯丨陳彩嫻

歷時兩天(12.10-12.11),今年的 2024 全球人工智能產品應用博覽會已在蘇州工業(yè)園區(qū)完美閉幕。

在第一天下午的大會主論壇中,思必馳聯(lián)合創(chuàng)始人、首席科學家俞凱以「邁向分布式大模型智能體系統(tǒng)」為主題,深入探討了思必馳在大模型技術路線上的獨到思考,以及其對行業(yè)的觀察和見解。

「分布式大模型智能體系統(tǒng)」是思必馳在深耕對話式人工智能領域十七年后探索出的新發(fā)展方向,即:1 個中樞大模型+ N 個垂域模型及全鏈路交互組件組成全功能系統(tǒng)。

當前,國內許多大模型廠商都跟隨 OpenAI 的技術方向,將超級智能作為發(fā)力重點。

但俞凱認為,「OpenAI 這一類廠商以單一的、集中式的超級智能為目標去建設大模型,某種意義上是在造一個全知全能的神,在引領技術前沿上有劃時代的重要作用;但在 2B 真實場景落地中,這個技術路線遇到了很多的問題,包括實時私域知識缺乏、專業(yè)領域能力欠缺、可靠執(zhí)行能力不足和系統(tǒng)協(xié)作架構缺失等?!?/p>

區(qū)別于此,思必馳選擇的技術路徑類似于打造一個公司,從 CEO 到 CFO 、CTO 等都各司其職。其中,CEO 是中樞大模型,CFO 、CTO 等是垂域大/小模型,在這之中并不需要每一個大模型都是超級智能,它們是分布式的,核心的系統(tǒng)目標主要是可靠的任務執(zhí)行。

現(xiàn)階段生成式大模型都面臨難解的“幻覺”問題,AI 還無法知曉自身的知識邊界何在,而俞凱反復強調的可靠的執(zhí)行智能所解決的問題便恰好在于此。

除此之外,俞凱還向 AI 科技評論介紹道,「智能體系統(tǒng)和大模型不一樣,大模型或單一智能體現(xiàn)在只強調一個功能模塊的輸入和輸出,最終的用戶體驗不一定好。而“智能體系統(tǒng)”則考慮多個不同的全鏈路功能模塊組合,強調能組成有機整體,從整個系統(tǒng)層面給用戶的交互體驗會更好?!?/p>

不過,這些對行業(yè)的洞察也是在不斷摸索試錯后,俞凱和團隊才逐步明晰的。成立以來,思必馳在找準自身定位的過程中也遇到過諸多技術難題:

從剛開始只想去提升識別率,到后來開始思考降低成本,再之后又面臨了軟件易復制、智能硬件沒做過的難題,而全鏈路智能語音交互系統(tǒng)、大規(guī)模可定制也都存在著諸多需要攻關的技術難點......

以下是 AI 科技評論與俞凱的訪談實錄,作者進行了不改原意的編輯整理:


構建分布式大模型智能體系統(tǒng)


AI 科技評論:可以簡單介紹一下你們的大模型技術路線嗎?

俞凱:我們一直把 ChatGPT 類的大模型叫做對話式人工智能、對話式語言計算。OpenAI 實際上是從預訓練語言模型發(fā)展起來的,而思必馳是從一個完整的端到端對話系統(tǒng)發(fā)展起來的,一直以多輪交互為核心,不斷迭代出現(xiàn)在的大語言模型。所以雖然殊途同歸,但實際上我們有自己獨特的發(fā)展軌跡。

思必馳 DFM 語言大模型是自主的技術研發(fā)路線逐漸形成的語言大模型。長期持續(xù)開展對話式語言大模型自研的其實不多,可能 2023 年之后講得比較多, 2023 年之前很少,DFM 是 2022 年初正式對外發(fā)布的,而發(fā)布之前內部就已經在用了,是真正意義上的獨立研發(fā)。


AI 科技評論:你們和 OpenAI 技術路徑的區(qū)別具體體現(xiàn)在何處?

俞凱:OpenAI 這一類廠商是以超級智能為目標去建設單一集中式語言大模型,某種意義上是在造一個全知全能的神,它擅長創(chuàng)作和回答問題,并且可以生成多樣性的回復。但這條技術路線在面向嚴肅的任務執(zhí)行場景時遇到了許多問題,包括實時私域知識缺乏、專業(yè)領域能力欠缺、可靠執(zhí)行能力不足和系統(tǒng)協(xié)作架構缺失等。

與之對比,我們的技術路線是構建 1+N 的分布式大模型智能體系統(tǒng),這個「1」是中樞大模型,相當于大腦,「N」就是不同的垂域模型,大模型、小模型都有,它們都可以是智能體,然后又是分布式的。

這種模式類似于公司的組織架構,其中,CEO 是中樞大模型,CFO 、CTO 等是垂域大/小模型,從 CEO 到 CFO 、CTO 等都各司其職,在這之中并不需要每一個大模型都是超級智能,甚至所有的都不是超級智能體,這是思必馳跟 OpenAI 在技術路線上很關鍵的不同。

根據我們以往的產業(yè)實踐,在實際大多數(shù)業(yè)務場景中,能夠可靠地執(zhí)行任務是最重要的,這類場景中的大模型本身不需要超級大,沒有必要不計成本的去堆算力,而是需要許多平常的通用智能體,這些通用智能體具備和人進行交互的能力,當然通用智能體之間也可以互相交互。


AI 科技評論:所以你們的優(yōu)勢在于可靠的任務執(zhí)行。

俞凱:對?,F(xiàn)在國內外比較火的一些大模型很多是以內容創(chuàng)作生成為核心,但思必馳主要關注的是以工具使用能力為主的執(zhí)行智能。

二者的側重點不同,生成式強調的是創(chuàng)造性、多樣性、流利性,本質是豐富;執(zhí)行強調的是不出錯、可靠?,F(xiàn)在大模型有各種各樣的“幻覺”,思必馳 1+N 的體系會對執(zhí)行任務的質量進行保障,乃至于用一些創(chuàng)新的技術思路重新去定義可靠性。

舉個例子,我問 10 個問題,你能答對 6 個,其余 4 個你不知道,但是也胡亂作答了;他能答對 5 個,其余 5 個他說不知道,要去問專家。這種情況下,他可能更可靠。一些大模型其實不清楚自己的知識邊界在哪,不懂得拒絕。

思必馳在車載系統(tǒng)里著重強調的拒識能力,就是「我不是在跟你說話,你不要回答我」。總的來講,思必馳的立足點就是可靠執(zhí)行。其實,思必馳的大模型也可以用來寫小作文、詩歌等,在現(xiàn)階段,這些不是我們的核心出發(fā)點。


AI 科技評論:為什么你們今年一直在強調智能體系統(tǒng)這個概念?

俞凱:加了“系統(tǒng)”兩個字之后,與大模型就不一樣了。大模型現(xiàn)在講的基本都是語言大模型,即使是一般意義的多模態(tài)大模型往往講的也是一個軟件、一個算法、一個程序,你有一個輸入,它(模型)有一個輸出。但如若只強調輸入、輸出文字,最終的用戶體驗不一定好。

我們強調的“系統(tǒng)”是要考慮多個不同的全鏈路系統(tǒng)組合,不單單只是智能體,有的可能包括模型,非模型的還有軟硬件協(xié)同的問題,大模型實際上是“人的大腦”,除此之外還要讓它有嘴巴、眼睛、耳朵等,這些要與大腦緊密結合,組成一個有機整體,給用戶的交互體驗會更好,這一點很重要。

舉個例子,我說一句話,如果大模型一秒鐘之后才反應,那就很慢了,怎么在零點幾秒作出反應,還要滿足高度可靠的快速定制需求,這就要在系統(tǒng)層面去實現(xiàn)。

做這套體系時,思必馳用分布式的方法將參數(shù)規(guī)模千億、百億、十億等全尺度的大模型結合在一起,形成具備工具智能的可靠系統(tǒng),這樣才能實現(xiàn)更高的可靠性與產業(yè)落地。


投身 AI 創(chuàng)業(yè),貴在長期堅持


AI 科技評論:思必馳成立于 2007 年,創(chuàng)業(yè)十七年了,您的這些技術思想是一開始就這么堅定嗎?

俞凱:堅持是一件特別不容易的事,尤其對于處于萌芽時期的事物。我們剛開始做人工智能時,這個領域還沒有像現(xiàn)在這樣倍受重視,我們當時給公司起名叫「AISPEECH」,就是決心要把這件事做好,現(xiàn)在國家商標局已經不允許把 AI 放在前頭了。(笑)


AI 科技評論:可以分享一下對于您來講,你們經歷了哪些關鍵性的轉折點嗎?

俞凱:我在英國待了十年,在劍橋的時候,前五年做語音識別,后五年做對話系統(tǒng),2012 年我回到國內,思必馳正式開啟了對話式人工智能的篇章。與此同時,我也把數(shù)據驅動的對話式語言計算從國外引到了國內,那個時候還不是現(xiàn)在的深度學習,而是早期的貝葉斯學習。那時開始做對話式人工智能,也就是現(xiàn)在大家所看到的語言計算的基礎平臺。

在 2014 年 10 月的 CES 電子展上, Amazon 的 Echo 一炮打響,人工智能的硬件載體由手機轉換到智能硬件,思必馳開始從“軟件交互”轉向“智能硬件交互”。這個方向技術難度更大,并且一定程度上區(qū)別于僅在云端去做一般意義的語義處理,實際上,單一功能的云端 API 調用也很容易被復制。

2017 年,思必馳又有比較大的變化。當時,我們發(fā)現(xiàn)軟硬件結合的方向非常好,中國的物聯(lián)網硬件設備千奇百怪,需要各種各樣的定制,我們開始研發(fā)一系列技術,專注 AI 領域的柔性制造,即把對話系統(tǒng)的模塊任意組合,提升在垂域上的性能,快速進行個性化修改,這是大規(guī)模、可定制的對話系統(tǒng),也就是思必馳 DUI 開放平臺(Dialogue User Interface)。


AI 科技評論:你們真正開始切入大模型具體是在什么時候呢?

俞凱:2019 年??v觀公司的發(fā)展歷程,思必馳于 2013 年研發(fā)出對話工場實現(xiàn)全鏈路閉環(huán);2015 年 AIOS 系統(tǒng)實現(xiàn)軟硬件協(xié)同的云端一體,至此對話系統(tǒng)正式開始面向智能硬件;2017 年通過全鏈路智能對話定制平臺(即 DUI 平臺)實現(xiàn)大規(guī)??啥ㄖ频娜嵝匀斯ぶ悄?;2019 年有了通用對話式語言模型研發(fā)。

此后,思必馳語言大模型 DFM 進入深度研發(fā)階段,2021 年發(fā)布了第一個版本。2023 年 7 月,思必馳 DFM-2 大模型發(fā)布,通過 DFM-2 實現(xiàn)通用人工智能的柔性定制,可以開展大規(guī)模、高質量、個性化的人工智能系統(tǒng)定制,既滿足客戶個性化的需求,又可以大大提升軟硬件產品的“非標交付”效率。現(xiàn)在思必馳在這個基礎上進一步研發(fā)分布式大模型智能體系統(tǒng)。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風景


AI 科技評論:這么多次轉變的背后,你們應該遇到過不少困難,都是怎么解決的?

俞凱:當然。全鏈路的智能對話系統(tǒng)是思必馳的一大優(yōu)勢,它的構建是第一個難題。

早先我們做語音識別技術,并在美國的比賽中取得了國際領先的成績,但這并不意味著僅憑此項技術就能賺錢了,當時碰到的困難是,就算技術再強也有誤差,沒聽說有誰的識別準確率是 100%。因此,當用戶無法完成任務時,思必馳就必須提供完整的方案,單純的算法優(yōu)化并不能解決實際問題,必須將其整合到一個完整的對話系統(tǒng)中。

后來遇到的問題是軟件產品容易被復制,思必馳在技術上比較強,也需要把技術轉化成有效性、成本等優(yōu)勢,雖然軟件也能形成系統(tǒng),但是偏工具型,所以不能純靠軟件,思必馳要從智能硬件角度切入。

面向智能硬件也遇到了困難,在這個過程中要把沒有學過的知識,通過學習轉化成自己的東西,然后落地實踐。硬件要做嵌入式,就得把它做小,做到芯片里......這些都是需要解決的技術難點。

再往后,思必馳要做大規(guī)模定制化,于是我們就開始就拆,對話系統(tǒng)拆了要能再接起來,接起來的時候還要能保障端到端的響應速度是業(yè)界領先,思必馳是業(yè)界最早把端到端的響應速度做到 1 秒以內的,后來有些人跟進了。這需要從真實的場景當中提煉問題,并通過算法、工程手段和系統(tǒng)架構設計來解決。


警惕「拿著錘子找釘子」


AI 科技評論:DFM-2 大模型是去年 7 月升級的最新版,今年有進行技術迭代嗎?

俞凱:今年我們進行了很多迭代,都已經融合到產品中了,簡單說就是悶頭把事給干了,沿著之前做的事往上疊加大模型能力。


AI 科技評論:你們目前主要在哪些場景中落地呢?

俞凱:主要是兩個方面,一是推垂域模型,二是推到產品里。

今年比較大的落地場景是智能汽車,除此之外有智能家居、消費電子等,還有政府機構、智能制造、科研等一些場景。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風景


AI 科技評論:現(xiàn)在其實市面上許多大模型廠商都沒辦法找到真正的落地場景,所以可以看到最近大模型又有些冷下來了。您覺得這是現(xiàn)階段大家最大的困境嗎?

俞凱:是的,現(xiàn)在大模型廠商面臨的最大挑戰(zhàn)就是商業(yè)化落地場景。實際上我們做大模型,是先有端到端對話式系統(tǒng)的應用,然后疊加大模型,先有場景,大模型是嵌入到系統(tǒng)里的。很多大模型廠商現(xiàn)在是拿著“錘子”找“釘子”,而我們有一排“釘子”,用不用這一個“錘子”不一定,因為可能還有另外其他的“錘子”更適合。

現(xiàn)在許多 2C 場景都被互聯(lián)網廠商壟斷了,例如:以多樣化文字生成、多模態(tài)生成為主的大模型最大的應用場景是內容創(chuàng)作,被抖音、快手等平臺壟斷;人機交互知識問答這種偏知識檢索場景被搜索引擎廠商壟斷;純問答場景被電商壟斷;還有其他小的場景,但是沒辦法撐起動輒幾十個億的投入。如何突圍是技術型大模型廠商面臨的巨大挑戰(zhàn)。

如果往 2B 和智能硬件領域發(fā)力,就需要系統(tǒng)。這當中,系統(tǒng)和完整的解決方案是否可靠,是不是可以定制化、規(guī)模化是核心問題,這是很多純算法廠商不擅長的。要積累的話往往也需要很長時間,因為這些核心問題同技術的先進程度有的有關、有的無關,思必馳也是摸索了這么多年才能有今天的積累。

另外,科研方向是有前途的,但偏學術而非產業(yè),或者說是長期方向,短期之內的產業(yè)回報不會特別大。

總之,現(xiàn)在的大模型廠商面臨著商業(yè)化應用場景選擇的挑戰(zhàn),據我觀察,目前一種破局的方式是往國外“卷”,因為 API 付費這種模式在國外的機會可能大一些 。同時,很多應用場景其實很雞肋,對廠商來講有些“食之無味,棄之可惜”,這也是難點。


AI 科技評論:你們做硬件的話,像汽車、辦公本這些也都和端側結合很緊密,現(xiàn)在也有一些大模型廠商想去切端側,不過手機廠商也都在自己自研端側模型了。我剛也有聽您提到思必馳在做小模型,是指端側模型嗎?

俞凱:思必馳的模型云側和端側都有,主要就是一些垂域模型。我認為未來端側模型一定是個重要方向,但還是要想清楚用它來干什么,有些廠商把文生圖都叫端側模型,這不是通用智能的角度。

通用智能是以端側語言模型為核心,同時要將任務鏈路有效整合,有些手機廠商走得比較靠前,但是是產品層面的靠前,基礎技術上還有很長的路要走,我們正在與合作伙伴積極推進這一領域的發(fā)展,可以期待一下。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風景


AI 科技評論:聊了這么多,那現(xiàn)在有沒有廠商和您的想法比較類似呢?你們的差異化優(yōu)勢又體現(xiàn)在哪方面?

俞凱:思必馳的首要優(yōu)勢肯定是技術優(yōu)勢,在算法和系統(tǒng)結合上的優(yōu)勢。經過這么多次的技術迭代,在 know-how 也就是所謂的關鍵節(jié)點的技巧上,這些方面的積累我們也有優(yōu)勢。

第二就是智能硬件,思必馳作為早期參與者之一,至今依然活躍在市場中,這樣的企業(yè)在國內并不多,可能只有兩三家。長時間的行業(yè)深耕使我們積累了寶貴的資源,成為我們的一大競爭優(yōu)勢。極少有廠商像思必馳一樣覆蓋這么多品類,在家電及消費電子領域,思必馳基于智能語音交互技術和芯片,實現(xiàn)對各種智能產品和設備的實時控制,接入各類硬件設備數(shù)億臺,AI語音芯片出貨數(shù)千萬顆。此外,依托 DFM-2 大模型,思必馳推出了多款數(shù)字硬件產品,如無感擴聲麥克風、可感知和交互攝像頭、AI辦公本等,滿足了現(xiàn)代工作場景中的多樣化需求,大幅提升了辦公效率和質量。

另外,在客戶方面,思必馳經過多年的積累和服務,與國內幾乎所有的汽車和智能硬件廠商都有深入合作,這也形成了技術適配成熟度高、解決方案經驗豐富和客戶群基數(shù)大的優(yōu)勢。雷峰網(公眾號:雷峰網)雷峰網

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風景

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說