丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給朱可軒
發(fā)送

0

思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風(fēng)景

本文作者: 朱可軒   2024-12-18 16:23
導(dǎo)語:生成式智能與任務(wù)執(zhí)行智能,是兩種路線目標(biāo)。

作者丨朱可軒

編輯丨陳彩嫻

歷時兩天(12.10-12.11),今年的 2024 全球人工智能產(chǎn)品應(yīng)用博覽會已在蘇州工業(yè)園區(qū)完美閉幕。

在第一天下午的大會主論壇中,思必馳聯(lián)合創(chuàng)始人、首席科學(xué)家俞凱以「邁向分布式大模型智能體系統(tǒng)」為主題,深入探討了思必馳在大模型技術(shù)路線上的獨(dú)到思考,以及其對行業(yè)的觀察和見解。

「分布式大模型智能體系統(tǒng)」是思必馳在深耕對話式人工智能領(lǐng)域十七年后探索出的新發(fā)展方向,即:1 個中樞大模型+ N 個垂域模型及全鏈路交互組件組成全功能系統(tǒng)。

當(dāng)前,國內(nèi)許多大模型廠商都跟隨 OpenAI 的技術(shù)方向,將超級智能作為發(fā)力重點(diǎn)。

但俞凱認(rèn)為,「OpenAI 這一類廠商以單一的、集中式的超級智能為目標(biāo)去建設(shè)大模型,某種意義上是在造一個全知全能的神,在引領(lǐng)技術(shù)前沿上有劃時代的重要作用;但在 2B 真實(shí)場景落地中,這個技術(shù)路線遇到了很多的問題,包括實(shí)時私域知識缺乏、專業(yè)領(lǐng)域能力欠缺、可靠執(zhí)行能力不足和系統(tǒng)協(xié)作架構(gòu)缺失等?!?/p>

區(qū)別于此,思必馳選擇的技術(shù)路徑類似于打造一個公司,從 CEO 到 CFO 、CTO 等都各司其職。其中,CEO 是中樞大模型,CFO 、CTO 等是垂域大/小模型,在這之中并不需要每一個大模型都是超級智能,它們是分布式的,核心的系統(tǒng)目標(biāo)主要是可靠的任務(wù)執(zhí)行。

現(xiàn)階段生成式大模型都面臨難解的“幻覺”問題,AI 還無法知曉自身的知識邊界何在,而俞凱反復(fù)強(qiáng)調(diào)的可靠的執(zhí)行智能所解決的問題便恰好在于此。

除此之外,俞凱還向 AI 科技評論介紹道,「智能體系統(tǒng)和大模型不一樣,大模型或單一智能體現(xiàn)在只強(qiáng)調(diào)一個功能模塊的輸入和輸出,最終的用戶體驗(yàn)不一定好。而“智能體系統(tǒng)”則考慮多個不同的全鏈路功能模塊組合,強(qiáng)調(diào)能組成有機(jī)整體,從整個系統(tǒng)層面給用戶的交互體驗(yàn)會更好?!?/p>

不過,這些對行業(yè)的洞察也是在不斷摸索試錯后,俞凱和團(tuán)隊(duì)才逐步明晰的。成立以來,思必馳在找準(zhǔn)自身定位的過程中也遇到過諸多技術(shù)難題:

從剛開始只想去提升識別率,到后來開始思考降低成本,再之后又面臨了軟件易復(fù)制、智能硬件沒做過的難題,而全鏈路智能語音交互系統(tǒng)、大規(guī)??啥ㄖ埔捕即嬖谥T多需要攻關(guān)的技術(shù)難點(diǎn)......

以下是 AI 科技評論與俞凱的訪談實(shí)錄,作者進(jìn)行了不改原意的編輯整理:


構(gòu)建分布式大模型智能體系統(tǒng)


AI 科技評論:可以簡單介紹一下你們的大模型技術(shù)路線嗎?

俞凱:我們一直把 ChatGPT 類的大模型叫做對話式人工智能、對話式語言計(jì)算。OpenAI 實(shí)際上是從預(yù)訓(xùn)練語言模型發(fā)展起來的,而思必馳是從一個完整的端到端對話系統(tǒng)發(fā)展起來的,一直以多輪交互為核心,不斷迭代出現(xiàn)在的大語言模型。所以雖然殊途同歸,但實(shí)際上我們有自己獨(dú)特的發(fā)展軌跡。

思必馳 DFM 語言大模型是自主的技術(shù)研發(fā)路線逐漸形成的語言大模型。長期持續(xù)開展對話式語言大模型自研的其實(shí)不多,可能 2023 年之后講得比較多, 2023 年之前很少,DFM 是 2022 年初正式對外發(fā)布的,而發(fā)布之前內(nèi)部就已經(jīng)在用了,是真正意義上的獨(dú)立研發(fā)。


AI 科技評論:你們和 OpenAI 技術(shù)路徑的區(qū)別具體體現(xiàn)在何處?

俞凱:OpenAI 這一類廠商是以超級智能為目標(biāo)去建設(shè)單一集中式語言大模型,某種意義上是在造一個全知全能的神,它擅長創(chuàng)作和回答問題,并且可以生成多樣性的回復(fù)。但這條技術(shù)路線在面向嚴(yán)肅的任務(wù)執(zhí)行場景時遇到了許多問題,包括實(shí)時私域知識缺乏、專業(yè)領(lǐng)域能力欠缺、可靠執(zhí)行能力不足和系統(tǒng)協(xié)作架構(gòu)缺失等。

與之對比,我們的技術(shù)路線是構(gòu)建 1+N 的分布式大模型智能體系統(tǒng),這個「1」是中樞大模型,相當(dāng)于大腦,「N」就是不同的垂域模型,大模型、小模型都有,它們都可以是智能體,然后又是分布式的。

這種模式類似于公司的組織架構(gòu),其中,CEO 是中樞大模型,CFO 、CTO 等是垂域大/小模型,從 CEO 到 CFO 、CTO 等都各司其職,在這之中并不需要每一個大模型都是超級智能,甚至所有的都不是超級智能體,這是思必馳跟 OpenAI 在技術(shù)路線上很關(guān)鍵的不同。

根據(jù)我們以往的產(chǎn)業(yè)實(shí)踐,在實(shí)際大多數(shù)業(yè)務(wù)場景中,能夠可靠地執(zhí)行任務(wù)是最重要的,這類場景中的大模型本身不需要超級大,沒有必要不計(jì)成本的去堆算力,而是需要許多平常的通用智能體,這些通用智能體具備和人進(jìn)行交互的能力,當(dāng)然通用智能體之間也可以互相交互。


AI 科技評論:所以你們的優(yōu)勢在于可靠的任務(wù)執(zhí)行。

俞凱:對?,F(xiàn)在國內(nèi)外比較火的一些大模型很多是以內(nèi)容創(chuàng)作生成為核心,但思必馳主要關(guān)注的是以工具使用能力為主的執(zhí)行智能。

二者的側(cè)重點(diǎn)不同,生成式強(qiáng)調(diào)的是創(chuàng)造性、多樣性、流利性,本質(zhì)是豐富;執(zhí)行強(qiáng)調(diào)的是不出錯、可靠?,F(xiàn)在大模型有各種各樣的“幻覺”,思必馳 1+N 的體系會對執(zhí)行任務(wù)的質(zhì)量進(jìn)行保障,乃至于用一些創(chuàng)新的技術(shù)思路重新去定義可靠性。

舉個例子,我問 10 個問題,你能答對 6 個,其余 4 個你不知道,但是也胡亂作答了;他能答對 5 個,其余 5 個他說不知道,要去問專家。這種情況下,他可能更可靠。一些大模型其實(shí)不清楚自己的知識邊界在哪,不懂得拒絕。

思必馳在車載系統(tǒng)里著重強(qiáng)調(diào)的拒識能力,就是「我不是在跟你說話,你不要回答我」??偟膩碇v,思必馳的立足點(diǎn)就是可靠執(zhí)行。其實(shí),思必馳的大模型也可以用來寫小作文、詩歌等,在現(xiàn)階段,這些不是我們的核心出發(fā)點(diǎn)。


AI 科技評論:為什么你們今年一直在強(qiáng)調(diào)智能體系統(tǒng)這個概念?

俞凱:加了“系統(tǒng)”兩個字之后,與大模型就不一樣了。大模型現(xiàn)在講的基本都是語言大模型,即使是一般意義的多模態(tài)大模型往往講的也是一個軟件、一個算法、一個程序,你有一個輸入,它(模型)有一個輸出。但如若只強(qiáng)調(diào)輸入、輸出文字,最終的用戶體驗(yàn)不一定好。

我們強(qiáng)調(diào)的“系統(tǒng)”是要考慮多個不同的全鏈路系統(tǒng)組合,不單單只是智能體,有的可能包括模型,非模型的還有軟硬件協(xié)同的問題,大模型實(shí)際上是“人的大腦”,除此之外還要讓它有嘴巴、眼睛、耳朵等,這些要與大腦緊密結(jié)合,組成一個有機(jī)整體,給用戶的交互體驗(yàn)會更好,這一點(diǎn)很重要。

舉個例子,我說一句話,如果大模型一秒鐘之后才反應(yīng),那就很慢了,怎么在零點(diǎn)幾秒作出反應(yīng),還要滿足高度可靠的快速定制需求,這就要在系統(tǒng)層面去實(shí)現(xiàn)。

做這套體系時,思必馳用分布式的方法將參數(shù)規(guī)模千億、百億、十億等全尺度的大模型結(jié)合在一起,形成具備工具智能的可靠系統(tǒng),這樣才能實(shí)現(xiàn)更高的可靠性與產(chǎn)業(yè)落地。


投身 AI 創(chuàng)業(yè),貴在長期堅(jiān)持


AI 科技評論:思必馳成立于 2007 年,創(chuàng)業(yè)十七年了,您的這些技術(shù)思想是一開始就這么堅(jiān)定嗎?

俞凱:堅(jiān)持是一件特別不容易的事,尤其對于處于萌芽時期的事物。我們剛開始做人工智能時,這個領(lǐng)域還沒有像現(xiàn)在這樣倍受重視,我們當(dāng)時給公司起名叫「AISPEECH」,就是決心要把這件事做好,現(xiàn)在國家商標(biāo)局已經(jīng)不允許把 AI 放在前頭了。(笑)


AI 科技評論:可以分享一下對于您來講,你們經(jīng)歷了哪些關(guān)鍵性的轉(zhuǎn)折點(diǎn)嗎?

俞凱:我在英國待了十年,在劍橋的時候,前五年做語音識別,后五年做對話系統(tǒng),2012 年我回到國內(nèi),思必馳正式開啟了對話式人工智能的篇章。與此同時,我也把數(shù)據(jù)驅(qū)動的對話式語言計(jì)算從國外引到了國內(nèi),那個時候還不是現(xiàn)在的深度學(xué)習(xí),而是早期的貝葉斯學(xué)習(xí)。那時開始做對話式人工智能,也就是現(xiàn)在大家所看到的語言計(jì)算的基礎(chǔ)平臺。

在 2014 年 10 月的 CES 電子展上, Amazon 的 Echo 一炮打響,人工智能的硬件載體由手機(jī)轉(zhuǎn)換到智能硬件,思必馳開始從“軟件交互”轉(zhuǎn)向“智能硬件交互”。這個方向技術(shù)難度更大,并且一定程度上區(qū)別于僅在云端去做一般意義的語義處理,實(shí)際上,單一功能的云端 API 調(diào)用也很容易被復(fù)制。

2017 年,思必馳又有比較大的變化。當(dāng)時,我們發(fā)現(xiàn)軟硬件結(jié)合的方向非常好,中國的物聯(lián)網(wǎng)硬件設(shè)備千奇百怪,需要各種各樣的定制,我們開始研發(fā)一系列技術(shù),專注 AI 領(lǐng)域的柔性制造,即把對話系統(tǒng)的模塊任意組合,提升在垂域上的性能,快速進(jìn)行個性化修改,這是大規(guī)模、可定制的對話系統(tǒng),也就是思必馳 DUI 開放平臺(Dialogue User Interface)。


AI 科技評論:你們真正開始切入大模型具體是在什么時候呢?

俞凱:2019 年??v觀公司的發(fā)展歷程,思必馳于 2013 年研發(fā)出對話工場實(shí)現(xiàn)全鏈路閉環(huán);2015 年 AIOS 系統(tǒng)實(shí)現(xiàn)軟硬件協(xié)同的云端一體,至此對話系統(tǒng)正式開始面向智能硬件;2017 年通過全鏈路智能對話定制平臺(即 DUI 平臺)實(shí)現(xiàn)大規(guī)??啥ㄖ频娜嵝匀斯ぶ悄?;2019 年有了通用對話式語言模型研發(fā)。

此后,思必馳語言大模型 DFM 進(jìn)入深度研發(fā)階段,2021 年發(fā)布了第一個版本。2023 年 7 月,思必馳 DFM-2 大模型發(fā)布,通過 DFM-2 實(shí)現(xiàn)通用人工智能的柔性定制,可以開展大規(guī)模、高質(zhì)量、個性化的人工智能系統(tǒng)定制,既滿足客戶個性化的需求,又可以大大提升軟硬件產(chǎn)品的“非標(biāo)交付”效率。現(xiàn)在思必馳在這個基礎(chǔ)上進(jìn)一步研發(fā)分布式大模型智能體系統(tǒng)。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風(fēng)景


AI 科技評論:這么多次轉(zhuǎn)變的背后,你們應(yīng)該遇到過不少困難,都是怎么解決的?

俞凱:當(dāng)然。全鏈路的智能對話系統(tǒng)是思必馳的一大優(yōu)勢,它的構(gòu)建是第一個難題。

早先我們做語音識別技術(shù),并在美國的比賽中取得了國際領(lǐng)先的成績,但這并不意味著僅憑此項(xiàng)技術(shù)就能賺錢了,當(dāng)時碰到的困難是,就算技術(shù)再強(qiáng)也有誤差,沒聽說有誰的識別準(zhǔn)確率是 100%。因此,當(dāng)用戶無法完成任務(wù)時,思必馳就必須提供完整的方案,單純的算法優(yōu)化并不能解決實(shí)際問題,必須將其整合到一個完整的對話系統(tǒng)中。

后來遇到的問題是軟件產(chǎn)品容易被復(fù)制,思必馳在技術(shù)上比較強(qiáng),也需要把技術(shù)轉(zhuǎn)化成有效性、成本等優(yōu)勢,雖然軟件也能形成系統(tǒng),但是偏工具型,所以不能純靠軟件,思必馳要從智能硬件角度切入。

面向智能硬件也遇到了困難,在這個過程中要把沒有學(xué)過的知識,通過學(xué)習(xí)轉(zhuǎn)化成自己的東西,然后落地實(shí)踐。硬件要做嵌入式,就得把它做小,做到芯片里......這些都是需要解決的技術(shù)難點(diǎn)。

再往后,思必馳要做大規(guī)模定制化,于是我們就開始就拆,對話系統(tǒng)拆了要能再接起來,接起來的時候還要能保障端到端的響應(yīng)速度是業(yè)界領(lǐng)先,思必馳是業(yè)界最早把端到端的響應(yīng)速度做到 1 秒以內(nèi)的,后來有些人跟進(jìn)了。這需要從真實(shí)的場景當(dāng)中提煉問題,并通過算法、工程手段和系統(tǒng)架構(gòu)設(shè)計(jì)來解決。


警惕「拿著錘子找釘子」


AI 科技評論:DFM-2 大模型是去年 7 月升級的最新版,今年有進(jìn)行技術(shù)迭代嗎?

俞凱:今年我們進(jìn)行了很多迭代,都已經(jīng)融合到產(chǎn)品中了,簡單說就是悶頭把事給干了,沿著之前做的事往上疊加大模型能力。


AI 科技評論:你們目前主要在哪些場景中落地呢?

俞凱:主要是兩個方面,一是推垂域模型,二是推到產(chǎn)品里。

今年比較大的落地場景是智能汽車,除此之外有智能家居、消費(fèi)電子等,還有政府機(jī)構(gòu)、智能制造、科研等一些場景。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風(fēng)景


AI 科技評論:現(xiàn)在其實(shí)市面上許多大模型廠商都沒辦法找到真正的落地場景,所以可以看到最近大模型又有些冷下來了。您覺得這是現(xiàn)階段大家最大的困境嗎?

俞凱:是的,現(xiàn)在大模型廠商面臨的最大挑戰(zhàn)就是商業(yè)化落地場景。實(shí)際上我們做大模型,是先有端到端對話式系統(tǒng)的應(yīng)用,然后疊加大模型,先有場景,大模型是嵌入到系統(tǒng)里的。很多大模型廠商現(xiàn)在是拿著“錘子”找“釘子”,而我們有一排“釘子”,用不用這一個“錘子”不一定,因?yàn)榭赡苓€有另外其他的“錘子”更適合。

現(xiàn)在許多 2C 場景都被互聯(lián)網(wǎng)廠商壟斷了,例如:以多樣化文字生成、多模態(tài)生成為主的大模型最大的應(yīng)用場景是內(nèi)容創(chuàng)作,被抖音、快手等平臺壟斷;人機(jī)交互知識問答這種偏知識檢索場景被搜索引擎廠商壟斷;純問答場景被電商壟斷;還有其他小的場景,但是沒辦法撐起動輒幾十個億的投入。如何突圍是技術(shù)型大模型廠商面臨的巨大挑戰(zhàn)。

如果往 2B 和智能硬件領(lǐng)域發(fā)力,就需要系統(tǒng)。這當(dāng)中,系統(tǒng)和完整的解決方案是否可靠,是不是可以定制化、規(guī)?;呛诵膯栴},這是很多純算法廠商不擅長的。要積累的話往往也需要很長時間,因?yàn)檫@些核心問題同技術(shù)的先進(jìn)程度有的有關(guān)、有的無關(guān),思必馳也是摸索了這么多年才能有今天的積累。

另外,科研方向是有前途的,但偏學(xué)術(shù)而非產(chǎn)業(yè),或者說是長期方向,短期之內(nèi)的產(chǎn)業(yè)回報(bào)不會特別大。

總之,現(xiàn)在的大模型廠商面臨著商業(yè)化應(yīng)用場景選擇的挑戰(zhàn),據(jù)我觀察,目前一種破局的方式是往國外“卷”,因?yàn)?API 付費(fèi)這種模式在國外的機(jī)會可能大一些 。同時,很多應(yīng)用場景其實(shí)很雞肋,對廠商來講有些“食之無味,棄之可惜”,這也是難點(diǎn)。


AI 科技評論:你們做硬件的話,像汽車、辦公本這些也都和端側(cè)結(jié)合很緊密,現(xiàn)在也有一些大模型廠商想去切端側(cè),不過手機(jī)廠商也都在自己自研端側(cè)模型了。我剛也有聽您提到思必馳在做小模型,是指端側(cè)模型嗎?

俞凱:思必馳的模型云側(cè)和端側(cè)都有,主要就是一些垂域模型。我認(rèn)為未來端側(cè)模型一定是個重要方向,但還是要想清楚用它來干什么,有些廠商把文生圖都叫端側(cè)模型,這不是通用智能的角度。

通用智能是以端側(cè)語言模型為核心,同時要將任務(wù)鏈路有效整合,有些手機(jī)廠商走得比較靠前,但是是產(chǎn)品層面的靠前,基礎(chǔ)技術(shù)上還有很長的路要走,我們正在與合作伙伴積極推進(jìn)這一領(lǐng)域的發(fā)展,可以期待一下。


思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風(fēng)景


AI 科技評論:聊了這么多,那現(xiàn)在有沒有廠商和您的想法比較類似呢?你們的差異化優(yōu)勢又體現(xiàn)在哪方面?

俞凱:思必馳的首要優(yōu)勢肯定是技術(shù)優(yōu)勢,在算法和系統(tǒng)結(jié)合上的優(yōu)勢。經(jīng)過這么多次的技術(shù)迭代,在 know-how 也就是所謂的關(guān)鍵節(jié)點(diǎn)的技巧上,這些方面的積累我們也有優(yōu)勢。

第二就是智能硬件,思必馳作為早期參與者之一,至今依然活躍在市場中,這樣的企業(yè)在國內(nèi)并不多,可能只有兩三家。長時間的行業(yè)深耕使我們積累了寶貴的資源,成為我們的一大競爭優(yōu)勢。極少有廠商像思必馳一樣覆蓋這么多品類,在家電及消費(fèi)電子領(lǐng)域,思必馳基于智能語音交互技術(shù)和芯片,實(shí)現(xiàn)對各種智能產(chǎn)品和設(shè)備的實(shí)時控制,接入各類硬件設(shè)備數(shù)億臺,AI語音芯片出貨數(shù)千萬顆。此外,依托 DFM-2 大模型,思必馳推出了多款數(shù)字硬件產(chǎn)品,如無感擴(kuò)聲麥克風(fēng)、可感知和交互攝像頭、AI辦公本等,滿足了現(xiàn)代工作場景中的多樣化需求,大幅提升了辦公效率和質(zhì)量。

另外,在客戶方面,思必馳經(jīng)過多年的積累和服務(wù),與國內(nèi)幾乎所有的汽車和智能硬件廠商都有深入合作,這也形成了技術(shù)適配成熟度高、解決方案經(jīng)驗(yàn)豐富和客戶群基數(shù)大的優(yōu)勢。雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

思必馳俞凱:分布式大模型智能體系統(tǒng)是 AGI 時代一道別樣的風(fēng)景

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說