丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給董子博
發(fā)送

0

產(chǎn)業(yè)大模型競逐,京東的“快”與“慢”

本文作者: 董子博 2023-07-24 17:08
導(dǎo)語:“勝在半步”。

產(chǎn)業(yè)大模型競逐,京東的“快”與“慢”

引語:

“之前到了上海 WAIC,幾乎滿世界都是大模型?!眲倧?WAIC 2023回來的京東探索研究院院長何曉冬,如此說道。

 

生成式 AI 的風,從硅谷吹到北京上海、乃至全中國,也僅僅只過了半年的時間。這幾個月,大模型公司如雨后春筍般瘋長,前面的文章《行業(yè)大模型落地肉搏:誰先扎進行業(yè),誰就先入“咸陽” 》就有提到,更多的大模型正在走向落地,面向 B 端做更深度的結(jié)合,并且已經(jīng)取得了一些初步的成果。

 

自 ChatGPT 掀起生成式 AI 的熱潮,各個大廠都已經(jīng)紛紛掏出自己的大模型產(chǎn)品或平臺,迎接 AI 2.0 時代。

 

而京東,在大模型的競逐中,似乎“遲”了半步。

 

而直到7月13日的JDD,京東才公開了他們的“言犀”大模型,較之騰訊、字節(jié),遲了一個月;較之百度的文心一言,則遲了一個季度更多。

 

實際上,了解京東的人會知道,早在2月,京東就提出了在籌備“產(chǎn)業(yè)版的大模型" 。而在大語言模型的探索上,2020年,京東就開始研究“知識注入”的 K-PLUG 十億級模型。

 

有人會問,京東在 AI 大模型上,是不是“起個大早,卻趕了個晚集”?

 

一、被“偷偷”挪動過的“起跑線”

在 WAIC 逛展的時候,何曉冬幾乎是被四周的大模型產(chǎn)品所“包圍”。

 

有些展臺,會為參會者提供大模型產(chǎn)品的試用,何曉冬看到,也難免好奇,便隨手輸入了一個問題:

 

“143的平方根是多少?”

 

他試用的大模型飛快地答出:

 

“11.58”

 

初看這個結(jié)果,似乎可以令人滿意。畢竟144的平方根是12,143的平方根,結(jié)果應(yīng)與12相差不大。

 

當時的何曉冬并沒過多在意,就把這件事幾乎拋諸腦后。然而坐上了返程的飛機,他才猛然發(fā)覺,143的平方根,不應(yīng)與12相差0.42之多,至少該是11.9左右。拿出手機一檢驗,果然如此。

 

這其實也是何曉冬一直以來的嚴肅思考:如果一個會計,在看到這個“看似正確”的數(shù)字之后,并未多想,就將它填進了報表里,那數(shù)據(jù)上的紕漏將不可避免,而到了查賬的時候,則不知道又需要多少道功夫,才能找到這個“千里之堤”上的“蟻穴”。

 

這就是產(chǎn)業(yè)大模型“最后一公里”的問題——當下,大模型已經(jīng)開始解決內(nèi)容生成、語義理解等等很多問題,但如果回答的正確率無法保證,C 端的用戶,看到回答錯了,最多發(fā)個微博、朋友圈,吐槽了事;而在 To B 的嚴肅場景下,最細微的錯誤,都可能成為大模型落地的“命門”。

 

回到開頭提出的問題,到了今天,恐怕還有不少人認為,既然 ChatGPT 的爆紅沒有信息差,那么國內(nèi)廠商跟風做生成式 AI 大模型,起跑線都是一樣的。

 

殊不知,早在 OpenAI 在2022年取得階段性成果之前,國內(nèi)不少有技術(shù)遠見的公司,早就“偷偷”地挪動了大模型的起跑線,在數(shù)年前就開始了“搶跑”。

 

京東要用 AI 技術(shù)推動業(yè)務(wù)增長,要解決好應(yīng)用落地的“最后一公里”,就相當重要。

 

于是,早在2021年,京東自主研發(fā)的 K-PLUG 就應(yīng)運而生,讓使用者能夠利用 AI 生成文案。相比其他產(chǎn)品85%的正確率,K-PLUG 生成文案的正確率達到了95%以上。

 

3年時間,AI 的技術(shù)范式也變了好幾茬,從“Encoder-Decoder” 模式演進到“Decoder”模式。但對于“忠實度”(Faithfulness)的追求,本質(zhì)上始終沒變——這也成為了產(chǎn)業(yè)大模型落地,解決“最后一公里”難題的關(guān)鍵。

 

遠見者“挪動”大模型的起跑線,除開技術(shù)的積累,戰(zhàn)略和組織上的變革,也為他們的“搶跑”掃清了障礙。

 

2017年,劉強東在年會上,喊出的“技術(shù)!技術(shù)!技術(shù)”,至今還縈繞在許多京東人耳邊。

 

也是那時,被分散在各個業(yè)務(wù)部門的 AI 技術(shù)力量被統(tǒng)籌進了“AI 平臺與研究部”,包括何曉冬在內(nèi)的一系列的 Fellow 級人物也被招入其中,為技術(shù)發(fā)展的高歌猛進添磚加瓦。

 

組織架構(gòu)上的阻力,終究會成為企業(yè)技術(shù)發(fā)展的限制器。不少大廠吃過的虧,總結(jié)起來都是一本“血淚史”。而在京東,組織架構(gòu)的設(shè)計,則是為大模型的發(fā)展“開了綠燈”。

 

而在生成式 AI 爆紅之后,2023年年初,京東將大模型的研發(fā)上升到了集團層面,歸技術(shù)委員會統(tǒng)籌,由集團統(tǒng)一抽調(diào)訓(xùn)練的資源和算力,供何曉冬和他的團隊使用,并且將大模型的能力提供給京東內(nèi)部的業(yè)務(wù)使用。

 

“在京東,有大量的前端業(yè)務(wù),都希望使用大模型完成優(yōu)化,”京東技術(shù)委員會主席曹鵬對雷峰網(wǎng)表示,“這些場景需求我們會在內(nèi)部做評選,一些對業(yè)務(wù)很有幫助的項目,我們會直接升級到集團戰(zhàn)略執(zhí)行委員會層面,以公司層級做出決策調(diào)度。”

 

而為了加深言犀對京東現(xiàn)有場景需求的理解,不少其他事業(yè)群、事業(yè)組的人員,也紛紛被抽調(diào)出來進入大模型團隊,這些來自業(yè)務(wù)團隊的同事,一方面可以從業(yè)務(wù)需求出發(fā)指導(dǎo)模型訓(xùn)練;另一方面,也負責將訓(xùn)練好的大模型帶回業(yè)務(wù)團隊,來做對接和優(yōu)化。

 

而這也是京東能夠?qū)a(chǎn)業(yè)大模型更好落地的保障之一。何曉冬對雷峰網(wǎng)說:

 

“嚴格上說,京東的大模型技術(shù)并不是‘從研究院走向產(chǎn)品部門’。而是在一開始,研究院和產(chǎn)品部的結(jié)合就非常緊密。

 

讓大模型團隊更能從業(yè)務(wù)的角度出發(fā),思考技術(shù)如何在企業(yè)里發(fā)揮價值。這也是京東比較獨特的地方。

 

大模型要實現(xiàn)價值就必須落地,已經(jīng)成為了當下 AI 2.0 賽道的一個共識。而大模型要落地,需要大模型的研究者具有更強的工程化和產(chǎn)品化意識;產(chǎn)業(yè)的從業(yè)者,也要有更好的技術(shù) Sense,來擁抱生成式 AI 的產(chǎn)業(yè)變革,從而不至于被淘汰。

 

二、在產(chǎn)業(yè)中實際落地,大模型如何“擊穿”場景?

“發(fā)布大模型不是我們的目的——我們關(guān)注的,是能夠把大模型能力真正用到場景中,真正地產(chǎn)生價值。”在談到大模型對于京東的意義時,曹鵬如是說。

 

大模型的價值=算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方。這也是在JDD大會現(xiàn)場,京東集團CEO許冉重點強調(diào)的。

 

產(chǎn)業(yè)大模型競逐,京東的“快”與“慢”


京東內(nèi)部,有大量的適用場景,一邊確實面臨著人力帶來的效率制約;一邊也受到生產(chǎn)力的限制,需要突破現(xiàn)有模式的瓶頸。


做大模型,先用自己“做實驗”,首先是為現(xiàn)有業(yè)務(wù)賦能,快速成為公司降本增效上的助力,證明和實現(xiàn) AI 的價值;其次也是讓大模型能快速用起來,完成“使用-反饋-升級”的閉環(huán)。

 

要把場景“擊穿”,不僅要有力透紙背的技術(shù)積累,還得有足夠深刻的行業(yè)洞察。

 

舉例來說,在金融領(lǐng)域的AI營銷運營平臺,京東的言犀大模型能夠讓使用者通過簡單的口頭指示,就一站式生成營銷互動。過去需要5類職能人員,涵蓋產(chǎn)品、研發(fā)、算法、設(shè)計、分析師的工作量,如今壓縮到只需要1人。過去2000次人機交互,現(xiàn)在也減少到少于50次。綜合看來,營銷方案的生產(chǎn)效率有了百倍提高。

 

在電商領(lǐng)域,京東云AIGC內(nèi)容營銷平臺也能夠大展身手。從一張商品圖出發(fā),它能夠理解商品特征,快速生成電商運營需要的商品主圖、營銷海報圖和商詳圖等,將每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。

 

而在健康場景,京東健康瞄準的是皮膚病和心理咨詢,意在把??啤按蛲浮?,并以此為矛頭,開展 AI 遠程診療的探索。在多模態(tài)技術(shù)的賦能下,京東針對皮膚科完成了一套專有的 AI 識別算法,能夠識別一百多種皮膚的皮損情況,完成線上診斷。而在心理咨詢的場景下,據(jù)觀察,相比“真人”醫(yī)生,AI 醫(yī)生的患者滿意度反而更高。

 

在數(shù)智物流的實踐中,利用大模型+預(yù)測、大模型+3DSCADA、大模型3D場景理解的技術(shù),京東能進一步地增強針對物流的決策、倉儲方案制定、運營改善調(diào)整等能力,讓供應(yīng)鏈的降本增效得以快速實現(xiàn)。

 

要完成高質(zhì)量的專業(yè)能力,大模型之間,拼的就是高質(zhì)量的專業(yè)語料和行業(yè)Know-How。而不同于過去有人提倡的“行業(yè)小模型”,京東訓(xùn)練模型仍以公域數(shù)據(jù)為主,占70%左右;京東自有的專有數(shù)據(jù),占比約30%。

 

京東自有的行業(yè) Know-how 和數(shù)據(jù),雖然占比不大,但仍然是言犀大模型能夠真正落地,為業(yè)務(wù)部門提供服務(wù)和賦能的“基礎(chǔ)保障”。

 

曹鵬表示:“供應(yīng)鏈產(chǎn)業(yè)鏈上的大模型更有價值,因為供應(yīng)鏈的鏈條越長,帶來的數(shù)據(jù)相關(guān)性更高,相關(guān)性高的訓(xùn)練數(shù)據(jù)越多,模型越大,才越有可能產(chǎn)生產(chǎn)業(yè)端的智能涌現(xiàn)。”

 

而泛化,對于產(chǎn)業(yè)大模型來說同樣十分重要。

 

小模型對單一場景的依賴,很容易讓 AI 服務(wù)提供方走回 AI 1.0 時代“項目制”的老路;

 

同時,對于常識的理解,能夠處理與專業(yè)領(lǐng)域不直接相關(guān)的內(nèi)容,也有助于提升 AI 的用戶體驗。

 

“其實模型能力,有點像對一個人的培養(yǎng)?!痹谶@個問題上,何曉冬做了一個這樣的比喻:

 

“比如說,一個人讀了12年的書,有了基礎(chǔ)的社會常識。高中畢業(yè)之后,好像去工作也行,但專業(yè)性可能差一點。

 

“而如果再加上四年的專業(yè)本科,這樣可能既有常識又有足夠的專業(yè)知識——這是我們覺得產(chǎn)業(yè)大模型應(yīng)該具有的能力?!?/p>

 

三、大模型的“三步走”

言犀大模型在智能導(dǎo)購、智能客服、智慧金融、數(shù)智供應(yīng)鏈、物流管理等領(lǐng)域有了不少落地的嘗試,給業(yè)務(wù)側(cè)增添了不少新的可能性。

 

時下,言犀大模型對于京東來說,更多扮演的是“技術(shù)1”——解決內(nèi)部效率問題——的角色,距離“技術(shù)2”——技術(shù)服務(wù)對外賦能——還有一些路要走。

 

“我們現(xiàn)在還是聚焦在,我們怎么真正把這個東西用起來、用好,”曹鵬對雷峰網(wǎng)表示道,“如果我們自己都用不好,談模型對外提供服務(wù)我覺得有點早?!?/p>

 

這也符合京東對 AI 大模型“三步走”的期待:

 

第一步,基于內(nèi)部實踐構(gòu)建通用大模型;

 

第二步,在零售、金融、健康、物流等京東內(nèi)部高復(fù)雜場景大規(guī)模錘煉,融合重點行業(yè)解決方案對外合作;

 

第三步,針對嚴肅商業(yè)場景將大模型能力對外開放。

 

當下的言犀大模型,正走到第二步,邁向第三步的過程——在這個階段,大模型的產(chǎn)品化、工程化,則是技術(shù)團隊需要攻關(guān)的重中之重。

 

給 AI 降本增效,讓 B 端客戶能夠真正用上大模型,中間的“門道”不少。

 

首先,是要破除對大模型參數(shù)量級的“迷信”。模型不是越大越好,更大的模型很可能更笨重——無論是響應(yīng)速度、并發(fā)數(shù)量、還是調(diào)用成本,都無疑對客戶的使用體驗帶來重大的影響。

 

“每問一個問題都兩三毛錢,在實際應(yīng)用里是不經(jīng)濟的?!辈荠i如是說道。

 

在目前的大模型 To B 賽道,MaaS 提供方準備多種不同規(guī)格,能夠應(yīng)對不同功能、不同場景的模型,讓客戶按需選取,已經(jīng)成為了一個被不少人認同的“共識”。

 

從十億到千億,京東也在多種數(shù)據(jù)量級的模型上進行了布局,意在為業(yè)務(wù)部門,乃至日后的 To B 客戶,提供更可用且好用的模型。

 

其次,是大模型“苦之久矣”的部署和優(yōu)化問題。動輒百億量級參數(shù)的大模型,要讓使用者更簡單、更便捷地完成部署,并且保證模型的更新,不同公司都有自己的解決方案。

 

而京東的“奇招”,則是模型的量化和壓縮,以讓模型的小型化部署成為可能。

 

這里的“小型化部署”,并非主動縮減數(shù)據(jù)“革自己的命”,而是在仍然保持模型足夠大的情況下,進行量化壓縮,把浮點數(shù)壓縮成4個比特,并且完成一些“剪枝”,來完成模型的“瘦身”。

 

同時,本次 JDD 發(fā)布的言犀的大模型開發(fā)平臺,也提供數(shù)據(jù)的安全保障,并且讓使用者可以在平臺上,使用自己的數(shù)據(jù)為模型做持續(xù)訓(xùn)練、持續(xù)調(diào)優(yōu),完成個人專屬或行業(yè)應(yīng)用場景的優(yōu)化。

 

結(jié)語:“勝在半步”

機遇和挑戰(zhàn),是何曉冬用來形容大模型的兩個關(guān)鍵詞。

 

一方面,當然要看到大模型為千行百業(yè)帶來的機遇。在 AI 帶來的生產(chǎn)力和產(chǎn)品體驗躍升面前,有人說,“所有行業(yè)都值得被大模型重做一遍”,自然有其道理。不少公司或許可以在這個時代,借著人工智能的大浪,嘗試彎道超車。

 

而另一方面,對于京東來說,以智能導(dǎo)購為例:根據(jù)用戶需求,深度定制化的 AI 推薦,很可能對京東今天賴以生存的信息流模式,產(chǎn)生重大的顛覆。

 

對于大模型將為京東帶來的改變,何曉冬十分樂觀。京東的基因,并不只是停留在C端的電商,而是覆蓋背后廣泛垂直的供應(yīng)鏈服務(wù)。在前端與消費者互動的環(huán)節(jié)以外,背后廣泛的供應(yīng)鏈環(huán)節(jié),京東都有可能利用大模型做出優(yōu)化。

 

AI 大模型帶來的,新型人機交互的價值,會遠遠超出人們的想象。”何曉冬說,“從最初的打孔紙帶,到鍵盤交互,成就了IBM;從鍵盤到鼠標,成就的是微軟;而從鼠標到觸摸屏,又成就了蘋果?!?/p>

 

每一代人機交互的變革,都會催生一個或更多新的巨頭,撬動超過十萬億美元的價值。這也讓人想起,言犀從一開始,就是一個新型“人機交互平臺”。

 

回到最初的問題,京東的步子慢了嗎?

 

從搶占媒體和公眾的注意力的角度上,京東的確慢了;而在技術(shù)積累和體系建立的角度上,京東甚至還快了“半步”。

 

今天,AI 的‘賽道再次炙手可熱,但眼見過上一波 AI “起高樓,樓塌了”的人們,此時仍在埋頭猛進。

 

“熱鬧歸熱鬧,”從 WAIC 回來的何曉冬感觸頗深,“熱鬧之后還得看,最后什么東西能夠真正地產(chǎn)生價值?!?/p>

 

(后續(xù),雷峰網(wǎng)(公眾號:雷峰網(wǎng))將持續(xù)關(guān)注這個足稱偉大的 AI “英雄時代”,歡迎添加作者微信:william_dong,交流認知,互通有無。)

 

 


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說