丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給李梅
發(fā)送

0

中國 AI 的這次「合伙」,不止是大模型的勝利

本文作者: 李梅 2022-11-07 14:20
導(dǎo)語:AI 基礎(chǔ)研究的春天,初現(xiàn)春光。

中國 AI 的這次「合伙」,不止是大模型的勝利

作者|李梅

編輯|陳彩嫻


盡管唱衰大模型的聲音不絕,但無可否認,近年來人工智能領(lǐng)域的重大突破,都離不開大模型的支撐。

以近日火熱的 AIGC 為例。語言大模型在理解文本語境與知識推理能力上的突飛猛進,是人工智能跨越單一模態(tài),讀懂人類描述的語言、進而生成各色精美圖像的基石之一。

大模型被詬病之處突出,算力成本與不確定性為最大要點,但與此同時,幾乎沒有人能否認,在未來五年、甚至十年的智能研究中,大模型必將占有一席之地。美國人工智能學(xué)術(shù)界將其稱為「基礎(chǔ)模型」(Foundation Model),在定位上視之為基礎(chǔ)研究,重視程度也可見一斑。

然而,由于訓(xùn)練難度與成本的高門檻,大模型在國內(nèi)的興起注定只掌握在少數(shù)人的手中。一項基礎(chǔ)研究的開拓,必須團結(jié)盡可能團結(jié)的力量,才能推動其進步的速度與質(zhì)量。尤其在知識注入與多場景通用無阻的追求上,大模型的研究者多多益善。

因此,從去年開始,「開源」AI 大模型的呼聲也日漸高昂。唯有開源,才能降低大模型的研究門檻;也唯有開源,才能促進與大模型相匹配的基礎(chǔ)設(shè)施(如架構(gòu)、算力、落地設(shè)備)建設(shè)。

「魔搭」(ModelScope)社區(qū)的成立,正是基于這樣急切的背景。

在今年的云棲大會上,阿里達摩院與 CCF 開源發(fā)展委員會聯(lián)合正式推出國內(nèi)首個 AI 模型開源社區(qū)——魔搭 ModelScope,宣布將達摩院近五年苦心研究的 300 多個優(yōu)質(zhì)模型開放給整個中國的 AI 研究者與團隊,共同促進中國的 AI 基礎(chǔ)研究。

這其中,300 多個模型就有十多個大模型。這一舉動,被業(yè)界稱為大模型的「家底秀」,而魔搭社區(qū)的使命是「開源」,阿里真的是把家底給亮出來了!

中國 AI 的這次「合伙」,不止是大模型的勝利圖注:周靖人在 ModelScope 魔搭發(fā)布會上

阿里巴巴集團資深副總裁、阿里達摩院副院長周靖人告訴 AI 科技評論:「我們的口號是 AI for Everyone?!?br/>

以大模型為例。他們認為,大模型的研發(fā)不應(yīng)該是一場少數(shù)機構(gòu)的競賽,而應(yīng)該通過大小模型的協(xié)同進化走向更高級的應(yīng)用,尤其是適應(yīng)中國本土需求的應(yīng)用。

2020年GPT-3出現(xiàn)以來,國內(nèi)的研究者只能仰仗英語大模型,文化與語言的鴻溝成為模仿西方技術(shù)成果時的消極產(chǎn)物,中文大模型也呼之欲出。魔搭將現(xiàn)有為數(shù)不多的中文大模型開放后,AI 領(lǐng)域的研究者基于中文大模型自由開發(fā)滿足下游任務(wù)的小模型時,能更好解決東方的實際問題。

魔搭社區(qū)的成立,是中國人工智能領(lǐng)域一個劃時代的故事開篇。


—— 1 ——

 AI 突破的風(fēng)口,在應(yīng)用

兩年前,《數(shù)學(xué)之美》作者吳軍在接受 AI 科技評論的訪談時就曾說過:深度學(xué)習(xí)大的理論突破已經(jīng)走到瓶頸期,AI 風(fēng)口的下一個十年在于應(yīng)用。

這兩年的發(fā)展路徑,越來越多的落地與應(yīng)用討論,也驗證了吳軍的判斷。如今,我們對 AI 的期待,已經(jīng)不再只停留在迸發(fā)于實驗室的那些「AlphaGo 時刻」,而且「用起來」,在解決實際生活的問題中創(chuàng)造價值。

那么,AI 如何最大程度地發(fā)揮價值?

縱觀構(gòu)成人工智能的三駕馬車:數(shù)據(jù)是護城河,隔行如隔山;算力仰仗少數(shù)巨頭的芯片能力,普通人玩不起;而在模型的競技場,任何人都可以做點什么。

因此,未來五年,人工智能能大規(guī)模應(yīng)用的風(fēng)口,在于模型。

然而,以模型為中心的 AI 技術(shù)在落地產(chǎn)業(yè)的過程中,正受到兩方面的制約,一是在模型的創(chuàng)新側(cè),二是在模型的應(yīng)用側(cè)。其中,模型的應(yīng)用又離不開創(chuàng)新。

算法的創(chuàng)新如今進入一種尷尬境地。持續(xù)創(chuàng)新力不足,技術(shù)突破鳳毛麟角,只局限于少數(shù)幾個領(lǐng)域,更多的應(yīng)用場景還等待技術(shù)去解鎖。

在以前,AI 公司針對具體的任務(wù)和應(yīng)用場景來定制并出售模型和解決方案,但這種商業(yè)模式正在失去其競爭力。

達摩院基礎(chǔ)視覺團隊負責人趙德麗對這一點深有感觸。他舉了一個例子:假如有 1000 個任務(wù)要實現(xiàn),那就要研發(fā)出 1000 個不同的模型,其中的工作量非常之大。一旦研發(fā)團隊有人離職,相對應(yīng)的模型就無法維護、迭代,不具備可擴展性,最終蝕斷 AI 應(yīng)用的鏈條。

統(tǒng)一底層架構(gòu)的出現(xiàn),為上述難題的解決提供了一種路徑。

2017 年,谷歌在《Attention Is All You Need》這篇經(jīng)典之作中提出 Transformer 模型,作為一個具備強大通用性的底層架構(gòu),它后來衍生出了 BERT、GPT-3 等預(yù)訓(xùn)練語言模型,且參數(shù)量飛速增長,將 AI 帶入了大模型時代,如今在語言、視覺、多模態(tài)等領(lǐng)域上都已證明了其無限潛力。

今年大火的擴散模型(Diffusion Model)是一個新近的例證,得益于其開源,目前國內(nèi)外社區(qū)涌現(xiàn)出的 AI 作畫應(yīng)用已經(jīng)令人目不暇接。

周靖人認為,大模型之所以具備巨大的價值想象空間,是因為大模型本質(zhì)上是對人類知識體系的積累、抽象與提煉,從而能夠接近人類智能。

同時,大模型的底層性使其能夠承擔起一種「基礎(chǔ)設(shè)施」的功能,打好 AI 應(yīng)用的底座,這也是大模型的另一名號「基礎(chǔ)模型」(Foundation Models)所凸顯的意義。

如趙德麗所言,「在統(tǒng)一底層架構(gòu)的范式下,基礎(chǔ)研究的價值比以往時候更大。若能研發(fā)出一個真正有競爭力的基礎(chǔ)模型,整個 AI 生態(tài)都會受益?!挂舱蛉绱?,一直從事生成模型研究的趙德麗十分看好擴散模型。

基于統(tǒng)一的底層架構(gòu)所開發(fā)的模型將變得可維護、可迭代、可擴展,這樣一來,系統(tǒng)級的 AI 應(yīng)用才有被創(chuàng)造出來的可能,AI 的價值才能被真正兌現(xiàn)。

但目前我們國內(nèi)的事實是,在「煉」大模型上,暴力堆參有余而架構(gòu)創(chuàng)新不足,無論是 Transformer 還是 Diffusion Models,這類基礎(chǔ)性突破大都生發(fā)于國外,國內(nèi)則更多處于追趕的狀態(tài)。在「用」大模型上,大模型的潛力也未見爆發(fā),大規(guī)模的落地應(yīng)用還未出現(xiàn)。

要改變這種現(xiàn)狀,大模型的基礎(chǔ)設(shè)施與生態(tài)建設(shè)尤為重要。在這一點上,國外的進展的確有所領(lǐng)先,例如今年 3 月谷歌發(fā)布了用于訓(xùn)練大模型的底層架構(gòu) Pathways 系統(tǒng),被谷歌 AI 掌門人 Jeff Dean 寄予了「下一代 AI 架構(gòu)」的厚望,次月推出的 5400 億參數(shù)的超大規(guī)模語言模型 PaLM 便是在該架構(gòu)下訓(xùn)練出來的,其超強的推理能力令人驚嘆。

不單單是大模型,眼前中國 AI 的整體研發(fā)與應(yīng)用的未來都指向了一條路:開源開放,以模型為中心提供服務(wù)。


—— 2 ——

魔搭:模型即服務(wù)

魔搭社區(qū)的立項,正是為了解決當前中國人工智能研究山頭林立、各自為戰(zhàn)的局面。

達摩院語音實驗室負責人鄢志杰認為,盡管人工智能技術(shù)在近年來的落地中暴露出一些問題,但不代表 AI 的應(yīng)用走到窮巷:

「現(xiàn)在 AI 領(lǐng)域的概況,不是泡沫破滅,也不是平臺期,而是亂花漸欲迷人眼。我們需要穿越霧里看花,找到再一次啟動AI創(chuàng)新與應(yīng)用兩個引擎的鑰匙?!?/p>

這把鑰匙,就是開源。開源的本質(zhì)是交流,歷年來技術(shù)的突破都證明了這一途徑對更大圖景的促進。打通接口,拉平認知,是對整個中國 AI 發(fā)展有積極作用的重要路徑。

達摩院很早開始思考這個問題:

周靖人告訴AI科技評論,2021 年 3 月達摩院發(fā)布國內(nèi)首個千億參數(shù)多模態(tài)大模型 M6。那時他作為項目主導(dǎo)人,從立項開始就思考如何更好地釋放像 M6 這樣的大模型的基礎(chǔ)能力。

他思考的結(jié)果是:必須要有一個平臺作為依托。在內(nèi)部討論中,這個想法一出來,就得到了達摩院各個實驗室?guī)ь^人的贊同。因為從技術(shù)發(fā)展的角度看,這是勢在必行的選擇,很快達成共識。

于是,從去年開始,在達摩院內(nèi)部一次又一次的會議上,周靖人不斷地與大家討論如何把「模型即服務(wù)」(Model as a Service,MaaS )的理念在一個社區(qū)上實現(xiàn),魔搭也在幾次頭腦風(fēng)暴中慢慢成型,并快速成長:

今年4月底立項,達摩院各個工程團隊派出人手支援、貢獻優(yōu)質(zhì)模型;5月30日發(fā)布內(nèi)部PoC 版本;8月底外部就已經(jīng)可以訪問。

在9月的開發(fā)者評測局上,達摩院的算法專家、架構(gòu)師和產(chǎn)品經(jīng)理等都親自上陣,解答開發(fā)者的問題。評測的反饋非常積極,甚至有點超乎大家的預(yù)料。

實際上一開始,各個實驗室內(nèi)部也存在一些疑慮,比如「國外已經(jīng)有 HuggingFace 了,那我們的魔搭該怎么定位」、「我上傳了模型之后,真的會有人來用嗎」等等。但當算法人員讀到開發(fā)者們寫下的長文評測時,所有人都倍受鼓舞,他們現(xiàn)在所想的,是要做出更先進的模型,并將其貢獻出來,被更多人看見。

魔搭的定位,不是一個「玩具」,而是實實在在的生產(chǎn)力,因為它真正全方位滲透了 MaaS 理念的本質(zhì)。

以往模型的開源開放并不徹底,大部分提供 AI 模型服務(wù)的公司通常是以 API 的形式對外提供模型服務(wù),模型本身并不能下載,大部分還要收費。而且 API 接口的輸出結(jié)果較為固定,代碼還往往無法真正用在實際業(yè)務(wù)中,更是難以滿足模型的定制化需求,所以 AI 在各行業(yè)的應(yīng)用廣度與深度都會受到限制。

而已有的開源社區(qū)的模型覆蓋面也比較有限,且沒有形成一整套、一站式的模型服務(wù)體系,開發(fā)者在各個社區(qū)之間東一榔頭西一棒槌,十分影響效率。

而達摩院這一次,一點也不來「虛」的。

如果說以往的模型服務(wù)是一只傻瓜相機,只能按一下快門、獲取千篇一律配置下的照片。那么如今達摩院提供的則是一臺單反相機,你盡可以調(diào)整相機的各種參數(shù),拍攝出萬千世界,把自己煉成大攝影家。

具體而言,魔搭社區(qū)如何真正把 MaaS 的理念實踐起來,要從模型的整個開發(fā)周期講起。

首先要有能用的模型,足夠的模型豐富度是建立 MaaS 生態(tài)的一個首要門檻。在魔搭社區(qū)上,有一個方便模型共享、存儲和使用的模型庫(Model Hub),其中達摩院已經(jīng)率先貢獻了自家 300 多個壓箱底的模型,涵蓋了自然語言處理、視覺、語音、多模態(tài)等 150 多個 SOTA 模型,「通義」系列的預(yù)訓(xùn)練多模態(tài)大模型也在其中。

中國 AI 的這次「合伙」,不止是大模型的勝利

圖注:魔搭模型庫

這些模型是經(jīng)過各個算法實驗室精挑細選的。鄢志杰告訴我們,達摩院選擇開源的模型既「叫好」又「叫座」。

「叫好」是從學(xué)術(shù)角度而言。算法團隊開發(fā)出新模型后,不再只是「王婆賣瓜」式地在論文中展示簡單的數(shù)據(jù),而是把模型在平臺上真正開源,甚至訓(xùn)練方式也都傾囊相授,供大家使用和評判。

「叫座」關(guān)注的則是應(yīng)用角度。為了最大程度地釋放模型的生產(chǎn)力,達摩院將支撐模型 API 背后的模型打開,一覽無遺的呈現(xiàn)給所有開發(fā)者,還支持開發(fā)者對預(yù)訓(xùn)練模型進行調(diào)優(yōu),從而獲得在其垂直領(lǐng)域里精度更高的模型。

達摩院的開放與包容,讓更多溪流匯入了 MaaS 這片藍海。瀾舟科技、深勢科技、智譜 AI 等作為魔搭社區(qū)的首批合作者,都在魔搭上貢獻出了自家最先進的模型。

有了大量模型,接下來的問題便是如何把模型用起來,而且要低門檻地用起來。

從代碼下載到安裝部署再到效果驗證,魔搭提供了模型探索、環(huán)境安裝、推理驗證、訓(xùn)練調(diào)優(yōu)等一站式服務(wù)和全鏈路能力,無論是 AI 小白,還是普通開發(fā)者,或者是更高級的開發(fā)者,都能在平臺上獲得極佳體驗。

對于完全不懂 AI 的愛好者,模型的使用是零門檻的,通過每個模型在魔搭上的在線體驗頁面,只需幾次點擊,就能 0 代碼體驗各種模型效果。傳統(tǒng)意義上的開發(fā)者要實現(xiàn)模型的推理,也僅需 1 行代碼。

進階的開發(fā)者則可在 10 行代碼內(nèi)實現(xiàn)模型調(diào)優(yōu),快速定制微調(diào),獲取針對性的行業(yè)模型。例如,社區(qū)提供一個文本續(xù)寫的通用模型,如果開發(fā)者想要實現(xiàn)的不是普通的文本續(xù)寫,而是古詩續(xù)寫,那么就可以使用開源的古詩詞數(shù)據(jù)集對原始模型進行微調(diào),訓(xùn)練一個新的續(xù)寫古詩的模型出來。(公眾號:雷峰網(wǎng)(公眾號:雷峰網(wǎng))

中國 AI 的這次「合伙」,不止是大模型的勝利

圖注:古詩生成微調(diào)模型


—— 3 ——

達摩院的「退一步」

魔搭是達摩院點燃的一次星星之火。通過開源所打造一個完善的模型應(yīng)用生態(tài),將促進整個 AI 領(lǐng)域的發(fā)展。

魔搭帶來的最直接影響,是在模型的生產(chǎn)側(cè)將開發(fā)者從重復(fù)性勞動中解放出來,激發(fā)更大的想象空間。無論是達摩院自身還是更多開發(fā)者,都不必再重復(fù)造輪子和無意義內(nèi)卷,而可以把更多的精力投入到原創(chuàng)性研究中,提出更具革新意義的模型。

這種變化在達摩院內(nèi)部已經(jīng)是有目共睹。魔搭社區(qū)架構(gòu)師陳穎達向 AI 科技評論介紹:以前算法人員做出模型后,由于模型的使用和調(diào)優(yōu)門檻過高,經(jīng)常還要花時間幫助業(yè)務(wù)人員配置模型,從而擠占了做原創(chuàng)研發(fā)的時間和精力;而現(xiàn)在,算法人員可以通過魔搭將模型應(yīng)用與定制能力釋放給業(yè)務(wù)線,更專注于研發(fā)工作。

從圍繞具體的業(yè)務(wù)問題到更多聚焦在基礎(chǔ)技術(shù)能力的建造上,這種算法研發(fā)范式的轉(zhuǎn)移甚至帶來了達摩院內(nèi)部組織架構(gòu)的微妙變化。

趙德麗告訴我們,他的視覺團隊以前都是從業(yè)務(wù)層面來命名,如「虛擬試衣」團隊,而現(xiàn)在則是以技術(shù)方向來命名,比如「表征學(xué)習(xí)」、「視頻生成」等團隊,每個團隊內(nèi)部在基礎(chǔ)模型的研發(fā)上也配備了比以往更多的人員力量。

同時,在基礎(chǔ)模型的研發(fā)變得越發(fā)重要的背景下,魔搭的另一個重要價值在于釋放大模型的無限想象力。

基礎(chǔ)大模型帶來的無限想象力是另一個例證。最近流行的擴散模型開源以后,AI 作畫的應(yīng)用正在國內(nèi)外社區(qū)如雨后春筍般紛紛冒頭。達摩院趙德麗團隊研發(fā)的文生圖大模型目前也已經(jīng)在魔搭開放,他已經(jīng)預(yù)見到,未來隨著模型應(yīng)用生態(tài)的逐漸完善,文生圖大模型將催生出各種富有想象力的應(yīng)用和落地。

推動這些創(chuàng)新更進一步的背后,其實是達摩院的「退一步」。

過去五年,達摩院 AI 自己探索了從算法到工程、再到產(chǎn)品、最后在阿里云上做技術(shù)輸出這一整個研發(fā)模式,煉成一位「巨人」。而在下一個五年,達摩院將獻出自己「巨人的肩膀」。

魔搭打開了一扇門,誰也無法預(yù)判進來的會是什么,但毋庸置疑的是,未來將是群星閃耀。哪怕相比之下,達摩院可能不一定是最「閃亮」的那一顆星。

達摩院語音實驗室負責人鄢志杰向 AI 科技評論講述了舉了一個生動的例子。

菜鳥曾向達摩院的語音團隊提出一個模型需求,他們想將電話機器人用于物流系統(tǒng),如在給客戶送貨前,先使用電話機器人打電話詢問客戶,以便快遞員高效送貨。

但是,在達摩院的通用語音識別系統(tǒng)有時候顯得不夠「聰明」,因為達摩院的模型并不具備物流領(lǐng)域的專業(yè)知識,自然難以聽懂一些行業(yè)「黑話」。

后來,菜鳥使用達摩院在魔搭上開源的語音識別模型,并基于物流領(lǐng)域數(shù)據(jù)集進行了針對性的模型微調(diào),僅投入了零點幾個的算法人員,便訓(xùn)練出了一個效果超越達摩院的模型。

「這一點都不丟臉,這是件好事,所有人都可以訓(xùn)練出在其垂直領(lǐng)域里比達摩院更好的模型,我覺得這很光榮?!观持窘苄Φ?。

將來,達摩院在魔搭上的模型貢獻率會從 99% 降到 1%,從「頂梁柱」角色到「磚瓦」中的一塊。最終,達摩院將隱去自身,又或者,將有千千萬萬個「達摩院」出現(xiàn)。

這是達摩院的「退一步」,也許是中國 AI 的「進一步」,它最終帶來的是對 AI 原創(chuàng)研究的巨大推動。魔搭 是達摩院一次從 0 到 1 的舉動,正如去中心化的開發(fā)環(huán)境曾為世界帶來 Linux,下一個偉大的 AI 作品或許也將從魔搭誕生。

訪問魔搭社區(qū):modelscope.cn

雷峰網(wǎng)(公眾號:雷峰網(wǎng))原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

中國 AI 的這次「合伙」,不止是大模型的勝利

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說