丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給我在思考中
發(fā)送

0

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山海”

本文作者: 我在思考中 2023-05-29 15:12
導(dǎo)語:通向大模型彼岸的方法不止一種。
山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?  src=
通向大模型彼岸的方法不止一種,正如愛因斯坦在1905年就推導(dǎo)出質(zhì)能轉(zhuǎn)換公式,但中國制造原子彈的“596工程”就不是完全照搬美國的“曼哈頓工程”。

作者丨史林

編輯丨董子博

2022年,剛剛試用了ChatGPT,黃偉的第一感覺是懵的。

和不少 AI 行業(yè)的同行一樣,看到已經(jīng)有人把大模型做到了如此程度,黃偉有些惆悵:“就如同一個打了很多年馬蹄鐵的匠人,第一次見到汽車時的震撼——之前的優(yōu)勢和積累,在這一次技術(shù)變革面前幾乎全部歸零?!?/span>

自創(chuàng)立云知聲,已有十年光景匆匆過去,這十年里苦練的武功,難道一朝就全部失效?

沉浸在這種沖擊里,黃偉有差不多一個星期的時間,沒緩過勁來。

但很快,這種焦慮,就轉(zhuǎn)化成了一種“亢奮”。在今天,不少人把這個時點稱作 AI 的“iPhone Moment”,但在黃偉看來,這樣的說法,未免顯得“野心太小”。

“十年前,我創(chuàng)業(yè)的時候,還沒有移動互聯(lián)網(wǎng),也沒有深度學(xué)習(xí),那時我也沒有商業(yè)化的背景和經(jīng)驗——但今天我的心情,比起十年前更激動?!秉S偉這么對AI科技評論表示道。

抱著改變世界的夢想,云知聲也很快加入了大模型的追逐戰(zhàn)中——做自己的大模型,用技術(shù)力量打通更多場景,賦能更多的客戶和使用者。

而隨著巨頭紛紛下場、明星IP抓人眼球,這場戰(zhàn)斗對于云知聲來說,算不上輕松。

國內(nèi)的大模型,在今天發(fā)展還遠(yuǎn)未完全;對于創(chuàng)業(yè)公司,投資機(jī)構(gòu)也大多謹(jǐn)慎。不少人都說,大模型是大公司的生意,中小公司的機(jī)會很可能比較渺茫。

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

這也讓黃偉想到了那句“所愛隔山海,山海皆可平”。5月24日,云知聲發(fā)布的大模型,名字“山?!本褪菑闹卸鴣?。

踏平“山海”,黃偉和云知聲在大模型之路上求索,正帶著人工智能走向2.0時代。



1

山海大模型

怎樣在同類賽道里脫穎而出?

從3月文心一言發(fā)布以來,國內(nèi)已有不下十個大模型產(chǎn)品,先后發(fā)布。個個“能文能武”,但表現(xiàn)出來的能力,卻相差不多。

對這個趨勢,有不少人說,泛化大模型的能力再強,沒法落進(jìn)場景,也就無法產(chǎn)生生產(chǎn)力甚至行業(yè)格局的變革。

大模型落不了地,詩寫得再好、對聯(lián)對得再工整,也不過是“自娛自樂”。而云知聲對待大模型,不僅要“山?!痹谶@些“基礎(chǔ)課”中達(dá)到及格,更要讓它能夠在B端落地生根,產(chǎn)生實際的價值。

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

而這些能力,不只源于大模型自身的能力?!拔矣X得現(xiàn)在的云知聲可以類比為一座金礦,我們的真實能力和技術(shù)水平是隱含在交付的產(chǎn)品以及營收數(shù)字背后的。”云知聲創(chuàng)始人&CEO黃偉如是說道。

在物聯(lián)場景下,云知聲面向物聯(lián)網(wǎng)的智能交互芯片,將作為“神經(jīng)元”把大模型聯(lián)通起來,給萬物互聯(lián)提供更好的條件。在物聯(lián)網(wǎng)場景里,任何一個玩家都需要讓自己的產(chǎn)品在盡可能多的場景,盡可能多的用戶以及盡可能多設(shè)備上,以足夠低的成本跑起來。

像過去常常被人詬病“人工智障”的智能音箱,用戶不能和 AI 產(chǎn)生深層次的交互——一聊天,天就被聊死了。而在生成式 AI 的加持下,無論從體驗還是效率上,智能設(shè)備都能獲得巨大的改善。

同樣的情況,不僅音箱,從消費電子到車機(jī),都是山海大模型所覆蓋的領(lǐng)域。

在2016年,云知聲就開始組建專業(yè)團(tuán)隊,自己動手打造智能交互芯片。截止目前,芯片和模組出貨量已經(jīng)超過2000萬片,這也給山海大模型搭建了一個足夠大的舞臺,讓大模型能夠更充分地發(fā)揮云知聲在硬件層面上,給物聯(lián)網(wǎng)提供的互聯(lián)優(yōu)勢,把過去已有的產(chǎn)品結(jié)構(gòu)打通,甚至是重構(gòu)。

而在醫(yī)療場景中,山海大模型更是輕車熟路。

云知聲2016年就進(jìn)入醫(yī)療行業(yè),當(dāng)時主要利用AI技術(shù),解決病歷的語音錄入、缺陷檢查、醫(yī)??刭M等問題。山海大模型幾十億規(guī)模的參數(shù),對比現(xiàn)在的主流產(chǎn)品并不算大,在接入生成式 AI 后,醫(yī)生對病人的問診,如最近飲食情況等等,這樣的問題就很像對大模型的 prompt 提問,幾分鐘內(nèi)問過幾個問題后就逐步收斂,通過醫(yī)患對話提取關(guān)鍵信息,結(jié)合專業(yè)醫(yī)學(xué)知識后最終生成病歷。相比傳統(tǒng)問診,這種方式的效率高得多,也會開拓新的商業(yè)模式。

“我們做大模型其實并不是為了PR,也并不是說我們只是為了炫技或者展示自己有這樣的能力,”黃偉說道,“公司其實最終還是要靠商業(yè)化能力去活著,對吧?所以我們的大模型一定是服務(wù)我們這個已有場景里面的一些老客戶?!?/span>

除了物聯(lián)和醫(yī)療,山海大模型的優(yōu)勢場景還有不少,而這都要得益于云知聲“U+X”戰(zhàn)略的頂層設(shè)計——即以 U(AI架構(gòu)及全棧技術(shù)),深度結(jié)合X(行業(yè)應(yīng)用場景),解決行業(yè)深層問題。

這也讓山海大模型在落地層面上的廣度(物聯(lián),盡可能多鏈接場景、用戶和設(shè)備)和深度(醫(yī)療,知識密集型行業(yè)),都得到了巨大的提升。

另一方面,在過去的11年里,深耕 To B 的云知聲,也積累了大量行業(yè)的 Know How,以及核心高質(zhì)量的訓(xùn)練數(shù)據(jù)。

先前,云知聲挑選的落地場景,大多是醫(yī)療、保險等嚴(yán)肅性很高,容錯率較低的行業(yè)——大模型要在這些行業(yè)能生根發(fā)芽,就容不得一點閃失,胡說八道的問題解決不了,就沒法被行業(yè)所認(rèn)可。

而云知聲在過去為這些行業(yè)打造的知識圖譜,就成為了提升“山?!鄙蓛?nèi)容正確率的重要保證。

還是以醫(yī)療領(lǐng)域舉例,在過去,云知聲提供的知識圖譜可以幫助醫(yī)生,完成對患者病歷的審核;與此同時,公司積累的語音識別技術(shù),也能讓用戶在一個很嘈雜的環(huán)境里(比如人來人往的診室),完成相當(dāng)準(zhǔn)確的自然語音交互。

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

“如果把GPT-4比作一個不偏科,每門都能考到80分的學(xué)生;我們要做的,則是一個可以在某一兩門學(xué)科,考到95分甚至更高的學(xué)生?!秉S偉如是說。

誠然,大模型的發(fā)展路徑不止一種,目前見到成果的路徑,是如GPT采用的一樣——更大的模型規(guī)模+更多的數(shù)據(jù)參數(shù),做泛化大模型,再進(jìn)行行業(yè)調(diào)優(yōu)。而黃偉也相信另一種路徑的機(jī)會——更高質(zhì)量的數(shù)據(jù)+規(guī)模適當(dāng)?shù)臄?shù)據(jù)參數(shù),做行業(yè)“中模型”。

老話說“博觀約取,厚積薄發(fā)”,很多人都對看得見的“薄發(fā)”津津樂道,卻對看不見的“厚積”必要性和重要性置若罔聞。

云知聲在AI 2.0時代的辦法是兩條路子都在走,現(xiàn)在第一條路基本上已經(jīng)走通,并且效果有目共睹。今年Q3云知聲還會發(fā)布對標(biāo)GPT-3.5的“山海2.0”,數(shù)據(jù)參數(shù)也將達(dá)到千億級。

而在Q3,云知聲的“中模型”也即將發(fā)布,而具體的成果,還要看到產(chǎn)品,再等待市場檢驗。



2

踏平“山?!?/strong>

只是“順?biāo)浦邸?/strong>

黃偉經(jīng)常對團(tuán)隊講:“能得到好的結(jié)果,一定是你做對了什么。”

不少國內(nèi)有意做大模型的廠商,都是從12月開始組建團(tuán)隊,用2-3個月訓(xùn)練模型,再用2-3個月完成調(diào)優(yōu)——起跑線相對一致。但云知聲的山海大模型,卻“搶跑”了。

說山?!皳屌堋?,是因為云知聲早在不少人還沒注意到大模型的可能性之前,就已經(jīng)在為 AI 2.0 時代未雨綢繆。

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

我們云知聲在過去做 AI 技術(shù)積累的時候,恰恰都是外部環(huán)境不是最好的時機(jī)。”回憶過去的發(fā)展歷程,黃偉如是說道。

近幾年國內(nèi)相當(dāng)一部分高新科技企業(yè),最終都落入了To B項目制的窠臼:產(chǎn)品跟著甲方需求走,自己毫無話語權(quán);等到甲方的問題解決了,投入也隨之降低,企業(yè)卻在核心技術(shù)和通用性解決方案上難有積累,只能再去找下家接方案,形成惡性循環(huán)。

然而,云知聲看得卻更遠(yuǎn)。成立伊始,公司的英文名字Unisound,就包含了創(chuàng)始人們對于公司發(fā)展的期許:

“Sound”是云知聲的主要技術(shù)——聲音、語音;而“Uni”則代表著,公司要用相對統(tǒng)一的技術(shù),去服務(wù)不同的行業(yè)的普通客戶。

此后,“統(tǒng)一技術(shù)標(biāo)準(zhǔn)+具體行業(yè)場景”,就成為了云知聲堅定不移的戰(zhàn)略。不被外界紛擾,不被風(fēng)口誘惑,成為了云知聲在路徑規(guī)劃上的堅守。

從“感知”到“認(rèn)知”的技術(shù)轉(zhuǎn)型,盡管已經(jīng)被普遍認(rèn)為是必然的趨勢,對于不少當(dāng)時的 AI 公司,是眼前的“茍且”與“詩和遠(yuǎn)方”之間的進(jìn)退兩難。

先掙到錢,還是先為未來布局,黃偉和云知聲選擇了后者。做認(rèn)知智能,是公司技術(shù)發(fā)展的必選項,率先在醫(yī)療行業(yè)實現(xiàn)認(rèn)知智能,成為了云知聲在當(dāng)時的目標(biāo)。

因此,現(xiàn)在也不難發(fā)現(xiàn),“山海”在醫(yī)療場景中積累的種種能力,完全不足為奇,一切都是順理成章,順?biāo)浦邸?/span>

2017年,另一件決定了“山?!泵\的大事,是云知聲開始籌建屬于他們自己的超算中心——Altas。

一年前,AlphaGo 擊敗一眾圍棋高手時,深度學(xué)習(xí)+超算平臺的連攜思路,也讓云知聲深受啟發(fā),很快展開第二次技術(shù)升級,涉足超算中心——一個團(tuán)隊當(dāng)時還完全陌生的領(lǐng)域。

“能同時調(diào)度上千塊GPU去完成一個任務(wù)的能力,將會是一家AI公司的重要壁壘?!秉S偉和云知聲的高層如此判斷道,但外界大多對他們不抱信心。

決定做超算中心,不僅是公司的新股東,甚至連老股東都在質(zhì)疑:這筆巨大的投入,如何能讓他們見到成效。而當(dāng)時,對于驅(qū)動 AI 的計算能力,大多數(shù)人還沒看到它的價值。

“當(dāng)時甚至幾個月前,還能聽說大機(jī)構(gòu)在市場上賣 A100 顯卡?!秉S偉回憶道,“但今天一家公司,要從零開始做高性能計算平臺,沒有兩三個月的工夫是搞不定的。”

對技術(shù)路徑的判斷,AI科技評論在和不少 AI 從業(yè)者的交流中,都聽到過一個相似的概念——“技術(shù)直覺”,即基于有限的信息和樣本,能夠?qū)ξ磥砑夹g(shù)路徑做出正確規(guī)劃的能力。

這種直覺越強,就能越早走上正確的技術(shù)路徑,為未來趨勢作準(zhǔn)備,也能越少在沒有前景的項目上走彎路。

此前曾有投資機(jī)構(gòu)的合伙人考察過云知聲,最終卻因為種種原因放棄了投資。

巧合的是,云知聲有位合作專家與這位合伙人是同學(xué),在得知此事后,意味深長地說:“你的問題,在于你認(rèn)為云知聲只是家語音處理技術(shù)公司。

當(dāng)問到黃偉時,他自謙道,自己并沒有很敏銳的“技術(shù)直覺”。但是,黃偉卻可能是中國 AI 圈子里,最早一批發(fā)現(xiàn) GPU 重要性的創(chuàng)業(yè)者。

2011年,在意大利佛羅倫薩,黃偉受邀參加了一次學(xué)術(shù)會議。在會上,黃偉與微軟前首席人工智能科學(xué)家鄧力,微軟研究院前首席研究員、今天騰訊AI Lab副主任俞棟結(jié)識,暢談 AI 在當(dāng)下的發(fā)展。

在交流中,三人都有想法,當(dāng)時應(yīng)用比較廣泛的統(tǒng)計學(xué)習(xí),不過是“繡花”的功夫,研究已經(jīng)接近了天花板。然而,要做當(dāng)時還相當(dāng)冷門的深度學(xué)習(xí),則需要有更大算力的支持。

也是受了此二人的影響,第二年,黃偉創(chuàng)業(yè)后,第一件事,就是把深度學(xué)習(xí)作為公司的立根之本;而第二件事,就是買了兩塊英偉達(dá)顯卡,來處理深度學(xué)習(xí)的計算。

在當(dāng)時,顯卡甚至還沒有 GPU 這個響當(dāng)當(dāng)?shù)拿郑欢嗄赀^去,做 AI 的人,誰又離得開 GPU?數(shù)年后,云知聲力排眾議建設(shè)超算中心,也算是與這兩塊顯卡一脈相承。



3

結(jié)語

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

事實上,早在2月,云知聲就跑通了自研大模型閉環(huán)的產(chǎn)品流程——從預(yù)訓(xùn)練,到任務(wù)對齊、指令增強等等,模型本身也出現(xiàn)了涌現(xiàn)能力。

但黃偉和云知聲不想讓“山海”以一個半成品的形態(tài)面世,總覺得對產(chǎn)品不夠滿意,便生生地,把發(fā)布日從2月拖到了5月底。

“其實,二三月份國內(nèi)廠商們做出來的 Alpha 版本,大家無論是進(jìn)度上還是能力上,都相差不多?!秉S偉對AI科技評論說道,“這幾個月來,真正能夠開發(fā)布會,而且做現(xiàn)場演示的廠商少之又少了——我們可能聽到很多大模型的名字,但真正能看到的其實并不是特別多?!?/span>

5月24日,云知聲山海大模型暨成果發(fā)布會在北京舉辦,現(xiàn)場實測山海大模型十大核心能力,并發(fā)布一系列面向不同行業(yè)需求的產(chǎn)品應(yīng)用。

北京金隅智造工場的發(fā)布會現(xiàn)場,臺下座無虛席,現(xiàn)場賓客盈門。黃偉站上演講臺時引來一陣歡呼,衣著干練簡潔,氣質(zhì)溫和,這個打扮走在街上并不起眼,但在此刻卻與主人的從容不迫,躊躇滿志相得益彰。

發(fā)布會現(xiàn)場,圍繞山海大模型的十大核心能力,即語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項通用能力及插件擴(kuò)展、領(lǐng)域增強、企業(yè)定制三項行業(yè)落地能力,云知聲通過語音輸入、實時互動的方式進(jìn)行講解演示。

黃偉在臺上講,身后的大屏幕上實時展示山海的語音輸入并轉(zhuǎn)換成文字,既展示自身實力,又方便了現(xiàn)場觀眾。

也是在發(fā)布會上,云知聲與中建電子、京東科技、360達(dá)成戰(zhàn)略合作,與各合作伙伴展開深度合作,推動山海大模型在各領(lǐng)域的落地應(yīng)用,一道邁入AGI時代浪潮。

在這個 AI 技術(shù)幾乎日新月異、每周都有新技術(shù)面世的時代,一定是“幾家歡喜幾家愁”。

某些技術(shù)產(chǎn)品和業(yè)務(wù)模式,正不可避免地被生成式 AI 淘汰;而對于云知聲,AI 大模型給了他們升級已有商業(yè)模式的機(jī)會,正直面著再一次擴(kuò)大規(guī)模的重要機(jī)會。

山海大模型的發(fā)布,對于云知聲來說,并不是終點,而是公司邁向 AI 2.0時代重要的起點。至于“山?!边@個名字,“山”是高山仰止,大智知止,象征大模型符合社會與人類的道德和價值觀。“?!笔呛<{百川,有容乃大,象征對人類龐大知識體系的理解與總結(jié),也象征著AI的無限可能性。

此外,“山?!币泊碇浦暤膱猿?,所愛隔山海,山海皆可平。幾個月前外界都說大模型是巨頭才能做的,現(xiàn)在大家都看到了山海大模型。

“對于今天的我們,一定是幸福大于煩惱的——而且 AI 在今天的機(jī)會,甚至遠(yuǎn)遠(yuǎn)大出我在四個月之前的想象?!痹谡f出這句話時,黃偉臉上滿是壓抑不住的興奮。

更多內(nèi)容,點擊下方關(guān)注:

(公眾號:雷峰網(wǎng))旗下AI新媒體。聚焦AI前沿研究,關(guān)注AI工程落地。" data-from="2" data-index="1" data-origin_num="2158" data-isban="0" data-biz_account_status="0" data-weui-theme="light" data-is_biz_ban="0">

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山?!?   class=

未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

山海大模型發(fā)布:11年的積累,云知聲如何翻越“山海”

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄