0
本文作者: 我在思考中 | 2023-04-11 15:44 |
編輯丨岑峰
“這131天,對我來說,就像過了好幾年一樣?!被貞浧鹱訡hatGPT誕生至今的日子,王小川如是說道。
大模型創(chuàng)業(yè),自卷起大潮后,已經(jīng)過去了數(shù)月之久,王慧文將“光年之外”落在搜狐大廈,李志飛回到出門問問雙線作戰(zhàn),王長虎則給新公司定名“愛詩”招兵買馬,賈揚(yáng)清則在離開阿里后還百廢待興……
而王小川也沒有閑著,在王慧文新辦公室的樓下,小川召開了一個(gè)媒體溝通會(huì),官宣了他的新廠牌——“百川智能”。會(huì)上,王小川身著一件橙紅色的帽衫,不用PPT,只是在眾人擁簇下侃侃而談,有接近小川的人對AI科技評論表示:“這幾年他變化很大,松弛了不少,也幽默了不少。”
早在雷峰網(wǎng)之前的文章——《ChatGPT群雄逐鹿:陸奇屠龍,號令天下;小川不出,誰與爭鋒》——中就有提過,從學(xué)術(shù)號召力、工程能力、政商能力、意愿沖勁四個(gè)維度中,王小川都不落人后,綜合實(shí)力一流。
到四月底,百川的團(tuán)隊(duì)將達(dá)到50人的規(guī)模?!敖衲昴甑祝瑢?biāo)ChatGPT3.5的模型就可以訓(xùn)練完成。”王小川如是說道。
近期,雷峰網(wǎng)(公眾號:雷峰網(wǎng))和王小川有過一次對談,對于生成式AI,乃至未來的AGI的可能形態(tài)、完成終局、創(chuàng)業(yè)者如何找準(zhǔn)位置入局等問題,進(jìn)行了深入的交流。
交流中,王小川提到,這兩個(gè)月,關(guān)于未來AI大模型的打法和決策,在進(jìn)行反復(fù)的思考和迭代,“基本算是把路徑想清楚了”。
將公司定名為“百川”,王小川不僅意指大模型技術(shù)的發(fā)展路徑——匯集海量數(shù)據(jù)和行業(yè)知識(shí),以訓(xùn)練出足夠智慧的AI;其中更是代表了他對招賢納士的渴望,希望能人義士能夠合歸一處,助他在大模型的創(chuàng)業(yè)上更進(jìn)一步。
在搜狗的后期,王小川越發(fā)能感受到人員招募的艱難;而在ChatGPT之后,隨著人們對于AI熱情的高漲,王小川說,聚攏人才相比幾年前更容易了,到這個(gè)月末,團(tuán)隊(duì)的規(guī)模就能擴(kuò)充至50人,甚至還有人“帶資進(jìn)組”。
有消息稱,百川的團(tuán)隊(duì)招攬了大量他在搜狗的舊部,一方面,他們更懂搜索和NLP,與大模型算是近水樓臺(tái);一方面更認(rèn)同小川的價(jià)值觀,更有目標(biāo)感;一方面也更懂得如何和他合作,知道對方想要什么。
而對于團(tuán)隊(duì),王小川的目標(biāo)還不止于此,他對AI科技評論表示,在厘清了現(xiàn)有團(tuán)隊(duì)的結(jié)構(gòu)之后,馬上還要奔赴美國“薅人”,頗有“周公吐哺,天下歸心”之意。
在原先的文章中我們就有提到:王小川出身清華,并與清華大學(xué)聯(lián)合創(chuàng)辦了天工人工智能研究院,有很高的學(xué)術(shù)號召力。得道多助的小川背后,還有清華這間國內(nèi)頂級高校的支持。
評價(jià)王小川的大模型創(chuàng)業(yè),中國工程院院士、清華大學(xué)計(jì)算機(jī)系教授、王小川在清華的碩士導(dǎo)師鄭緯民表示:“王小川敢于創(chuàng)新,敢于思考,具有豐富的系統(tǒng)工程經(jīng)驗(yàn)……研究并行計(jì)算和相關(guān)的體系結(jié)構(gòu),是我所在的清華大學(xué)高性能計(jì)算研究所的重要工作,也有著豐富的經(jīng)驗(yàn),一定會(huì)全力配合與支持王小川?!?/span>
而中國科學(xué)院院士,清華大學(xué)人工智能研究院院長,王小川的博士導(dǎo)師,張鈸也表示:“新創(chuàng)建的百川公司的團(tuán)隊(duì)很強(qiáng),我相信他(王小川)能完成這個(gè)使命,并在未來的發(fā)展中給予全力支持?!?/span>
除鄭緯民、張鈸兩位院士外,清華大學(xué)計(jì)算機(jī)系的尹霞、馬少平、劉奕群等教授,也不乏對百川智能的溢美之詞,紛紛表示將鼎力相助。
資金方面,王小川也表示,現(xiàn)有的資金狀況可以放心,手中5000萬美金的啟動(dòng)資金,已經(jīng)可以支撐他當(dāng)下的團(tuán)隊(duì)和算力成本。而大模型的從零到一,王小川估算,成本的規(guī)模大概在3-20億美金。
從產(chǎn)品的角度上,王小川銳意進(jìn)取,直言:就是要做中國最好的AI大模型。
如何做到最好?不少人盲目地迷信模型參數(shù)——參數(shù)越大,模型就越強(qiáng)。
但王小川并不同意這一點(diǎn),他表示,盲目追求大參數(shù),未免有些浮夸。當(dāng)下,百川已經(jīng)開始了參數(shù)量級在500億左右的模型訓(xùn)練,而在年末對標(biāo)GPT3.5的模型。
王小川對于AGI終局的
早在王小川還是研究生的時(shí)候,他研究的是基因測序的技術(shù)。而在研究中,王小川還是看到了這項(xiàng)技術(shù)的弱點(diǎn):“而基因測序是十分混沌的——中間不確定的變量太多,有不少蝴蝶效應(yīng)。在過去牛頓寫了《自然科學(xué)中的數(shù)學(xué)原理》,將物理簡化成數(shù)學(xué),但生命科學(xué)還做不到?!?/span>
20年后,王小川離開搜狗,豪言:“往后二十年,若能為生命科學(xué)和醫(yī)學(xué)的發(fā)展盡一份力。”時(shí)間又過去兩年,王小川將生命科學(xué)的盤子轉(zhuǎn)托給楊洪濤,全情投入大模型創(chuàng)業(yè)。對于這一點(diǎn),他心中難免有波瀾。
要將生命科學(xué)的秘密摸清,20年太久,也太理想主義,王小川心里清楚,理想主義和現(xiàn)實(shí)需要平衡。早在數(shù)年前,谷歌開發(fā)的AlphaFold就實(shí)現(xiàn)了以蛋白質(zhì)的基因序列,預(yù)測蛋白質(zhì)的 3D 結(jié)構(gòu)的功能。盡管功能還遠(yuǎn)稱不上完善,但這讓王小川看到了從AI到生命科學(xué)的“曲線救國”。
要做AI,王小川卻沒有選擇從生命科學(xué)入手,相反,他選擇了他更輕車熟路的語言。
為什么要從語言切入,王小川的思考,是從人的認(rèn)識(shí)論開始的:通過語言,才能認(rèn)識(shí)這個(gè)世界。
早有不少人問他,AGI這一波來勢如此洶涌,機(jī)會(huì)也不止于大模型,為什么不做文生圖、CV、智能駕駛這種技術(shù)路徑更成熟的領(lǐng)域?
而王小川的立場卻相當(dāng)堅(jiān)定,語言是知識(shí)、思考、溝通、乃至文化的載體,如果目標(biāo)的是AGI這顆“皇冠上的明珠”,那么必須從語言入手——語言距離AGI,比圖像和視覺都要更近。
而同時(shí),語言也一直是王小川的優(yōu)勢所在。對AI科技評論,王小川直言:“輸入法是猜你想說啥,搜索引擎是猜你想要啥——而ChatGPT,則是將這兩種需求進(jìn)行了一站式的解決?!?/span>
“原來經(jīng)常有人問我,是做模型還是做應(yīng)用——這一問,就把自己繞進(jìn)去了。”王小川如是說。
借鑒過去微信、淘寶的“老路”,想要突圍,除了有技術(shù)以外,關(guān)鍵還是得做出中國自己的殺手級應(yīng)用。
這一點(diǎn),王小川深有體會(huì):搜狗的成就,并非體現(xiàn)在搜索引擎的技術(shù)本身;正是有了搜索引擎、輸入法這兩個(gè)爆款應(yīng)用之后,搜狗的價(jià)值才真正被人看到。
而這也是王小川入局創(chuàng)業(yè),便迅速積累了一批搜狗舊部的原因;想必這一次的創(chuàng)業(yè),王小川的“三級火箭戰(zhàn)略”指導(dǎo)思想和打造殺手級應(yīng)用的經(jīng)驗(yàn)也將再一次發(fā)揮價(jià)值。
“智能的終極,我們肯定永遠(yuǎn)都會(huì)追求。但我們和ChatGPT不一樣的地方是,我們也關(guān)注,AI大模型落地的場景,是否是真實(shí)的;產(chǎn)品化的AI,是否真的用得著?!蓖跣〈ㄟ@么表示道。
從輸入法走向搜索,未來還要走向Chat,王小川認(rèn)為,明天的王道,是“Chat+搜索”的“Chat Pro”形式。
“我認(rèn)為,今天的OpenAI有點(diǎn)‘目空一切’,AI能力很強(qiáng),但并沒有進(jìn)攻搜索領(lǐng)域;New Bing則是以搜索為核心,加上了ChatGPT的能力,但仍然不夠純粹。”
王小川認(rèn)為,Chat只是一種體驗(yàn)的升級,也只是增強(qiáng)產(chǎn)品核心的一個(gè)能力。而真正落進(jìn)實(shí)際的場景,應(yīng)該面向?qū)I(yè)的領(lǐng)域——比如健康、法律,并且要將這些專業(yè)領(lǐng)域整合到一起,做一個(gè)“大Chat”。
而要完成諸多領(lǐng)域的整合,做成AI時(shí)代的“超級APP”,背后一定是擁有強(qiáng)大能力的AI大模型的支持。
王小川對雷峰網(wǎng)表示,上個(gè)時(shí)代的范式,可以被稱作“連接X信息”。以谷歌為例,無論是門戶網(wǎng)站、搜索、再到推薦,都是將知識(shí)用網(wǎng)絡(luò)連接了起來。
在王小川看來,上個(gè)范式的連接分為三種——點(diǎn)到點(diǎn)的“Portal(傳送門)式連接”,從關(guān)鍵詞到海量相關(guān)信息的“搜索式連接”,從用戶使用習(xí)慣到推薦內(nèi)容的“推薦式連接”。
抖音就是把“推薦式連接”做到了極致,于是才成了移動(dòng)互聯(lián)網(wǎng)時(shí)代的王者之一。
而在今天AI大發(fā)展時(shí)代,王小川認(rèn)為,新的范式應(yīng)該被稱作“陪伴X知識(shí)”,讓表達(dá)和獲取知識(shí)更加簡單。
在這個(gè)范式下,Chat能力的“陪伴”作用能被發(fā)揮到最大——比如,在當(dāng)下的醫(yī)院,醫(yī)生沒法將全部精力給到每一個(gè)病人身上;在Chat能力的作用下,AI可以完成私人醫(yī)生的作用,實(shí)現(xiàn)對病人一對一的陪護(hù)。
類似的場景,無論是老師,還是律師、醫(yī)生,都可以用陪伴的方式,來完成知識(shí)的傳遞。
舊時(shí)王謝堂前燕,飛入尋常百姓家。有“陪伴X知識(shí)”體系的賦能,社會(huì)也將變得更加扁平,私人法律、醫(yī)療等等服務(wù)也將更加普惠。
AI的To B生意,在今天早已是一片紅海,甚至稱得上是“死海”。
誠然,To B生意更能賺到穩(wěn)定的營收,而如上所言,商業(yè)的決策絕不能是只為眼前一時(shí)的取舍。王小川認(rèn)為,看AI的大方向,就要看到生成式AI的“終局”
縱觀計(jì)算機(jī)發(fā)展的歷史,從大型機(jī)到WorkStation,再到PC、手機(jī),最終技術(shù)的簡化路徑,總是會(huì)落向個(gè)人。
對于百川智能的愿景,王小川對AI科技評論表示,目前有幾個(gè):
首先,一定是要做中國最好的大模型,當(dāng)下,百川智能的大模型正在按部就班地訓(xùn)練,爭取可以在年底之前發(fā)布;
在產(chǎn)品化落地的角度,增強(qiáng)大模型在教育、醫(yī)療等垂直領(lǐng)域的知識(shí)積累,讓大模型能夠及早在專業(yè)領(lǐng)域發(fā)光發(fā)熱;
而這一切的終局,則是讓大眾能夠輕松普惠地,獲取知識(shí)和專業(yè)服務(wù),以AI技術(shù)的演進(jìn)推動(dòng)社會(huì)生產(chǎn)力的提升與變革。
AI大模型的創(chuàng)業(yè)戰(zhàn),格局尚且未定。誰能成為賽道的領(lǐng)先者?
技術(shù)和算力上,不少公司仍處在同一起跑線上;而在“外功”勝負(fù)難分的情況下,“內(nèi)功”的深淺,反而決定了一家企業(yè)的成敗。
或者說,從一個(gè)企業(yè)家的格局,就能看到一個(gè)企業(yè)最終的未來。
在今天,沒有人能預(yù)言通用人工智能的未來;也沒有人能確知,誰的技術(shù)、市場路徑能走得更好、更遠(yuǎn)。
AGI創(chuàng)業(yè)者們比格局的背后,實(shí)際打響的,是人才的爭奪戰(zhàn):誰的認(rèn)知更深刻、判斷更準(zhǔn)確,誰就能更有機(jī)會(huì)招募到更多的核心人才。
當(dāng)下,王小川在AGI創(chuàng)業(yè)上的布局已經(jīng)初具規(guī)模,背后也有前搜狗COO茹立云的支援,兩人都是清華計(jì)算機(jī)系出身,并分別擔(dān)任清華大學(xué)“天工智能計(jì)算研究院”的聯(lián)席院長和副院長,在清華學(xué)生中間影響力很高;加之王小川、茹立云兩人在工程和商業(yè)領(lǐng)域的能力,在這波創(chuàng)業(yè)潮中,占據(jù)了一個(gè)不錯(cuò)的身位。
從ChatGPT驚為天人,再到2023的AGI創(chuàng)業(yè)大潮,AI行業(yè)仍在令人振奮地不斷前進(jìn)著。而科技究竟要去往何方,仍然是一個(gè)充滿著無限可能性的未來。
不同于許多人,在談到AGI時(shí),王小川想到的是技術(shù)的終局——以始為終,才能在探索中少走冤枉路,才能打出提前量,在競逐中實(shí)現(xiàn)彎道超車。
此前,在知乎上有個(gè)提問:“哪一句話一直支撐著你活下去”。
王小川的回答是:與時(shí)間做朋友。
在比賽開始,就看到了終點(diǎn)的王小川,正向著他所確信的未來,堅(jiān)定地邁著前進(jìn)的步伐。
未來,AI科技評論還將持續(xù)關(guān)注王小川、王慧文等明星創(chuàng)業(yè)者的大模型創(chuàng)業(yè)動(dòng)態(tài),歡迎添加本文作者董子博(vx:william_dong)交換認(rèn)知,互通有無。
文末,附王小川的公開信:
今天我正式宣布,創(chuàng)建“百川智能”,一家研發(fā)并提供通用人工智能服務(wù)的中國公司。
生活在二十一世紀(jì)初是如此幸運(yùn),波瀾壯闊的互聯(lián)網(wǎng)革命還沒有謝幕,通用人工智能時(shí)代又呼嘯而來。多年前我曾斷言,機(jī)器掌握語言,通用人工智能時(shí)代就來了;我也有暢想,搜索的未來是問答。ChatGPT的騰空出世,地動(dòng)山搖,這一切都開始成為現(xiàn)實(shí)。ChatGPT發(fā)布到今天,僅僅131天,每天都有撲面而來的新進(jìn)展、新突破。131天恍如隔世!
大半個(gè)世紀(jì)以來,科學(xué)家們前赴后繼,努力創(chuàng)造通用智能機(jī)器。這一天終于到來,我們找到了一條巧妙的路徑,用AI成功將語言轉(zhuǎn)化成了數(shù)學(xué)模型。語言是知識(shí)、思考、溝通和文化的載體。維特根斯坦說,語言的邊界就是世界的邊界。當(dāng)AI掌握了語言后,就開始認(rèn)知世界,成為有知識(shí)、能思考、善表達(dá)、會(huì)學(xué)習(xí)的智能體。我把這樣的智能體稱為“語言AI”。
人類個(gè)體總有消亡的一天,但能夠?qū)吷闹R(shí)通過語言記錄下來供新生命學(xué)習(xí)、繼承,文明因此延續(xù)。人類協(xié)作也需要個(gè)體之間通過語言溝通。掌握了溝通和世界知識(shí)的語言AI不再只是人類的“工具”,而將成為我們的伙伴和超級助理,成為人類文明的一部分。
智能時(shí)代會(huì)改寫互聯(lián)網(wǎng)時(shí)代的范式?!B接’會(huì)被‘陪伴’取代,‘信息服務(wù)’會(huì)被‘知識(shí)服務(wù)’取代,‘免費(fèi)與廣告’會(huì)被‘付費(fèi)與高品質(zhì)’取代。
智能時(shí)代也會(huì)改寫自工業(yè)時(shí)代以來的范式。曾經(jīng)是專業(yè)化社會(huì)分工帶來規(guī)模效應(yīng)與效率提升,而未來會(huì)是逆專業(yè)化分工:之前需要很多公司協(xié)作完成的工作,會(huì)因?yàn)锳I的賦能‘端到端’的完成。
智能時(shí)代將再一次開啟“文藝復(fù)興”。每個(gè)人都會(huì)因?yàn)锳I的助力而變得更加強(qiáng)大。用好AI,一個(gè)人就可能做一個(gè)公司,解決之前難以解決的難題,也更容易成為自己想成為的人。社會(huì)也會(huì)更加扁平,以前少數(shù)人才能享有的智力服務(wù),也能更普惠。
告別搜狗后,我已開啟新的遠(yuǎn)征:立志往后二十年,為生命科學(xué)和醫(yī)學(xué)的發(fā)展盡一份力,為大眾健康做出一點(diǎn)貢獻(xiàn),核心路徑是構(gòu)建生命健康數(shù)學(xué)模型,并已經(jīng)付諸行動(dòng)。ChatGPT的出現(xiàn),也將成為新遠(yuǎn)征的重要助力。
不僅如此,ChatGPT是我過往經(jīng)歷的延續(xù)和升華。2019年我將搜狗的使命升級為“讓表達(dá)和獲取知識(shí)更簡單”,愿景定義為“幫助每個(gè)人輕松地對話和書寫。便捷地獲得知識(shí)和服務(wù),提升工作效率和生活品質(zhì)”。
搜狗輸入法和搜狗搜索的數(shù)據(jù)制備和產(chǎn)品形態(tài),也與ChatGPT接近。它們都是把互聯(lián)網(wǎng)上的全部語言數(shù)據(jù)收集、清洗,壓縮成數(shù)據(jù)庫并構(gòu)建超級產(chǎn)品。隨著深度學(xué)習(xí)的發(fā)展,這些產(chǎn)品都多次迭代升級,全面用上了Transformer/Bert等技術(shù)。輸入法猜你想說什么,搜索猜你想要什么。而ChatGPT把這些能力推到了一個(gè)全新的高度,是輸入法、搜索之外,第三個(gè)把全網(wǎng)數(shù)據(jù)轉(zhuǎn)化成語言服務(wù)的超級產(chǎn)品。搜狗未盡的使命在機(jī)器掌握了語言后終于可以實(shí)現(xiàn)。
很多朋友認(rèn)可我的技術(shù)理想主義和技術(shù)驅(qū)動(dòng)的創(chuàng)業(yè)經(jīng)驗(yàn),鼓勵(lì)和支持我做中國的OpenAI。也有很多搜狗和非搜狗的技術(shù)大拿,得知我有做大模型的想法,主動(dòng)申請參與組隊(duì),甚至“帶資入組”。
我最動(dòng)心的是,能和一群有理想的人,用極致的技術(shù)驅(qū)動(dòng)創(chuàng)造出顛覆性的智能產(chǎn)品。這一次,百川智能將借助語言AI的突破,構(gòu)建中國最好的大模型底座,并在搜索、多模態(tài)、教育、醫(yī)療等方面增強(qiáng),幫助大眾輕松、普惠的獲取世界知識(shí)和專業(yè)服務(wù)。
籌建百川智能不到兩個(gè)月,已有多位技術(shù)合伙人和領(lǐng)軍人物的加入。到這個(gè)月底將會(huì)有近50人規(guī)模的精英團(tuán)隊(duì)。大模型的訓(xùn)練也已經(jīng)啟動(dòng),進(jìn)展順利。按照現(xiàn)在的進(jìn)度,爭取年內(nèi)發(fā)布國內(nèi)最好的大模型和顛覆性的產(chǎn)品。
我們是中國公司,但我們并不希望只是“中國的OpenAI”,而是能建立世界級的視野和技術(shù)品質(zhì),讓中國享有世界級的產(chǎn)品,產(chǎn)生有世界影響力的技術(shù)的突破,進(jìn)而服務(wù)海外。百川本意是眾多的河流匯集奔赴海洋,象征著眾多數(shù)據(jù)、行業(yè)知識(shí)匯聚成為一個(gè)強(qiáng)大的智能體系,生生不息。百川也象征著集百家智慧,更多人與我一道共赴山海。我們呼喚中國的領(lǐng)軍人物、行業(yè)產(chǎn)品經(jīng)理和遠(yuǎn)在美國的同仁的加入。
同志們,請通過如下郵箱聯(lián)系我們:
80@baichuan-inc.com
通用人工智能時(shí)代剛剛開啟,我們作為第一批跨入新時(shí)代的人類,帶著焦慮和好奇去擁抱它,思考和探索“我是誰?”我們還可以把自己的智慧注入它,做新時(shí)代的開創(chuàng)者,讓后代們有一個(gè)更美好的未來,繁榮和延續(xù)人類文明。
百川智能CEO 王小川
2023年4月10日
更多內(nèi)容,點(diǎn)擊下方關(guān)注:
未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!
公眾號轉(zhuǎn)載請先在「AI科技評論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號名片。
雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。