0
“你們是從什么時(shí)候開始注意到人類的?”
“當(dāng)?shù)谝粋€(gè)原始人開始仰望星空的時(shí)候?!?/p>
AI 的類人猿,早已開始仰望人類。
01 來自機(jī)器的審視
在過去短短的兩年間,算法從業(yè)者王超岳有過兩次被 AI 震撼住的時(shí)刻。
一次是去年 3 月 OpenAI 祭出人工智能繪畫產(chǎn)品 DALL·E 時(shí)。只需要在計(jì)算機(jī)上輸入一句話,DALL·E 就能夠理解這句話、然后自動(dòng)生成一幅意思相應(yīng)的圖像,且該圖像是全網(wǎng)首發(fā)、獨(dú)一無二。
所有跨越“族群”的交流都是一次文明的突變,來自未明機(jī)器系統(tǒng)的回應(yīng)也讓人類感到猶遇 UFO 的震驚與好奇。在人與人的距離越來越遠(yuǎn)的現(xiàn)代社會(huì),機(jī)器卻好像能夠讀懂一個(gè)人的內(nèi)心。
“你能明顯感覺到它相比 GAN(2014 年出現(xiàn)的一個(gè) AI 生成網(wǎng)絡(luò))的進(jìn)步。DALL·E 的技術(shù)是革命性的?!蓖醭栏嬖V雷峰網(wǎng)。雷峰網(wǎng)
第二次是今年 4 月谷歌發(fā)布 5400 億參數(shù)大模型 PaLM 的時(shí)候。隨著參數(shù)的變大,PaLM 的文本理解能力與邏輯推理能力大幅提升,甚至可以用文本解釋笑話,告訴讀者為什么這個(gè)笑話好笑。雷峰網(wǎng)
在這之前,人們嘲諷 AI 最常用的一句話就是:這個(gè) AI 模型的推理能力很弱,像 3 歲小朋友。但大模型發(fā)展至今,已經(jīng)能做算術(shù)、能做邏輯推理,心智已經(jīng)接近甚至在某些角度超過人類?!氨确秸f,”王超岳舉例:“有很多笑話我一時(shí)不能理解,但它能給我解釋,說明在一些語言理解任務(wù)上、它比我還懂。”
王超岳是生成式 AI 的資深研究者,從 2014 年 GAN 發(fā)布后就開始關(guān)注 AIGC 相關(guān)研究,當(dāng)時(shí) GAN 就是深度生成網(wǎng)絡(luò)的研究熱點(diǎn),但熱度也遠(yuǎn)遠(yuǎn)不及 AIGC 這兩年的重大突破。上述提到的兩項(xiàng)技術(shù),也成為點(diǎn)燃今年下半年 AI 圈狂歡的“導(dǎo)火索”:雷峰網(wǎng)
DALL·E 背后的關(guān)鍵技術(shù) CLIP 讓文字與圖片兩個(gè)模態(tài)找到能夠?qū)υ挼慕唤琰c(diǎn),成為 DALL·E、DALL·E 2.0、Stable Diffusion 等突破性 AI 成果的基石;而像 PaLM 這樣的語言大模型,雖然燒錢,但其對(duì)人類語言的理解能力突飛猛進(jìn),是 AI 能讀懂人的前提。
“這兩年的 AI 技術(shù)突破真的非????!毙某娇萍迹ūI夢師團(tuán)隊(duì))創(chuàng)始人藍(lán)振忠也說道。他讀論文經(jīng)常讀到很興奮、很激動(dòng):“CLIP 出來一段時(shí)間后,MAE(何愷明團(tuán)隊(duì)提出的一種AI范式,可以將在語言任務(wù)上表現(xiàn)優(yōu)秀的能力遷移到視覺任務(wù)的處理上)又跟著出來,然后又有 Stable Diffusion……”
今年 8 月 Stable Diffusion 推出以來,藍(lán)振忠與團(tuán)隊(duì)很快就跟上、只用了不到一個(gè)月的時(shí)間就上線 AI 作畫產(chǎn)品“盜夢師”,并迅速在國內(nèi)火起來,出圖速度短至 1 秒,而且繪畫質(zhì)量非常高,日留存率接近50%(高于 90% 的小程序),不到兩個(gè)月就接到了 To B 的大訂單。
“盜夢師”生成的圖像作品
在盜夢師上線的第二天(9 月 1 日),國內(nèi)第一本《 AIGC 白皮書》在上海世界人工智能大會(huì)(WAIC)發(fā)布。王超岳參與了這本白皮書的撰寫,并主導(dǎo)了 AIGC 技術(shù)體系的梳理和展望。
AIGC 白皮書的發(fā)布引來大批參會(huì)同行的關(guān)注。不僅是人工智能領(lǐng)域的研究者,還有元宇宙領(lǐng)域的從業(yè)者:
“當(dāng)時(shí)紅杉資本那篇關(guān)于生成式 AI 的文章還沒有出來,大家都還不知道 AIGC 是什么。這說明數(shù)字內(nèi)容生成的重要性是行業(yè)共識(shí)?!?/p>
再緊接著,一切都很快:技術(shù)的突破帶來應(yīng)用的繁榮,Midjourney 在海外火起,文生圖的熱潮又讓人們看到更多原先冷門的 AIGC 分支,如文本生成、視頻生成、音樂生成,業(yè)內(nèi)人士才驚覺,原來海外像 Jasper.ai 這樣的公司已經(jīng)在商業(yè)化落地上有成功的驗(yàn)證。繼上一代以識(shí)別與檢測為主的感知智能之后,用于生成與編輯的“創(chuàng)造智能”成為資本的新寵。
更意外的是,這一波 AIGC 的熱潮還引起了廣大圈外人士的關(guān)注,如自媒體 KOL、插畫師群體與圖文創(chuàng)作者。人們有恐慌,檄文不斷;也有歡喜,希望擁抱前沿的技術(shù)。但無論人們接受與否,一個(gè)不可逆轉(zhuǎn)的趨勢已經(jīng)在發(fā)生。
02 AIGC 的大航海時(shí)代已開啟
1519 年,一支探險(xiǎn)船隊(duì)從西班牙駛出,由西而去,人類文明的大航海時(shí)代開啟。
后來,全球化歷史學(xué)家記載文明,總要提到一個(gè)叫麥哲倫的探險(xiǎn)家,以及他最初航海的好奇心:地球是方的,還是圓的?——麥哲倫是地圓說的倡導(dǎo)者;如果地球是方的,就證明航海無法成功;而如果地球是圓的,那么他最終會(huì)回到原點(diǎn)。
1950 年,另一位叫艾倫·圖靈的科學(xué)探險(xiǎn)家也有相似的好奇:機(jī)器能否根據(jù)人的行為作出有意識(shí)的反應(yīng)?——他提出了一個(gè)著名的檢測方法,叫“圖靈測試”,開啟了人工智能的研究時(shí)代。
如今,AI 領(lǐng)域的研究者,在 AIGC 的技術(shù)探索中似乎也獲得了相似的探索欲望與熱情。他們想知道:機(jī)器是否能讀懂人的思想與邏輯,從 0 到 1 進(jìn)行創(chuàng)造?
答案是:經(jīng)過近十年的技術(shù)發(fā)展,他們認(rèn)為可以,并且相信當(dāng)前的 AIGC 探索已經(jīng)到了工程化的階段。
猶如麥哲倫航海,目的已經(jīng)明確,航海的地圖(理論與框架)也已初具雛形,接下來是要驗(yàn)證技術(shù)路線是否可以到達(dá)目的地。
以文生圖為例。雖然 AI 根據(jù)文本描述畫畫的能力還不夠完美,例如基于不同的文本提示(prompt)會(huì)輸出質(zhì)量不一的圖像,對(duì)長文本的理解能力不足、會(huì)漏讀關(guān)鍵詞匯導(dǎo)致生成的圖像不完成等等,但這些都是一個(gè)個(gè)具體的研究問題,被解決只是時(shí)間問題。
為什么說 AIGC 的地圖已勾勒完成?這主要?dú)w功于三方面:大模型、多模態(tài)與可控制。
2020 年,OpenAI 推出 1750 億參數(shù)的預(yù)訓(xùn)練語言大模型 GPT-3,在國內(nèi)外掀起千億參數(shù)大模型的研究浪潮。那時(shí)開始,AI 的語言表達(dá)和理解能力開始突飛猛進(jìn)。也是從那時(shí)起,AI 開始能在很短的時(shí)間內(nèi)寫出不錯(cuò)的文章。
實(shí)際上,那時(shí)候海外就出現(xiàn)了一波專做文字生成的商業(yè)公司,如 Jasper.ai 與 Copy.ai。這些公司開發(fā)了機(jī)器自動(dòng)寫作平臺(tái),用戶輸入關(guān)鍵字、AI 只需幾分鐘就能寫成一篇邏輯與表達(dá)不輸人類的長文,用于替代寫作過程中的大量勞動(dòng),并能兌換出商業(yè)價(jià)值。
但由于 OpenAI 不對(duì)大陸和香港開放 GPT-3 接口,所以國內(nèi)的 AI 研究人員很難用起來,文字生成的相關(guān)應(yīng)用也沒能在國內(nèi)火起。這兩年,雖然國內(nèi)也有許多大廠與高校下場研究中文大模型,但在開源上仍進(jìn)展緩慢,導(dǎo)致大量的 AI 開發(fā)者止步于高昂的訓(xùn)練成本,限制了基于中文語言的 AI 應(yīng)用開發(fā)。
在這一波 AIGC 中,AI 大模型在理解人類語言的能力上發(fā)揮了關(guān)鍵作用。歸功于大模型的發(fā)展,不僅文本生成的效果不錯(cuò),基于文本的圖像生成也較 GAN 時(shí)代有了極大的進(jìn)步。
王超岳就告訴雷峰網(wǎng),在撰寫《 AIGC 白皮書》時(shí),其實(shí)他們內(nèi)部有過糾結(jié):標(biāo)題是要寫成“AIGC”(AI-Generated Content),還是寫成“生成式AI”(Generative AI)?最后,王超岳把票投給了AIGC,因?yàn)?generative model(生成模型)是一個(gè)專有的學(xué)術(shù)名詞,一般是描述模型對(duì)一個(gè)具體的分布進(jìn)行擬合,比如 GAN。但 DALL·E 2.0 所做的在某種程度上已經(jīng)超出了對(duì)某一種數(shù)據(jù)分布的擬合,展現(xiàn)出了通用的圖像生成能力。
舉個(gè)例子,GAN 最知名的應(yīng)用是人臉生成:模型去看海量的人臉照片,知道人臉是一種分布,然后學(xué)習(xí)到人臉的特征。在 2014 年還沒有能夠生成高維數(shù)據(jù)圖像的方法時(shí),GAN 是一種很強(qiáng)的生成方法,但局限性也是本質(zhì)的:
首先,它需要一個(gè)特定的數(shù)據(jù)集(比如人臉),泛化能力差。比如,GAN 發(fā)布后被用于訓(xùn)練各種各樣的人臉特效,但一個(gè) GAN 無法訓(xùn)練出多種人臉特效,換另一種特效就要新訓(xùn)練一個(gè) GAN;其次,GAN 在通過文本描述控制圖像生成上做的并不盡如人意,這很大程度限制了它成為一個(gè)可控的通用式結(jié)構(gòu)。
而 OpenAI 發(fā)布的 DALL·E(和之后 DALL·E 2)是使用了通用模型:能夠同時(shí)處理多項(xiàng)語言任務(wù)的語言大模型,加打通文字與圖像兩種模態(tài)的 CLIP 模型,控制圖像生成的擴(kuò)散模型,能夠在保證真實(shí)性的基礎(chǔ)上進(jìn)一步產(chǎn)生概念與元素的組合,生成更加復(fù)雜的場景。
一個(gè)例子是 AI 能夠根據(jù)文字的描述對(duì)圖像進(jìn)行編輯,在添加或移動(dòng)圖片元素時(shí)將陰影、投影與物理表面紋理等因素都考慮進(jìn)去。比如,人類制定要下圖 3 的位置生成火烈鳥,AI 就真的在室外的玻璃邊生成兩只火烈鳥、并且有影子投映下來:
當(dāng)指定在上圖 2 的位置(游泳池中間)生成火烈鳥時(shí),AI 會(huì)自動(dòng)生成一個(gè)適應(yīng)泳池環(huán)境的形象——火烈鳥游泳圈:
文字與圖像的多模態(tài)研究大體可以分為三個(gè)階段:1、圖文描述(讓計(jì)算機(jī)描述畫中的事情);2、圖文問答(給一張圖片,問這個(gè)圖片里的桌子上都有什么東西。機(jī)器人需要理解問題,再了解圖片里都是些什么東西);3、用一句話生成圖片(讓機(jī)器人通過一句話的描述作畫)。
多模態(tài)的一個(gè)重要貢獻(xiàn)在于數(shù)據(jù)源:它很好地提供了文本與圖像成對(duì)的訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)也是幫助 AIGC 模型學(xué)習(xí)到認(rèn)知的重要素材。
此前階段一、二的代表應(yīng)用分別有短視頻平臺(tái)上的 AI 生成電影解說、智能對(duì)話機(jī)器人,而到第三階段,機(jī)器系統(tǒng)則必須理解人類語言與常識(shí)、物理世界運(yùn)行法則等,否則無法進(jìn)行由人控制的跨模態(tài)創(chuàng)作。但 DALL·E、Midjourney 與盜夢師等產(chǎn)品都已經(jīng)體現(xiàn)出理解人類與世界的突破。
大量的研究實(shí)驗(yàn)都表明,當(dāng)模型足夠大,訓(xùn)練的數(shù)據(jù)足夠多,AI 能夠逐步理解人類語言的抽象概念(如常識(shí)與規(guī)則)。王超岳在讀博時(shí)師從陶大程,他們團(tuán)隊(duì)就從深度學(xué)習(xí)理論出發(fā),不止一次通過模型的容量分析證明,大模型在學(xué)習(xí)通用知識(shí)和理解泛化上有更好的表現(xiàn)。這是之前的生成模型沒有體現(xiàn)出來的能力。
這也決定了AIGC 不光是生成,而是建立在認(rèn)知與理解上的模型的應(yīng)用生態(tài)。當(dāng) AI 具備基礎(chǔ)認(rèn)知與理解,機(jī)器像人一樣思考與創(chuàng)作,就不再是海市蜃樓的傳說,而是一個(gè)正在發(fā)生的現(xiàn)實(shí)。
03 商業(yè)化:在沉默中爆發(fā)
現(xiàn)代社會(huì)的活動(dòng)構(gòu)成,本質(zhì)是一串串的數(shù)字內(nèi)容:語音、文本、圖像、視頻…而 AIGC 可以為創(chuàng)造這些內(nèi)容提供了一個(gè)個(gè)基礎(chǔ)元素。
實(shí)際上,AIGC(人工智能生成內(nèi)容)一直存在,但直到今年才被國內(nèi)的資本熱捧,一是技術(shù)的成熟,二是原先專注于視覺 AI 商業(yè)化的資本扭頭才發(fā)現(xiàn),類似 Jasper.ai 這樣的海外 NLP 公司開始大幅盈利了。
由于創(chuàng)造數(shù)字內(nèi)容的優(yōu)勢,AIGC 技術(shù)在備受矚目后也被過去一年追隨元宇宙的狂熱者們列為打造未來元宇宙的工具。但噱頭背后,更多 AIGC 的從業(yè)者相信,AIGC 能比元宇宙更快打造出下一代數(shù)字世界,一個(gè)完全屬于 AIGC 的新賽道。
這背后的原因,是 AIGC 與當(dāng)前元宇宙所倚技術(shù)的本質(zhì)差異:以圖形學(xué)(打造數(shù)字人的關(guān)鍵技術(shù))為例,圖形學(xué)在內(nèi)容生成上側(cè)重仿真、復(fù)刻,而 AIGC 側(cè)重原創(chuàng)、創(chuàng)造。從圖形學(xué)出發(fā)打造數(shù)字人是需要有一個(gè)真人作參考的,但 AIGC 在語音、文字與圖像的生成上是從 0 到 1、前所未有。
以電影《無雙》為例。AIGC 是張靜初,圖形學(xué)則是郭富城。
由于 AIGC 在寫作與畫畫上,每個(gè)字、每個(gè)像素都是精心計(jì)算出來的,所以用戶基于 AIGC 模型創(chuàng)作的圖像與文章全都是世上獨(dú)一無二的,絕對(duì)的原創(chuàng)選手。
數(shù)字內(nèi)容的本質(zhì)+獨(dú)一無二的原創(chuàng)特性,決定了 AIGC 的賽道容量足夠大,前者暗示它可以被打造成像互聯(lián)網(wǎng)內(nèi)容平臺(tái)或產(chǎn)品這樣的標(biāo)準(zhǔn)品,后者意味著它能獲得與人類創(chuàng)作者相媲美的市場認(rèn)可度。
以文本生成為例。類似 Jasper.ai 這樣的 NLP 公司在海外孵化了一種新職業(yè),叫“ AI 靈魂寫手”:
人類用戶在 AI 文字生成平臺(tái)上輸入標(biāo)題與關(guān)鍵字,AI 就會(huì)生成一篇很長的文章,然后人們再在寫好的文章上進(jìn)行修改,將修改后的文章賣給需要大量高質(zhì)量的文章來做搜索引擎優(yōu)化的公司,賺取作品出售與訂閱 AI 產(chǎn)品的會(huì)員費(fèi)之間的差價(jià)。
圖像生成的盈利模式也如此:比如在海外,用戶訂閱了 Midjourney 的會(huì)員,用 AI 生成精美的圖像后再將圖片賣給類似 iStock 這樣的圖庫,從中賺取差價(jià)。
由于谷歌搜索向原創(chuàng)文傾斜,而 AI 寫的文章又是全網(wǎng)絕無僅有的原創(chuàng)文章、非信息拼湊,所以谷歌會(huì)給這類文章更多流量,提高搜索排名。
這也使 Jasper.ai 等公司能夠迅速獲得市場份額。據(jù) Jasper.ai 宣稱,截至今年 9 月,他們?nèi)ツ甑氖杖氤^了 4000 萬美金,今年預(yù)計(jì)會(huì)翻一倍,目前付費(fèi)用戶也達(dá)到了 7 萬,估值 15 億美元。而距離 Jasper ai 成立,才不過 18 個(gè)月。
藍(lán)振忠告訴雷峰網(wǎng),現(xiàn)在 AI 寫出來的文章是具備很高的可讀性的。他們曾開了一個(gè)微信公眾號(hào)、用中文大模型寫星座運(yùn)勢,也收獲了一定的閱讀量,甚至有讀者在后臺(tái)評(píng)論說:“小編你一定是摩羯座的,這么懂我。” 除了盜夢師之后,他們的一款文字生成工具“HeyFriday”雖然推出時(shí)間沒多久,但在海外也已經(jīng)有幾千個(gè)付費(fèi)用戶。
高速的增長也出現(xiàn)在圖像生成領(lǐng)域。數(shù)據(jù)顯示,海外 AI 作畫產(chǎn)品 Midjourney 推出不過三個(gè)月,注冊用戶已經(jīng)超過 300 萬。而據(jù)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))獨(dú)家了解,盜夢師推出不到兩個(gè)月,生成的圖像數(shù)量已經(jīng)達(dá)到 1 千萬張。
多位行業(yè)人士談道:“說白了,互聯(lián)網(wǎng)的核心是流量,流量的核心是內(nèi)容。而 AIGC 的本質(zhì),就是一項(xiàng)生產(chǎn)內(nèi)容的技術(shù)?!?/p>
這也意味著,相比上一代要與終端硬件相結(jié)合的視覺 AI,或世界觀龐大的元宇宙,AIGC 的商業(yè)化落地更具體,投入成本更低、盈利更快。甚至一個(gè)更激進(jìn)的觀點(diǎn)是:AIGC 能夠跑出背靠流量的、與現(xiàn)有互聯(lián)網(wǎng)內(nèi)容平臺(tái)(如小紅書、抖音)的體量相媲美甚至超越的“內(nèi)容生成平臺(tái)”。
“盜夢師”根據(jù)用戶描述生成的圖像作品
在內(nèi)容需求旺盛的當(dāng)下,AIGC 所帶來的內(nèi)容生產(chǎn)方式變革也開始引起了內(nèi)容消費(fèi)模式的變化。尊重原創(chuàng)的市場,開始敬畏 AIGC。
最新作出反應(yīng)的是圖庫類企業(yè):
10月底,海外知名圖庫 Shutterstock 就公布了他們與 OpenAI 建立了合作,讓用戶可以輸入文字即時(shí)生成滿足需求的原創(chuàng)圖片。(實(shí)際上,許多行業(yè)人士也認(rèn)為,在 AIGC 的浪潮中,素材庫與P圖軟件是最先被淘汰或替代掉的行業(yè)。)
這項(xiàng)合作不僅是一個(gè)傳統(tǒng)行業(yè)的及時(shí)反映,實(shí)際上還意味著AIGC 商業(yè)化變現(xiàn)的一個(gè)想象似乎開始落地:打造一個(gè)基于生成的全新內(nèi)容平臺(tái)。
許多人并不知道這意味著什么,但在一些人的眼中,AIGC 的影響力已經(jīng)開始從服務(wù)個(gè)人用戶到服務(wù)實(shí)際行業(yè)——當(dāng)前的內(nèi)容平臺(tái)主要是基于關(guān)鍵詞搜索、推薦,而引入 AIGC 后,用戶所消費(fèi)的內(nèi)容就來源于 AI 對(duì)用戶的理解?;谕扑]的內(nèi)容是來源于有限的素材庫,而基于生成的內(nèi)容是源源不斷的……
AIGC 的當(dāng)局者們,雖然他們是這個(gè)賽道的締造者,但在見證 AIGC 的一次次魔力中,他們還是被機(jī)器堪比人類、甚至超越人類的創(chuàng)造速度與創(chuàng)造能力給嚇到。
ZMO.AI 的創(chuàng)始人張?jiān)姮撜f:“例如現(xiàn)在的短視頻平臺(tái)。推薦是將創(chuàng)作者創(chuàng)造出來的有限內(nèi)容推薦給你,但生成是每一個(gè)消費(fèi)內(nèi)容的人都是創(chuàng)作者。消費(fèi)者對(duì)內(nèi)容的反饋可以讓 AI 更了解你要什么,你喜歡什么、AI 就生成什么,這將是實(shí)時(shí)更新并且無限的?!?/p>
ZMO.AI 是國內(nèi)最早成立的 AIGC 公司之一。與 Stable Diffusion 等擅長藝術(shù)像生成的產(chǎn)品不同,ZMO.AI 選擇的賽道是真實(shí)世界的圖像生成,如設(shè)計(jì)。他們最開始專注于出海,在海外推出的 imgcreator.ai 達(dá)到了 32 萬月活的高速增長。
他們認(rèn)為,AIGC 不僅是數(shù)字娛樂內(nèi)容的生產(chǎn)工具,對(duì)許多實(shí)際行業(yè)也有非常大的幫助影響。這個(gè)賽道足夠大,研究者與創(chuàng)業(yè)者能夠做的事情也足夠多。(Stability.AI 的創(chuàng)始人 Emad Mostaque 也說過類似的話,認(rèn)為 AIGC 的賽道比新能源還大。)
單就圖像而言,當(dāng)前的素材主要靠拍攝,既低效又昂貴。比如電商平臺(tái)的服裝上新,目前的模式是線下拍攝,需要化妝師、服裝師、攝影師、模特等等,而在未來的 AIGC 世界中,他們希望用 AI 直接生成能展示服裝的模特圖像?,F(xiàn)在,他們的 AIGC 產(chǎn)品“ YUAN 初”小程序已經(jīng)在圖像編輯上取得驚人的效果。
ZMO.AI 的圖像生成器所生成的圖片
相比藝術(shù)類的風(fēng)格生成來說,真實(shí)的、攝影風(fēng)格的圖像生成難度更高,但對(duì)實(shí)際的生產(chǎn)與生活有巨大影響。比如設(shè)計(jì)行業(yè),小到海報(bào)、PPT、網(wǎng)頁,大到所有商品的外包裝、插畫等對(duì)原創(chuàng)素材要求高的應(yīng)用,都有 AIGC 的用武之地。
先不談取代,目前就有大量的設(shè)計(jì)師會(huì)使用 AIGC 產(chǎn)品來簡化設(shè)計(jì)前草稿階段的工作。張?jiān)姮撝v了一個(gè)建筑設(shè)計(jì)的例子:他們與一個(gè)建筑師合作設(shè)計(jì)了一座層高大約 25 米的交響音樂廳——
在沒有 AIGC 之前,建筑設(shè)計(jì)師是先用鉛筆畫草圖,畫完之后覺得好看再弄成彩鉛,彩鉛版本滿意后再做一個(gè) 3D 的視覺效果圖給甲方客戶看,甲方滿意再設(shè)計(jì)建筑里面的工程結(jié)構(gòu)等等。而有了 AIGC 之后,他們從第一步就極大地節(jié)省了時(shí)間,快速將設(shè)計(jì)師腦海中的方案用 AI 生成出來,發(fā)給甲方看。
“在 AI 寫幾句話、P 個(gè)圖時(shí),你可能覺得沒什么。但如果有一天,AI 開始設(shè)計(jì)建筑,你就要重新思考它的價(jià)值了?!?/p>
04 一切只是時(shí)間問題
劉慈欣在小說《朝聞道》里借用外星人“排險(xiǎn)者”之口道出了技術(shù)發(fā)展的真理:
“人類獲得宇宙終極奧秘的起點(diǎn),始于第一只猿猴對(duì)星空的仰望?!?/p>
如同人對(duì)宇宙的探索,AI 也在不斷探索人類。如今的 AI 類人猿(AIGC)已看到廣闊的星空。當(dāng)下越來越多研究者參與到 AIGC 的探索中,AIGC 距離更高層級(jí)的思維創(chuàng)作也越來越近。征服,似乎只是時(shí)間問題。
過去的十年,是 AI 騰飛的十年。十年的風(fēng)起云涌中,有趣的技術(shù)點(diǎn)層出不窮,有的成為一個(gè)新的賽道(如識(shí)別之于安防),有的則在商業(yè)化落地的過程中“胎死腹中”、曇花一現(xiàn)。
大浪淘沙中,人們對(duì)于AIGC既期待,也謹(jǐn)慎。
比如,關(guān)于 AIGC 能否在國內(nèi)的商業(yè)落地中有所收成,一部分投資者是擔(dān)憂的。
以文本生成為例,AIGC 的商業(yè)變現(xiàn)實(shí)際十分依賴用戶驅(qū)動(dòng)。但目前國內(nèi)的中文語言大模型在開源一塊缺少高質(zhì)量的語料數(shù)據(jù),導(dǎo)致中文版的 AI 在不同話題的寫作質(zhì)量上參差不齊;同時(shí),國內(nèi)的文字從業(yè)者在人力成本上普遍低于海外歐美發(fā)達(dá)國家,AIGC 在內(nèi)容生成一塊替代人力的節(jié)約成本也明顯低于海外市場。
落地的 AI 在涉及與人博弈的場景中,AI 所提供的服務(wù)成本必須在相較于人力成本上有明顯優(yōu)勢,才會(huì)被現(xiàn)有行業(yè)所接受——這幾乎是一個(gè)心照不宣的定律。工業(yè)質(zhì)檢就是一個(gè)很好的參考例子:傳統(tǒng)工廠在質(zhì)檢環(huán)節(jié)優(yōu)先考慮的就是成本,當(dāng)一個(gè)質(zhì)檢員工的月薪普遍是6-7k、而一個(gè)視覺 AI 解決方案在成本無法媲美、精度又無法實(shí)現(xiàn)高準(zhǔn)確率時(shí),就難以說服行業(yè)。
心辰科技向雷峰網(wǎng)坦言,他們的文本生成工具目前定價(jià)是 Jasper.AI 的十分之一,但國內(nèi)用戶的接受程度仍在爬坡期,這也需要中文大模型(GPT-3、PaLM 等均為英語大模型)的不斷進(jìn)步。
但更多的人相信,AIGC 會(huì)改變現(xiàn)代生產(chǎn)與生活的方方面面,因?yàn)?AIGC 所解決的問題是現(xiàn)存的、而非假設(shè)的。這些問題很具體,并且在大部分的場景中,它能部分取代或完全取代繁重的人力,不僅降本增效,而且降低內(nèi)容的創(chuàng)作門檻、激發(fā)人的創(chuàng)造力與想象力。
比如畫畫。過去需要接受十多年訓(xùn)練來獲取的技能,如今零基礎(chǔ)的人也以使用 AI 來創(chuàng)作,且作品的質(zhì)量不輸專業(yè)人員手繪而成的作品。這也讓人們進(jìn)一步看到創(chuàng)作的本質(zhì):思想與觀點(diǎn),從來是創(chuàng)作中的靈魂,而非方式與工具。
盡管近日來有許多公司在產(chǎn)品的宣傳與定位上掛了 AIGC 的頭銜,但據(jù)雷峰網(wǎng)了解,目前無論是文字生成還是圖像創(chuàng)作,AIGC 的技術(shù)壁壘還是存在的。
此外,算法與數(shù)據(jù)的選擇也決定了各個(gè)企業(yè)后續(xù)在不同場景中的表現(xiàn)高低。目前,在商業(yè)化中,選擇技術(shù)壁壘高、護(hù)城河足夠安全的落地場景,成為各個(gè) AIGC 從業(yè)者的當(dāng)務(wù)之急。
AIGC 的創(chuàng)業(yè)者們告訴雷峰網(wǎng),他們相信,未來 AI 的技術(shù)也許能改變權(quán)游的結(jié)局,未來很大可能會(huì)出現(xiàn)一個(gè)完全基于生成的內(nèi)容消費(fèi)平臺(tái),未來 AIGC 會(huì)在元宇宙、Web 3.0 中成為關(guān)鍵的技術(shù),但在奔赴未來之前,他們?nèi)砸缭揭蛔忠蛔角稹?/p>
但至少,他們已經(jīng)知道山丘的位置。
下一篇,我們將講 AIGC 創(chuàng)業(yè)在中國市場的艱難與機(jī)遇。如果你是一名 AIGC 的創(chuàng)業(yè)者、或你也在關(guān)注 AIGC,歡迎添加微信(Fiona190913)交流。
參考鏈接:
《人工智能生成內(nèi)容(AIGC)白皮書(2022年)》
https://multimodal.art/news/1-week-of-stable-diffusion
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。