丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能開(kāi)發(fā)者 正文
發(fā)私信給王悅
發(fā)送

0

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

本文作者: 王悅 2023-08-31 19:29
導(dǎo)語(yǔ):“ AIGC 技術(shù)的爆點(diǎn)遠(yuǎn)未達(dá)到”

編者按:2023年8月14日-15日,第七屆GAIR全球人工智能與機(jī)器人大會(huì)在新加坡烏節(jié)大酒店成功舉辦。

論壇由GAIR研究院、雷峰網(wǎng)、世界科技出版社、科特勒咨詢集團(tuán)聯(lián)合主辦。大會(huì)共開(kāi)設(shè)10個(gè)主題論壇,聚焦大模型時(shí)代下的AIGC、Infra、生命科學(xué)、教育,SaaS、web3、跨境電商等領(lǐng)域的變革創(chuàng)新。這是國(guó)內(nèi)首個(gè)出海的AI頂級(jí)論壇,也是中國(guó)人工智能影響力的一次跨境溢出。

在「AIGC 和生成式內(nèi)容」分論壇上,joinrealm.ai 創(chuàng)始人蔡叢興以《 AI Generation Challenges 》為主題分享了AIGC 的歷史與發(fā)展、機(jī)遇和挑戰(zhàn)。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

蔡叢興在演講開(kāi)始即指出,當(dāng)下生成式 AI 產(chǎn)品落地的基礎(chǔ)難度在不斷上升,同時(shí)對(duì)于生成式技術(shù)的邊界認(rèn)知也在逐漸提高。

蔡叢興認(rèn)為,內(nèi)容生成里有三個(gè)相互 dependent 的因素,一個(gè)是 foundational model,第二個(gè)是基于 foundation model 創(chuàng)建出來(lái)的 fine tune,第三個(gè)是文字上的 prompt 的engineering。因此,這一相互依賴的系統(tǒng)在很大程度上依賴于一個(gè)社區(qū),即在 fine tune 和 foundational model space 內(nèi)找到新的、最適合的 prompt language,也就是特殊的使用語(yǔ)言。

由于 AIGC 技術(shù)還沒(méi)像 ChatGPT 一樣達(dá)到一個(gè)爆點(diǎn),所以蔡叢興判斷,當(dāng)下的創(chuàng)業(yè)者需要回歸到對(duì)三個(gè)問(wèn)題的思考:其一為是否能夠清晰地為目標(biāo)用戶畫(huà)像;其二為是否能夠找到最適合用戶的 unique 的workflow;其三為是否能夠 tap into existing distribution 以實(shí)現(xiàn)增長(zhǎng)。

以下為蔡叢興的現(xiàn)場(chǎng)演講內(nèi)容,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))在不改變?cè)獾那疤嵯逻M(jìn)行了編輯和整理:

很榮幸今天可以在這里和大家一起交流討論關(guān)于這AIGC 創(chuàng)業(yè)的一些收獲,我來(lái)這里的主要目之一也是想認(rèn)識(shí)更多的 AIGC 創(chuàng)業(yè)者,然后大家可以更深入地討論這個(gè)問(wèn)題。在接下來(lái)二十幾分鐘的時(shí)間,我就做一些拋磚引玉,講一講我們的收獲。

在過(guò)去的幾年里,生成式 AI 發(fā)展很快,尤其是過(guò)去的一年,其中最主要的原因可能是生成式內(nèi)容的用戶接受度很高,所以導(dǎo)致市場(chǎng)的發(fā)展都很迅猛。隨著更多的投入,我們對(duì)于生成式技術(shù)的認(rèn)知也發(fā)生了很大的變化。

今天去討論這個(gè)問(wèn)題的時(shí)候,最主要的一個(gè)感受是我們?cè)谶@個(gè)過(guò)程中對(duì)于產(chǎn)品落地的基礎(chǔ)難度的認(rèn)識(shí)是在不斷的增加的,但同時(shí)對(duì)于生成式技術(shù)可能產(chǎn)生的邊界也在不斷的成長(zhǎng)。所以今天將會(huì)聚焦在我們所意識(shí)到的真實(shí)挑戰(zhàn)上的一些問(wèn)題,然后從這里開(kāi)始展開(kāi)。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

做一個(gè)簡(jiǎn)單的介紹,Realm 主要是做基于 AIGC 的社交網(wǎng)絡(luò),待會(huì)我會(huì)介紹更多我們的工作。

目前團(tuán)隊(duì)主要是在美國(guó)加州。就我個(gè)人的經(jīng)歷而言,十幾年前開(kāi)始做語(yǔ)言模型,從研究到工程,再由工程到產(chǎn)品,再由產(chǎn)品到商業(yè)。我早期的研究工作主要是在語(yǔ)言模型,在摘要和 ranking 能力的應(yīng)用。加入 Google 之后,我接觸到的第一個(gè)項(xiàng)目實(shí)際上是的 YouTube 早期的視頻廣告,當(dāng)時(shí)就發(fā)現(xiàn)這樣的一款短視頻廣告能夠產(chǎn)生非常大的效果,就是它很快就成為了 YouTube 的 revenue dominate source。

當(dāng)時(shí)我就有一個(gè)很簡(jiǎn)單的假設(shè),如果所有的內(nèi)容都是由短視頻代替的話,會(huì)產(chǎn)生什么樣的效果?所以2011年左右我就找了很多好朋友去討論,說(shuō)有沒(méi)有一種可能性,短視頻會(huì)取代用戶的內(nèi)容。當(dāng)時(shí)有一個(gè)很大的限制,就是在內(nèi)容的制作工具上達(dá)不到這種實(shí)名制的效果。

當(dāng)時(shí)有一位同學(xué)分享了國(guó)內(nèi)的快手這樣一款 APP,然后那款 APP 當(dāng)時(shí)還是以 gif 的制作為主,就是它生成的內(nèi)容已經(jīng)有了一定的故事性,但是還遠(yuǎn)遠(yuǎn)達(dá)不到短視頻的效果和視頻廣告的效果。但過(guò)了兩年多之后,隨著蘋(píng)果推出了前置相機(jī),包括高清視頻的錄制這些功能都出現(xiàn),短視頻的這趨勢(shì)也就一發(fā)不可阻擋。我在 15 年左右的時(shí)候加入了 Snapchat ,是海外最有潛力的短視頻的公司,在過(guò)去幾年的時(shí)間里一直都是 Snapchat 所有的短視頻的產(chǎn)品開(kāi)發(fā)。2021 年左右,由于 TikTok 的成功,我發(fā)覺(jué)到表達(dá)式的生成式視頻一定會(huì)有新突破。

所以我和我的同伴一起出來(lái)成立這家創(chuàng)業(yè)公司,專(zhuān)注在做生成式視頻,這是我和我的cofounder的聯(lián)系方式,大家可以加我們的 Linkedin,歡迎之后有更多的討論。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

接下來(lái),我們來(lái)講AIGC。我覺(jué)得 AIGC 是一個(gè)特別寬泛的概念,它實(shí)際上非常抽象。從技術(shù)的角度來(lái)看,在過(guò)去的幾年里,大家已經(jīng)達(dá)到了認(rèn)知的共識(shí),它指代的是由大語(yǔ)言模型引發(fā)的、由文字生成內(nèi)容的一種生產(chǎn)手段。那我們?nèi)ソ庾x它的時(shí)候,我覺(jué)得有必要來(lái)講一講 mental model,因?yàn)樗鼤?huì)決定我們從哪個(gè)角度去看。

從細(xì)到遠(yuǎn),mental model 大概有三種不同的layer。最新的layer就是直接把它做一個(gè) ATI service,比如微軟、谷歌上線的一些產(chǎn)品會(huì)直接拿 AIGC 作為一個(gè)service,去加強(qiáng)現(xiàn)有的產(chǎn)品。更遠(yuǎn)一點(diǎn)的話,從整個(gè)軟件開(kāi)發(fā)模式上來(lái)看,已經(jīng)從過(guò)去 50 年中微軟的這一套以 API 為主的軟件開(kāi)發(fā)模式過(guò)渡到自然語(yǔ)言為界面的軟件開(kāi)發(fā)模式,這可能會(huì)是一個(gè)軟件開(kāi)發(fā)形式的變化,更多的是一些哲學(xué)上、包括產(chǎn)品管理上的一些討論。

在中間地帶,就是我們創(chuàng)業(yè)公司對(duì)于新的商業(yè)模式的一個(gè)探索。這一探索主要有三個(gè)方向,第一是摘要,摘要最主要的應(yīng)用是搜索,包括 QA 都是摘要里面最主要的模式。第二是推理,推理主要集中偏智能助手應(yīng)用之類(lèi)的應(yīng)用模式;第三是在創(chuàng)作,我們主要專(zhuān)注于內(nèi)容創(chuàng)作這一商業(yè)模式。

為什么內(nèi)容創(chuàng)作模式很重要?根據(jù)我過(guò)去十年對(duì)短視頻的觀察,很大的一個(gè)變革是因?yàn)橹悄芟鄼C(jī)的出現(xiàn),智能相機(jī)的普及不僅僅是給了每個(gè)人一個(gè)手機(jī),而是給了幾十億個(gè)行走在世界各地的錄制設(shè)備。

如果用智能相機(jī)促成成功的創(chuàng)業(yè)公司也有很多,比如TikTok、Instagram、Snapchat,很多很新的 to consumer 產(chǎn)品都是由于智能相機(jī)的普及才產(chǎn)生的。

我們一開(kāi)始出來(lái)創(chuàng)業(yè)的時(shí)候,對(duì)表達(dá)式視頻的腦海中的 mental model是,如果智能相機(jī)給了幾十億人一個(gè)行走的記錄設(shè)備,去記錄這個(gè)真實(shí)的世界,那么有沒(méi)有一種相機(jī)是可以記錄人的腦海中的假象。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

我這有一個(gè)博客,起初 AIGC 還沒(méi)有那么成功,我們當(dāng)時(shí)做了大概 10 款不同的產(chǎn)品,每一款產(chǎn)品用了不一樣的技術(shù),最后進(jìn)行了聚焦。它的本質(zhì)上從用戶體驗(yàn)的角度來(lái)講其實(shí)就是用 word 到story。這是我們最新的 APP 上的效果,你可以說(shuō) a girl、一個(gè)很恐怖的臥室、然后這個(gè) girl 在恐怖的臥室里面睡覺(jué)、這個(gè) girl 在這個(gè)恐怖的臥室里面睡覺(jué)的同時(shí)旁邊站著兩個(gè)ghost,但是到第四個(gè)的時(shí)候就已經(jīng)不work,因?yàn)?ghost 的空間關(guān)系,包括它們之間的空間距離感是 lost 的。

這樣一個(gè)簡(jiǎn)單的example,可以告訴大家兩個(gè)點(diǎn):第一點(diǎn)是我們還沒(méi)有辦法很好地做到第三步,但是這個(gè)速度發(fā)展很快,因?yàn)槿齻€(gè)月前我們卡在了第二步,所以現(xiàn)在到了第三步,也有很多人覺(jué)得第四步也OK,但如果你讓上百萬(wàn)的用戶去用那就不 OK 了。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

剛才分享了我們是怎樣去探索這個(gè)新的商業(yè)模式的,以什么樣的 mental model 去探索商業(yè)模式。最終我們選擇從 text image 開(kāi)始出發(fā),選擇它最主要的原因是我們覺(jué)得它是 storytelling 最核心的部分,是最后的 foundation。那這張圖是我上周五在那個(gè)倫敦旁邊的那個(gè)巴斯的修道院拍的。當(dāng)時(shí)有個(gè)新一代的畫(huà)家,會(huì)用自己新的畫(huà)具體重新解釋一個(gè)故事,非常 impressive,但是它本質(zhì)上是說(shuō)畫(huà)作為人類(lèi)歷史里面的一個(gè)重要的 story telling的這樣的一個(gè)工具,它實(shí)際上是抓住了這個(gè)故事本身最重要的部分。

另外一個(gè)原因是生成式內(nèi)容可以很容易地和其他的文字組合去支持其他內(nèi)容形態(tài),比方說(shuō) me 、coffee都很容易。

第三點(diǎn)是由于技術(shù)本身也非常容易去 scale 到,對(duì)于音樂(lè)生成、語(yǔ)音的生成也都非常的簡(jiǎn)單。

如果我們最終的目的是生成視頻的話,視頻的維度非常多。從我們自身的角度來(lái)講,內(nèi)容本身的故事性是視頻成功最關(guān)鍵的因素。所以說(shuō)我們選擇從 text image 作為我們最核心的這種 focus 的點(diǎn)當(dāng)中,我們也做和 ChatGPT 的整合,之后如果有機(jī)會(huì)也可以一起討論。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

那么它什么地方還不行?第一個(gè)最不行的地方在于它還不能是 word to story,它實(shí)際上是 prompt to story。prompt 是一個(gè)非常 confuse 的一個(gè)概念,它實(shí)際上是一個(gè)就是這樣一個(gè)過(guò)程,可以通過(guò)語(yǔ)言不斷地用文字去描述這個(gè)你腦海中的這個(gè)細(xì)節(jié),可以通過(guò)加定語(yǔ)去描述 context、加一個(gè)形容詞去描述framing、加入 subject、 可以加各種各樣的style, vocabulary 越 rich 就越好。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

這個(gè)時(shí)候你可以去畫(huà)想象中的這個(gè)女神是什么樣子,但如果只有一個(gè)beautiful,那肯定是不行的。你要知道美的 20 種說(shuō)法,要知道關(guān)于形態(tài)、眼神的無(wú)數(shù)個(gè)單詞,還有很多單詞可能字典里都找不到,這是最主要的難點(diǎn)。

其實(shí) prompt是一種程序語(yǔ)言,它比程序語(yǔ)言更難的地方在于它沒(méi)有 structure ,所以需要很多的 try and error 才能夠真正達(dá)到想要的效果。另外一點(diǎn)是需要對(duì)于某種方向有非常密實(shí)的詞匯量的掌控,詞匯量越豐富,細(xì)節(jié)就會(huì)越多。也包括在 account 里面有更多的markup,有更多的 advance target,可以做非常精確的控制。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

這里也可以通過(guò)簡(jiǎn)單的文字去進(jìn)行兩個(gè) concept 的mix,比方說(shuō)你喜歡兩個(gè)這個(gè)角色,你可以輕松用這兩個(gè)詞去把它拼成一個(gè)詞,比如劉德華和周潤(rùn)發(fā),可以拼成一個(gè)人。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

還有很多數(shù)據(jù)上的操作,是 Pixel 上的一些精確的控制,比方說(shuō)我們隨便做一個(gè)簡(jiǎn)單的一個(gè)端口,上傳一個(gè)圖片,把人臉給畫(huà)下來(lái),然后換一個(gè)詞mix。除了這個(gè) Pixel 上的控制,還能有 sematic 上的控制,可以控制它的形狀、結(jié)構(gòu)、位置,包括后續(xù)的這些post,這些工作都是朝 Prompt 的角度進(jìn)行深入。那我們今天在這個(gè)角度上就不再繼續(xù)深入地聊聊,但希望大家能 take back 到的最重要的點(diǎn)就是 Prompt 還不是自然語(yǔ)言,它是非常難掌握的一種編程語(yǔ)言。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

第二個(gè)點(diǎn)是 foundation model。目前所有的新聞 、research 主要的關(guān)注點(diǎn)實(shí)都在 foundation model上。關(guān)于foundational model我想分享幾個(gè)觀念:

觀念一是圖像生成的早期 foundation model 的效果不是很好,沒(méi)有什么可供參考的針對(duì)用戶的數(shù)據(jù),我們內(nèi)部對(duì)數(shù)據(jù)的一個(gè)判斷就是對(duì)于一個(gè)新用戶來(lái)說(shuō),他愿意分享的用于生成的照片比例是大概是低于20%。

觀念二是 foundation 的 model 進(jìn)步得非???,在過(guò)去六個(gè)月的時(shí)間里面, SDXL 的效果大概能提高 4 到 5 倍。所以我們內(nèi)部的數(shù)據(jù)還沒(méi)有完全出來(lái),因?yàn)樗械恼线€沒(méi)有完全完成,我們會(huì)繼續(xù)觀察大概效果是多少。

觀念三是,研究過(guò) SDXL 相關(guān)結(jié)果生成的一些 example ,我個(gè)人感覺(jué),open source 的模型已經(jīng)遠(yuǎn)遠(yuǎn)超過(guò) OpenAI 的這些 close source ,也已經(jīng)超過(guò)了最新版的 Mid-Journey 。昨天很多人講,做大模型需要很多資源,三駕馬車(chē)之類(lèi)的,但其實(shí)大模型還是很多機(jī)會(huì)的。如果在座的各位是創(chuàng)業(yè)者沒(méi)有大量的機(jī)器,圖像生成是一個(gè)很好的選項(xiàng),只需要一臺(tái)電腦就可以。

第三個(gè)點(diǎn)是我們有一個(gè)非常大的一個(gè) community contribution,主要是基于 Dreambooth 的 technology 做了很多對(duì)房地產(chǎn)模型的優(yōu)化,還有特定場(chǎng)景,包括二次元、人物畫(huà)像等,我們對(duì)這些模型做了內(nèi)部的evaluation,在特定應(yīng)用場(chǎng)景上的效果是非常好的。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

敘述想象世界的過(guò)程中,除了需要有生成的工具和好的 prompt,第三個(gè)就是需要有 concept。就是我不僅僅需要一個(gè)girl在一個(gè)恐怖的房間里,我需要一個(gè) specific girl,我們?cè)O(shè)計(jì)出來(lái)的那個(gè)人在我想要的房間里面做一件 specific 的事情,獲得一個(gè) specific 的效果。那么,這需要大量的用戶利用各種已有的 framework 去創(chuàng)建各種各樣的 fine tune 機(jī)制。這個(gè)機(jī)制有很多的 know how、knowledge,我們對(duì)這個(gè)機(jī)制的一些體會(huì),也會(huì)隨著實(shí)踐過(guò)程不斷變化。

但我們可以看到一些非常好的應(yīng)用,比如對(duì)人物的設(shè)計(jì),可以設(shè)計(jì)出想象中的人物,然后也可以去設(shè)計(jì)想象中的場(chǎng)景和風(fēng)格,甚至可以控制拍攝的視角,而且控制的方法都很簡(jiǎn)單,那就是創(chuàng)建出屬于你的獨(dú)特的單詞,用詞去控制故事的講述。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

講到這里,我們解釋清楚了內(nèi)容生成里三個(gè)相互 dependence 的因素,一個(gè)是 foundational model,第二個(gè)是基于 foundation model 創(chuàng)建出來(lái)的各種 fine tune,然后是基于 fine tune 的文字上的 prompt 的engineering。這三個(gè)因素之間是相互 dependent 的,也就是當(dāng)你的 foundational model change 的時(shí)候, fine tune 實(shí)際上是會(huì)對(duì)特定的 foundation model 產(chǎn)生特定的效果,然后特定的這一套  foundation  model 實(shí)際上會(huì)對(duì) prompt effect 產(chǎn)生效果。

所以這在很大程度上依賴于社區(qū),在 fine tune 和 foundational model space 內(nèi)找到新的、最適合它 prompt language,也就是特殊的使用語(yǔ)言,這就是他的 depending 思路。

接下來(lái)還有幾點(diǎn)分享,由于這樣的 trade off 和你可以 navigate 一個(gè)空間,所以如果你心目中有一個(gè)特定的application,比如拍寫(xiě)真照或拍一個(gè)二次元的東西,那么就總是可以通過(guò)某種 trade off 達(dá)到想要的效果,但同時(shí)很 complicit 就是 cost,即你會(huì)用多少的代價(jià)去實(shí)現(xiàn)這件事情。如果希望做出一款非常general的,那么就需要很多的 engineering 的 carefully decision。

同時(shí),如果想做大規(guī)模的 to consumer 場(chǎng)景, GPU 的 cost 是一個(gè)很重要的問(wèn)題。我們團(tuán)隊(duì)的解決方案是對(duì)所有的實(shí)踐的 influence 做了一套 CPU 的 solution,然后也建立了他們的 quality,可以 compare, cost 會(huì)更低,而且效果上也可以重復(fù)。但是我們也見(jiàn)過(guò)其他人有別的想法和嘗試,就像通過(guò)手機(jī)上的應(yīng)用,用 GPU 去做這些事情。不過(guò)我們主要的 focus 在 CPU 的解決方案,而且已經(jīng)得到了驗(yàn)證。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

講完 challenge 之后,最后回歸到“真正的機(jī)會(huì)在哪”這個(gè)問(wèn)題上?在過(guò)去 6 個(gè)月的時(shí)間里,大概見(jiàn)了上百位美國(guó)最 popular 的 AI creator,大家可以在 YouTube 上去看 AI show。我最近特別喜歡它,是用 AI 做的 movie trailer,把各種各樣的角色混到一起,非常有意思。我們對(duì)于這個(gè)技術(shù)或看到這個(gè)結(jié)構(gòu),會(huì)覺(jué)得這怎么可能?這怎么做到?所以這給我最大的沖擊就是creativity,大家是非常有想象力的;其次就是他們每個(gè)人都是一套獨(dú)立的制作方法,沒(méi)有相似的途徑;第三就是他們每個(gè)人都會(huì)使用大量的工具。

而他們唯一的共同點(diǎn)就是 try and error,通過(guò)這個(gè)過(guò)程不斷地去調(diào)試、去調(diào)節(jié),找到一條屬于自己創(chuàng)新的工具,這也是我們對(duì)這件事情最重要的總結(jié)。所以,最后想要達(dá)成這種生產(chǎn)效果,很大程度上依賴于對(duì) workflow 的探索和對(duì) workflow 的實(shí)驗(yàn)。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

我們?cè)賮?lái)講講 Market Opportunities 。因?yàn)榧夹g(shù)可能還沒(méi)有達(dá)到像 GPT 那樣的一個(gè) break point,成為一個(gè)通用技術(shù),每個(gè)人都覺(jué)得OK, i can get it,它實(shí)際上還沒(méi)有達(dá)到這個(gè)moment。所以走到今天,創(chuàng)業(yè)需要回歸到三個(gè)問(wèn)題,第一點(diǎn)是你能不能夠清晰地畫(huà)像目標(biāo)用戶;第二個(gè)點(diǎn)是你能不能夠去找到最適合用戶的 unique 的workflow;第三點(diǎn)是能夠 tap into existing distribution 去實(shí)現(xiàn)一個(gè)增長(zhǎng)。這也是我這次來(lái)一個(gè)主要目的,我相信這里有很多的創(chuàng)業(yè)者都是以此作為努力的方向,我們有很多可以交流的地方。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

其實(shí),可以把 Realm 理解成一個(gè) Instagram for a personal imagination。我們?cè)谧鋈虑椋旱谝患率?,把所有最新?prompt 的 technology 集成一個(gè)非常易用的手機(jī)端的 interface ,使用它時(shí)就像用一款相機(jī)一樣去描述自己的想象。第二件事是,讓每個(gè)人都可以在使用、創(chuàng)建自己的 fine tune, share 自己的 fine tune;第三件事是,給大家一個(gè) creator community,因?yàn)?prompt 需要很多的 education 和integration,因此可以從別人那里獲得靈感和idea。

對(duì)于在做的各位來(lái)講,如果你還沒(méi)有接觸 AIGC 或者內(nèi)容生成,其實(shí) Realm 是一個(gè)特別適合 get start 的地方。其一是因?yàn)樗鼮槠胀ㄓ脩粼O(shè)計(jì),很多非常深的技術(shù)名詞、技術(shù)細(xì)節(jié)都可以像學(xué)自拍管理一樣去把這些東西領(lǐng)會(huì)到。其二是因?yàn)樗鼙阋耍驗(yàn)橛玫氖荂PU,可以用可控的方式去來(lái) lower 它的 generation cost,大概在 mission 上要比很多 generation 便宜很多,如果是普通用戶的話,基本上可以不花錢(qián)。其三是因?yàn)榭梢越佑|到最新的technology,所有的 model 都可以隨時(shí)更新,也會(huì)有一個(gè) community 去 learn from each other。

關(guān)于 startup 我們還可以有機(jī)會(huì)一起討論,做 workflow 最難的點(diǎn)是發(fā)現(xiàn) tradeoff,另外一個(gè)是有一個(gè) community 去幫助探索 prompt attention。

除此之外還可以考慮能不能提供一些 besides APP 的access,讓大家去 leverage 我們做的一些工作。最后一個(gè)是research,15 年前我開(kāi)始做research,其實(shí)它最重要的一點(diǎn)是能夠快速地實(shí)驗(yàn),快速地分享demo, share 我的 demo 或者是 user 的demo,然后能夠快速 get feedback,也就是從數(shù)據(jù)上知道你的模型怎樣和現(xiàn)有的東西去審核,效果是什么樣的。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

這是我大概 brainstorm 了一下,希望可以和在座的各位有一些交流和合作,以上就是我今天的主要內(nèi)容,謝謝各位。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

蔡叢興:從語(yǔ)詞到「故事」,AIGC 要做思想的「相機(jī)」丨GAIR 2023

分享:
相關(guān)文章
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)