0
“在影視行業(yè),越專業(yè)的人越覺得 AI 就是個傻瓜相機!它只會產(chǎn)生一些讓人「致幻」的 demo,實際應用起來往往會讓人大失所望?!?/p>
“藝術(shù)創(chuàng)作不僅是結(jié)果,也是過程,而 AI 可能永遠學不會藝術(shù)創(chuàng)作的過程,AICG也永遠不會懂藝術(shù)。”
“AI 技術(shù)可能會實現(xiàn)創(chuàng)作平權(quán),讓非專業(yè)人士也能創(chuàng)作作品。但人人都可以寫字,卻不代表人人都能寫出好故事,AI 技術(shù)可以幫助創(chuàng)作,但創(chuàng)造性仍然需要人類發(fā)揮?!?/p>
... ...
以上均是來自 CNCC 2024 圓桌辯論上大佬們的觀點,在 AI 熱得發(fā)燙的今天,影視行業(yè)也逐漸融入了 AI 技術(shù),只不過對于藝術(shù)與科技的交融,很多人秉持不同觀點,也碰撞出了不同的火花。
此次大會邀請了中國電影美術(shù)學會理事董未名、北京靈動音科技有限公司 CTO苑盛成、清華大學計算機系博世AI教授、人工智能研究院副院長朱軍、中國人民大學高瓴人工智能學院長聘副教授宋睿華、英特爾數(shù)據(jù)中心與人工智能集團首席工程師何萬青、阿里巴巴通義實驗室應用視覺Human AIGC方向負責人張邦、快手科技副總裁、大模型團隊負責人張迪、愛奇藝副總裁兼智能制作部負責人朱梁等一眾AI和影視領(lǐng)域的大佬參與討論,激情辯論。
這次的“AI +影視創(chuàng)作”圓桌論壇,雷峰網(wǎng)(公眾號:雷峰網(wǎng))AI 科技評論在不改變原意的基礎(chǔ)上,對內(nèi)容進行了編輯整理。希望能夠給你帶來更多的啟發(fā)與思考。
主持人:很榮幸能夠與幾位老師一同探討“AI+影視創(chuàng)作”這一話題。我準備了大約三個與此相關(guān)的小議題。第一個議題,我們來聊一聊 AI 與影視的“優(yōu)勢與挑戰(zhàn)”。誰會使用一部傻瓜相機去拍攝電影呢?在這個行業(yè)技術(shù)與產(chǎn)業(yè)融合的過程當中,各位真實感受到了什么?首先請朱總談一談。
朱梁:談到AI與影視結(jié)合的“詩”與“坑”,以及預期與實踐之間的差距,這是一個長期存在的問題。我們都知道,電影的創(chuàng)作在影像和聲音上有著極高的要求。尤其是連續(xù)性這一點,大多數(shù)基于DIT架構(gòu)的模型都無法實現(xiàn)。
如果要求人物、裝扮、光線方向和鏡頭運動都完全一致,就像電影中的鏡頭運動一樣,這是難以做到的。因此,我們對兒童動畫片項目進行了一些測試。片方或希望合作的伙伴提供的樣片讓我們感覺非常好,但它們是否100%由AI生成呢?
如果AI真的有這樣的能力,對我們的制作幫助將是巨大的。對于視頻平臺來說,這是一個巨大的吸引力。但經(jīng)過深入研究和溝通,我們了解到人工參與的部分仍然很多,人工智能中的“人工"部分可能沒有達到我們的預期。要獲得高質(zhì)量的專業(yè)級成品,人工參與的比例需要降低。因此,雖然不能說這是一個100%的坑,但確實與我們對AI真正應用的預期還有一定差距,這是我們的實際感受。
主持人:宋老師的觀點呢?
宋睿華:對于專業(yè)人士來說,他們可能會對某些技術(shù)持保留態(tài)度,因為藝術(shù)不僅僅是最終的作品,還包括創(chuàng)作的過程。例如,藝術(shù)家構(gòu)思故事、修改故事、繪制故事板,或者導演需要通過團隊的努力,經(jīng)過一兩年的時間才能看到最終的畫面。這個過程本身就是非常重要的。
我一直在思考一個問題,那就是如何提高創(chuàng)作的新穎性。AI可能會陷入套路,對于創(chuàng)作者來說,可能無法滿足他們的需求。例如,雖然我不制作視頻,但當我閱讀別人寫的故事或文本時,我仍然覺得AI的想象力不如人類。對于高水平的創(chuàng)作者來說,他們有自己的要求,而AI目前還無法達到他們的水平,因此他們可能不會考慮使用AI。
但我不認為“傻瓜相機”不好,因為它們的銷售量和產(chǎn)值可能遠遠超過專業(yè)相機和專業(yè)設備。雖然專業(yè)人士可能難以接受,目前也可能無法幫助他們,但對于業(yè)余愛好者來說,市場可能是巨大的,而且“傻瓜相機”不愁賣不出去。
主持人:是的,我還想補充問一下朱軍老師,就剛才我說的這個過程當中,大家真實感受到的是技術(shù)端推著影視行業(yè)在往前走,還是影視端拽著技術(shù)行業(yè)?它是一個需求驅(qū)動的市場,還是一個供給逼出來的市場?
朱軍:我認為技術(shù)確實是推動力,特別是在視頻領(lǐng)域,今年我們都在討論為什么現(xiàn)在這個時間點要討論這個問題。這是因為技術(shù)正在快速發(fā)展。去年,當大家討論AI生成視頻時,還覺得這是非常遙遠的事,但今年情況一直在變化,最大的變化原因還是技術(shù)的變革。
但是這個“坑”我也需要再講一下,很多時候,所謂的“坑”其實是因為我們的預期與實際情況有差距。比如,無意中踩到坑會讓人感到驚訝,但如果我們知道坑的存在并繞過去,這是正常的。并不是所有的路都是平坦的,技術(shù)也是如此。我們的技術(shù)正在快速發(fā)展,對于今天討論的影視主題,可能大家對于AI的期待過高。
AI生成的內(nèi)容與專業(yè)質(zhì)量之間仍有差距,雖然大家都在努力縮小這個差距,但目前直接達到高端生成還不現(xiàn)實。更實際的是,AI可以幫助專業(yè)人士在生產(chǎn)流程中降低成本和提高效率,這可能很快就會成為現(xiàn)實。
例如,一些短片和大型院線電影的制作中,很多環(huán)節(jié)可以用AI來提高效率,正如朱總所說。如果我們對AI有過高的預期,可能會陷入“坑”中。但我對技術(shù)持樂觀態(tài)度,相信它會快速發(fā)展。即使不能直接替代,AI也可能在許多環(huán)節(jié)上更好地幫助我們。
主持人:朱總有什么要補充的嗎?
朱梁:我想補充一點,并不是說從愛奇藝的角度來看我們存在問題,實際上愛奇藝非常歡迎新技術(shù)。但對創(chuàng)作者來說,無論是愛奇藝的影片還是整個長視頻領(lǐng)域,都是以藝術(shù)家為中心,由導演主導創(chuàng)作,他們有自己的視聽表達方式和固定的表達習慣及范式。
這個范式需要被突破,我堅信隨著我們能力的不斷提升,尤其是在過去的一年里,我們見證了令人難以置信的進步。因此,未來的創(chuàng)作范式必將發(fā)生巨大變化,這是一個重大的議題。它關(guān)系到人才培養(yǎng)、產(chǎn)業(yè)未來發(fā)展方向、平臺與內(nèi)容創(chuàng)作者之間的關(guān)系,以及未來的劇組是否還需要以當前的形式存在。這些都是非常重要的問題。我相信未來一定會發(fā)生變化,唯一不變的就是變化本身。
何萬青:我從事的是傳統(tǒng)的CG領(lǐng)域,也就是數(shù)字內(nèi)容生成。這是影視行業(yè)過去和現(xiàn)在一直在使用的主流方式,涉及到大量的渲染軟件和渲染流水線工作。我非常同意剛才提到的一點,但是我想強調(diào)的是,VG 的模式實際上是基于語義空間轉(zhuǎn)換成視頻的。這種模式也會面臨一個問題,即一些技術(shù)在剛出現(xiàn)時非常新奇,但如果它們沒有進一步的突破,我們稱之為naive的模式。比如,很多人在朋友圈里使用它,但結(jié)果卻千篇一律。如果技術(shù)停留在這個階段,它就永遠無法進入主流產(chǎn)業(yè)。
到目前為止,我的判斷是,我們現(xiàn)有的工具還只是一些單獨的功能,還沒有達到這樣的程度:一部電影的百分之七八十完全是通過生成技術(shù)制作出來的。但最重要的一點是,我們需要理解什么是“無窮大”。我的意思是,在某個領(lǐng)域不斷投入,就能不斷產(chǎn)出更多的東西,而不是說在某一項技術(shù)上達到了極限。
苑盛成:我來補充一下,雖然我不是影視行業(yè)的專家,但我對音樂行業(yè)非常熟悉。我認為在創(chuàng)作過程中,不同領(lǐng)域可能存在共通之處。我們與許多音樂人、創(chuàng)作者以及我們產(chǎn)品的用戶進行了一對一的交流。我注意到,不同的人創(chuàng)作欲望和創(chuàng)作能力各異。在能力有限的情況下,他們會傾向于選擇適合自己能力的工具來滿足創(chuàng)作欲望。例如,我們遇到過一個用戶,他只會寫詞,之前寫的是詩歌。
有了 AI 后,他花了一個星期坐在電腦前,將詩歌輸入電腦,不斷生成新的內(nèi)容。一天能生成好幾百條,直到找到滿意的一條。一周后,他完成了所有詩歌的創(chuàng)作,并感到自己進行了創(chuàng)作。這背后代表的是,盡管他沒有相應的能力,但他有強烈的創(chuàng)作欲望,并希望得到結(jié)果。
我認為,這樣的創(chuàng)作雖然與專業(yè)影視或音樂人的創(chuàng)作過程和結(jié)果大相徑庭,但不能因此否認其價值。他的作品可能沒有版權(quán)價值,或者在QQ音樂、網(wǎng)易云音樂上鮮有人聽,但對他個人而言意義重大。他創(chuàng)作的作品承載的價值與他的人生經(jīng)歷緊密相關(guān)。我發(fā)現(xiàn)許多人都處于這種狀態(tài):有創(chuàng)作和表達的欲望,但缺乏相應的能力。雖然現(xiàn)在的AI模型尚未達到理想狀態(tài),但至少提供了一種可能的解決方案。過去,他們可能根本無法嘗試,但現(xiàn)在至少有了一條途徑,即使需要不斷嘗試,最終從300個選項中找到一個滿意的,也會認為是自己的創(chuàng)作。
因此,我也會關(guān)注教育相關(guān)的場景。在音樂領(lǐng)域,我們發(fā)現(xiàn)在小學、初中和高中,有些學生對音樂創(chuàng)作很感興趣,甚至想制作音樂劇或校園劇。他們可能沒有相應的能力或設備,但他們不會因為這些限制而放棄。他們會用最簡陋的工具,向老師請教,即使老師也不會,他們也會嘗試制作。
最終,他們可能會制作出一些作品,從而獲得滿足感,激發(fā)他們的興趣。這種滿足感可能會促使他們在未來的學習和生活中更加關(guān)注這一過程,最終可能進入這個行業(yè),逐漸培養(yǎng)成專業(yè)人士。這也是AI技術(shù)在創(chuàng)作領(lǐng)域的一種意義。
主持人:現(xiàn)在 AI 加影視到底是朝著讓小白就能夠上這個船,還是去真正改造嚴肅的影視工業(yè)的?譬如降本增效等等的這個訴求呢,可以一兩句話概括一下嗎?
苑盛成:我認為創(chuàng)作有多種形式,不同的工具滿足不同的需求,并不是單一的工具或產(chǎn)品形態(tài)能夠滿足所有需求。
朱軍:我想插一句,現(xiàn)在我們在討論什么是通用的基礎(chǔ)平臺。比如,當我們在做申訴時,我說我的愿景是什么,我認為愿景就像剛才苑總所說的,我們希望讓每個人都能釋放他們的創(chuàng)作夢想,讓每個人都能夠表達自己,而不僅僅是那些專業(yè)的人。
這也不應該是AI最終特別要追求的目標,但我們可以在通用工具上讓大家去表達,讓每個人都能嘗試。比如,幫助導演展示他的想法,可能這些想法最終不會直接使用,但可以作為參考。比如,他可能需要找真人或演員來拍攝,這樣的工具可能會大大提高效率。我認為短期內(nèi)可能會是這樣,但長期來看,我也不認為AI一定要完全取代真正的人的創(chuàng)作。
何萬青:實際上,我們觀察到中國影視特效行業(yè)的發(fā)展始于2000年代初。當時,在北京的許多地鐵站,你可以看到各種3D Max學習班的廣告。從那時起,全國各地建立了許多所謂的文創(chuàng)基地。但這里存在一個問題:雖然有很多基地,但在傳統(tǒng)的影視制作中,像3D Max這樣的軟件是生產(chǎn)資料,而今天我們AI技術(shù)還處于打基礎(chǔ)階段,還沒有產(chǎn)生作為生產(chǎn)資料的軟件或服務,這是必須要做的,才能真正推動影視行業(yè)的發(fā)展。
第二點,從2007年到疫情前,我們注意到一個現(xiàn)象:許多藝術(shù)院校在培養(yǎng)CG人才方面開始凋零。最初,大家都在學習模仿日韓的風格,但如何創(chuàng)作具有中國特色的作品?在技術(shù)上,這是一個非常緩慢的過程。我記得有一次我們組織了一個會議,一個班級的學生花了一整個學期的時間制作了19分鐘的動畫。
過去采用CG的方式,因為它涉及到大量的物理背景和理工知識,實際上它很大程度上依賴于軟件本身。我們不斷在這方面努力,但軟件領(lǐng)域,就像我們的工業(yè)仿真軟件一樣,大多是海外的,要自主研發(fā)非常困難。但今天,CG和VG技術(shù)開辟了新的道路,因為它是基于模型生成的。然而,這里有一個最大的問題尚未解決,那就是交互問題。過去CG的生成模式是有原理的,如果參數(shù)不合適,你可以調(diào)整的東西很少。
因此,我認為這兩種模型的方式,即基于科學計算或建模的方式,是準確、可調(diào)的。最大的優(yōu)勢在于,它可以解決藝術(shù)教育的問題。過去,大多數(shù)人覺得太難了,就止步不前。最終,是那些專門做特效的公司培訓了很多工程師,不斷地進行這方面的工作。
所以我認為我們面臨的是兩條路,但其中一條路要解決的問題是,我的答案在于要把交互性做好。而交互性在某種程度上是由可解釋性帶來的,即可觀測和可解釋。當我改變它,我知道我往這個方向改變,它應該產(chǎn)生那個效果;我往另一個方向改變,它應該產(chǎn)生另一個效果。但對于神經(jīng)網(wǎng)絡模型,你往往并不清楚很多東西都是啟發(fā)式的——你嘗試改變它,看看會是什么樣子。所以,如果不解決這個問題,我認為這就是我們這個行業(yè)面臨的挑戰(zhàn)和存在的必要性。我是覺得是這樣的一個事。
主持人:從技術(shù)發(fā)展的角度,去年可能大家還有不同的主,不同的路線,而年初 Sora 亮相,讓那個 Transformer 加這個 diffusion model DIT 的路線成為了主流,到今天其實才過去了八九個月內(nèi),這個技術(shù)路線大家統(tǒng)一了嗎?
朱軍:讓我先來談談我的觀察。目前,從實際效果來看,最好的效果肯定是使用擴散模型結(jié)合Transformer。在實戰(zhàn)中,當然包括擴大模型規(guī)模,也有一些其他的變種,包括最近大家提到的flow matching,但它們本質(zhì)上還是基于同樣原理的方法。同時,在學術(shù)界,大家也在不斷探索各種其他架構(gòu),包括Transformer的各種嘗試。但從最終效果來看,目前似乎還是比較傾向于使用DIT這種方法。
主持人:所以基本上現(xiàn)在是以這個以 Sora 路線為核心,我們更多的是快速對齊,對吧?
朱軍:對的,是這樣的。
主持人:那其實跟我們此刻隔壁世界正在發(fā)生的大語言模型是類似的邏輯,是吧?
宋睿華:我認為可能并不是像那個行業(yè)一樣,即使是大型語言模型的差距也在縮小,也會追趕上來。實際上,我感覺他們作為領(lǐng)頭羊的地位和影響力可能會掩蓋掉我們的一些光輝,比如中國人民大學做的悟道·文瀾模型,雖然獨立研發(fā),與CLIP模型同期獨立發(fā)布,但聲量沒有Open CLIP那么大,又比如朱老師他們在更早的時候發(fā)表的那篇文章,,是關(guān)于diffusion算法的,后來這個算法就被整合到了SD和Sora中。其實我們一直在為技術(shù)貢獻,但他們可能在商業(yè)上非常成功,整個形象就是作為領(lǐng)頭羊的形象,影響力特別大。有時候我們并不是做得比他們晚,而是我們的聲音沒有他們大。
主持人:所以剛才朱老師的觀點聽上去還是 Sora 路線是主流路線。那么宋老師,你的觀點是說,現(xiàn)在其實還是多條道路在同時探索的狀態(tài)?
宋睿華:我認為,有些技術(shù)確實有效,比如Transformer模型,大家都發(fā)現(xiàn)它非常好用。我們的同學后來意識到,最初大家的研究思路是想要改造這個架構(gòu),但后來發(fā)現(xiàn)花費了很多時間卻收效甚微,甚至越改越糟。最終,大家達成了一個共識:這個模型可能是一個很好的基礎(chǔ)單元,就像樂高積木一樣,找到了一些非常實用、多功能的積木塊,這些積木塊可以拼成各種各樣的東西。你可以選擇一直挑戰(zhàn),說我不要這些積木塊,我要自己創(chuàng)造形狀,無論是方形、圓形還是三角形;或者你可以選擇認可這些積木塊的確很強大,然后利用它們來構(gòu)建自己想要的作品。
主持人:那么這個賽道大家現(xiàn)在競爭的是什么?
宋睿華:我認為這更多是關(guān)于個人愿景的問題,沒有唯一的選擇,而是看大家誰能看得更遠。即使是同樣有遠見的人,他們也可能認為不同的方向是可行的。
主持人:這是可能偏學術(shù)的視角,對嗎?那董老師你也是這么認為的嗎?
董未名:我平時做研究,特別是在AI生成領(lǐng)域,我已經(jīng)做了十幾年。可能與大多數(shù)人不同,我更喜歡從藝術(shù)創(chuàng)作的角度來看待當前的生成技術(shù)。從技術(shù)角度來看,無論國內(nèi)外,核心技術(shù)最終都歸結(jié)為diffusion技術(shù)。在視頻領(lǐng)域,最核心的是Transformer加上diffusion,所有模型都沒有脫離這個框架。無論你在上層做多少改動,底層核心都是這些技術(shù)。
但是,當我從藝術(shù)創(chuàng)作的角度來觀察時,我發(fā)現(xiàn)現(xiàn)在許多大型模型,無論是國內(nèi)還是國外,其生成的結(jié)果存在嚴重的同質(zhì)化問題。有些風格大家都做得不錯,而有些風格則似乎誰都做不好,也沒有人敢于嘗試這些風格。例如,我可以肯定地說,有些風格是任何模型都做不好的,比如那些帶有特定圈圈的或者大筆觸、大色塊的油畫風格。我發(fā)現(xiàn)這些風格似乎大家都做不好,而且所有的論文中也不敢展示這樣的結(jié)果。
我在思考,這是否意味著底層的技術(shù)框架,最核心的技術(shù)路線,可能無法涵蓋所有的藝術(shù)風格和技法?如果技術(shù)繼續(xù)按照當前的路線發(fā)展,那么從藝術(shù)AI推動藝術(shù)創(chuàng)作的角度來看,這是否真的是一個正確的方向?從藝術(shù)的角度來看,我認為可能還是存在一些問題。
何萬青:我可能不太同意這個觀點,關(guān)于老師提到的藝術(shù)問題,我認為當我們討論AI在影視領(lǐng)域的AIGC時,有一個底線問題需要考慮。藝術(shù)和審美雖然是個人化的,但它們都有邊界條件和目的。就像人們畫鬼,其實是有一定樣板的,比如人的樣子加上角或其他特征。如果沒有這些樣板,就會變成現(xiàn)在手機上泛濫的那種應用,它們可以把你的照片處理成各種樣子。如果我們在這方面花費太多時間,可能會陷入一種簡單的快感中,這可能會導致我們在更重要的事情上落后更多。
我的意思是說我們作為這個整個 AIGC 出來之后,它其實就是提升了藝術(shù)創(chuàng)作者的無能基準線,過去你的基準線很低,但現(xiàn)在就不一樣了。
主持人:好,那我們直接進入到第三個話題。我在聽的時候有一個隱約的感覺,如果影視制作變得人人都能參與,那么這個行業(yè)還會保持現(xiàn)狀嗎?我們是否只是提高了影視產(chǎn)業(yè)的效率,還是會引發(fā)整個文明形態(tài)的轉(zhuǎn)變?就像視頻已經(jīng)改變了我們閱讀文章和書籍的習慣一樣。
當視頻也被人工智能普及化之后,我們與內(nèi)容的關(guān)系將會變成什么樣?這是一個開放性的問題。作為我們今天的最后一個議題,我們可以不局限于技術(shù)層面,而是想象一下,在未來一年、五年、十年,甚至更遠的未來,當談到人工智能和影視時,我們將看到一個怎樣的世界?
張邦:我暢想未來,AI與影視的結(jié)合將實現(xiàn)創(chuàng)作平權(quán)。這意味著創(chuàng)作不再局限于專業(yè)導演或編劇,普通人也能創(chuàng)作出感人肺腑、流傳千古的作品。每個人內(nèi)心都可能藏有一個值得分享、能夠觸動人心的故事,只是他們可能沒有接受過專業(yè)訓練,缺乏工具和團隊來展現(xiàn)他們精彩的經(jīng)歷和故事。
AI與影視的結(jié)合在未來可能會讓這種創(chuàng)作平權(quán)成為可能,讓每個人都能輕松地將他們的經(jīng)歷和內(nèi)心故事以出色的方式呈現(xiàn)出來。我認為這將是科技所能創(chuàng)造的美好未來,也是一個必然的趨勢。
主持人:到那個時候影視還會是一個大的工業(yè)嗎?還是說變成了非物質(zhì)文化遺產(chǎn)?
董未名:情況是這樣的,正如您剛才提到的,從藝術(shù)創(chuàng)作的角度來看,藝術(shù)創(chuàng)作的目的是什么?比如我寫書,我輸入一行文字,然后瞬間創(chuàng)作出一幅畫,這種創(chuàng)作的快感是AI無法給予的,AI永遠無法提供給人類的。
主持人:我覺得大部分短視頻創(chuàng)作者創(chuàng)作短視頻的時候沒有快感,看到被點贊才有快感。到時候大家都在創(chuàng)作,沒有人去點贊了,怎么辦呢?
苑盛成:我確實有一些想法,雖然我不太懂影視領(lǐng)域,但我認為音樂與它有很多相似之處。比如,你聽流行歌曲時,近幾年你有沒有關(guān)注這些歌是誰演唱的、誰編曲、誰作詞、誰作曲?這可能反映了一個現(xiàn)象:大多數(shù)用戶在聽音樂時,并不在乎創(chuàng)作者是誰。
但也有一部分人創(chuàng)作是為了表達自己,讓自己身邊的人能聽到,獲得自己創(chuàng)作的人生體驗。這部分可能與董老師剛才提到的創(chuàng)作中的表達欲有關(guān),即背后的部分我表達出來了,整個結(jié)果被我自己所接納,我真的認為是我主導創(chuàng)作了這個藝術(shù)作品,這個藝術(shù)作品代表了我的審美,代表了我的人生體驗。
何萬青:我補充一下,關(guān)于這種個性化和浪漫的想法。首先,我非常同意張邦老師的觀點。我認為第一個結(jié)論是,AI這種平權(quán)可以改變我們大多數(shù)人的生產(chǎn)方式和娛樂方式。其次,這將產(chǎn)生一種新的經(jīng)濟模式。但同樣重要的是,當每個人都能創(chuàng)作時,你需要購買別人的注意力,這就是現(xiàn)在的網(wǎng)紅經(jīng)濟和直播經(jīng)濟的來源。
第三點是最關(guān)鍵也是最棘手的,如果在這個情況下,我們?nèi)匀挥善脚_公司壟斷,就像現(xiàn)在要在抖音上獲得曝光需要花費很多錢一樣,也就是說,這么多創(chuàng)作者中只有一小部分能夠獲得巨大的流量,剩下的長尾創(chuàng)作者則很難獲得關(guān)注。這種模式仍然會限制創(chuàng)新。所以,這三個方面我都要強調(diào),AI平權(quán)肯定是好事,但它必須有相應的生產(chǎn)關(guān)系和整個生態(tài)系統(tǒng)的配合才能發(fā)揮好的效果。
張邦:我認為創(chuàng)作平權(quán)絕對是一件好事。此外,物質(zhì)生產(chǎn)可能會過剩,但文化和藝術(shù)的生產(chǎn)永遠不會過剩。當創(chuàng)作平權(quán)實現(xiàn)后,因為參與創(chuàng)作的人數(shù)增多,生產(chǎn)信息的基數(shù)變得更大,同時,你的信息生產(chǎn)量也會增加。這也意味著文化和藝術(shù)創(chuàng)作的質(zhì)量和數(shù)量都將得到提升。
苑盛成:我同意張總剛才所說的觀點,即文化和藝術(shù)創(chuàng)作不會過剩。我的看法與他相同。我認為藝術(shù)創(chuàng)作是人類對自己精神層面的探索,它是主觀的,每個人都是獨一無二的,因此它不會過剩。
董未名:我的觀點可以用一句話概括:藝術(shù)的作用不在于復制可見之物,而在于將不可見的東西變得可見。有了AI這個工具之后,它能夠幫助我們把每個人心中的不可見之物——我們對這個世界的憧憬和想象——轉(zhuǎn)化為可見的現(xiàn)實。
朱軍:我的第一句話是,AI技術(shù)正在快速發(fā)展,但我們不能以完美來衡量它。所有技術(shù)都有不足之處。第二句話是,AI的最終目的是幫助人們實現(xiàn)夢想。就像我們所做的所有工作一樣,我們希望幫助人們將自己的夢想變成可見的、可傳播的、可觀賞的成果。
宋睿華:我想總結(jié)的剛好用到這個論壇的名字, AI +影視≠創(chuàng)作,就人人都可以寫字,但是不代表人人都能寫出好的故事。
何萬青:我想說的是,盡管AI在創(chuàng)作領(lǐng)域還處于起步階段,但對于我們今天在線上和線下的受眾來說,有一件事需要記?。喝藗兺粫湎切┤菀椎玫降臇|西。所以,藝術(shù)也是這樣,即使有了工具,你仍然需要發(fā)揮你的創(chuàng)造性。
張邦:我這里想表達的是,今天我們討論的Sora,即視頻生成大模型或視覺大模型,實際上與語言大模型屬于同一代技術(shù),包括OpenAI的chatGPT等技術(shù)。Sora和類似的技術(shù)從0到1的亮相是非常驚艷的,意味著從無到有的轉(zhuǎn)變,這個亮相是迅速且極其引人注目的。但從1到100的過程可能并不那么容易。因此,我們希望學界和產(chǎn)業(yè)界都能有耐心,慢慢見證這些技術(shù)對社會和全人類的改變。
朱梁:萬事萬物,變化是唯一不變的真理。對于未來一年、五年、十年的發(fā)展趨勢,我特別想說幾句。未來一年,我特別期待在專業(yè)長視頻領(lǐng)域能有實質(zhì)性的進步,因為這個領(lǐng)域可以被視為影視行業(yè)的藍寶石或金字塔的塔尖。一旦這個方向取得突破,解決了剛才各位專家討論的問題,那么影視與AI結(jié)合的基點就真正到來了。
這個時刻將會真正地、極大地改善或改變我們所說的創(chuàng)作平權(quán),影視行業(yè)的整體結(jié)構(gòu),以及創(chuàng)作方式和范式,發(fā)生根本性的改變。我覺得那個時候就真的到來了。所以我特別期待我們不僅僅是仰望星空,還要腳踏實地地把每一個項目做好,把每一個技術(shù)的進步點做好。
從影視行業(yè)的角度來看,它只看重結(jié)果,而不是大家所說的投入了多少算力、進行了多少訓練、投入了多少錢。這個行業(yè)其實很殘酷,有很多有才華的人,正如大家所說,他們有表達的欲望,創(chuàng)作出感動自己的作品,但觀眾不買賬,行業(yè)也不會買賬。所以,我們還是要這樣和大家共勉。
主持人:朱總作為最后一位發(fā)言的嘉賓,實際上占據(jù)了一個很好的位置,為我們今天的討論定下了基調(diào)。那么,我們今天的論壇就到此結(jié)束,感謝幾位嘉賓帶來的精彩觀點和真誠分享,也感謝大家的參與。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。