0
本文作者: 董子博 | 2024-04-19 15:40 |
AI 生成視頻的賽道,要變天了。
2月,OpenAI 的視頻生成模型 Sora 橫空出世,讓不少國內(nèi)視頻賽道和 AI 賽道的廠商都沒能過個(gè)好年。外界看來,海外的技術(shù)已然如此成熟,而國內(nèi)卻似乎沒人能夠與其一競高下。
而事實(shí)上,中國廠商在音視頻生成上的技術(shù)積累一直沒有停止過。
4月18日,2024中國生成式AI大會在京舉辦,AIGC軟件A股上市公司萬興科技(300624.SZ)受邀參會,并重磅宣布旗下音視頻多媒體大模型萬興“天幕”將于4月28日正式公測,以通過廣泛的用戶參與和反饋,進(jìn)一步優(yōu)化“天幕”性能和體驗(yàn),同時(shí)探索多媒體大模型技術(shù)在不同領(lǐng)域的應(yīng)用潛力。
當(dāng)前,萬興“天幕”大模型已通過中央網(wǎng)信辦備案,能力方面已涵蓋文生視頻、視頻生視頻、文生音樂、視頻配樂、文生音效、文生圖、圖生圖等原子能力,相關(guān)能力已在萬興科技旗下產(chǎn)品規(guī)模化商用。其中文生視頻能力上,已實(shí)現(xiàn)不同風(fēng)格、豐富場景及主題的連貫性,且一鍵生成時(shí)長支持60秒+。
萬興天幕大模型4月28日公測
作為國內(nèi)首個(gè)音視頻多媒體大模型,萬興“天幕”聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景,基于15億用戶行為及百億本土化高質(zhì)量音視頻數(shù)據(jù)沉淀,以音視頻生成式AI技術(shù)為基礎(chǔ),打造基于大模型架構(gòu)的AIGC應(yīng)用基礎(chǔ)底座,全鏈路賦能全球創(chuàng)作者,推進(jìn)大模型進(jìn)入2.0時(shí)代。
未來,萬興“天幕”近百項(xiàng)音視頻原子能力將全面集成到公司矩陣產(chǎn)品中落地應(yīng)用。公測期間,公司將重點(diǎn)開啟視頻創(chuàng)意、音頻創(chuàng)意、圖像創(chuàng)意等領(lǐng)域多個(gè)場景下的應(yīng)用測試,如文生視頻、視頻生視頻、文生音樂、文生音效等。其中,視頻生視頻功能支持一鍵視頻風(fēng)格轉(zhuǎn)換,讓畫面更出彩;文生音樂、文生音效進(jìn)一步升級對文本的深度理解,以及基于內(nèi)容理解生成對應(yīng)風(fēng)格音頻的多維整合能力,支持輸入文本生成擬真聲音及倍速音效。
萬興“天幕”文生視頻《男孩的探險(xiǎn)之行》畫面截圖
大會上,萬興科技副總裁朱偉同阿里、騰訊、英偉達(dá)等企業(yè)嘉賓,以及北大、清華等學(xué)術(shù)嘉賓在內(nèi)的超50位重量級產(chǎn)學(xué)研投界代表同臺論道,并帶來《音視頻多媒體大模型市場洞察與落地實(shí)踐》主題演講。
過去的2023年,大模型作為基礎(chǔ)設(shè)施賦能千行百業(yè),呈現(xiàn)井噴式增長,給行業(yè)帶來了超乎尋常的改變。據(jù)不完全統(tǒng)計(jì),2023年國內(nèi)公開發(fā)布的大模型產(chǎn)品已達(dá)238+個(gè),大模型產(chǎn)業(yè)競爭真正進(jìn)入“百模大戰(zhàn)”階段。其中,絕大多數(shù)產(chǎn)品均以自然語言對話為主要功能,提供聊天對話、創(chuàng)意寫作、代碼生成等服務(wù)。
朱偉指出,當(dāng)前大模型在文本和圖像領(lǐng)域已實(shí)現(xiàn)生產(chǎn)力商用,但在音視頻領(lǐng)域的應(yīng)用還存在數(shù)據(jù)集缺失、視頻內(nèi)容結(jié)構(gòu)及層級復(fù)雜、算力成本高等挑戰(zhàn),其成熟應(yīng)用尚需周期。根據(jù)硅谷知名風(fēng)投公司a16z調(diào)研結(jié)果顯示,在2023年以前,市面上尚不存在公開的視頻模型,但2023一年內(nèi)誕生的模型就達(dá)數(shù)十個(gè),全球用戶數(shù)量超過百萬級。目前,市場上已投入使用并取得一定進(jìn)展的AI視頻模型數(shù)量達(dá)到21個(gè)。
朱偉同時(shí)表示,當(dāng)前AI視頻模型尚不成熟,但伴隨行業(yè)發(fā)展,大模型正在從1.0圖文時(shí)代加速進(jìn)入以音視頻多媒體為載體的2.0時(shí)代,2024年將迎來AI視頻年,AI視頻大有可為。目前萬興科技深耕創(chuàng)意軟件20余年,在音視頻數(shù)據(jù)、跨模態(tài)和多媒體技術(shù)上有豐富積淀,并對全球多媒體創(chuàng)作者有更為深刻的理解,現(xiàn)在的萬興“天幕”也許不盡完美,但正因?yàn)椴煌昝?,才更對未來無限憧憬,并愿為之不懈努力,相信公司會朝著新生代AIGC數(shù)字創(chuàng)意賦能者道路闊步前行。展望未來,萬興“天幕”將堅(jiān)持內(nèi)部應(yīng)用、外部開放并行,向外部企業(yè)逐步開放API接口,期待更多行業(yè)伙伴加入,共筑音視頻多媒體大模型開放生態(tài),攜手共赴AI大時(shí)代。
萬興科技副總裁朱偉作《音視頻多媒體大模型市場洞察與落地實(shí)踐》主題演講
隨著數(shù)字化轉(zhuǎn)型的加速和AI技術(shù)的廣泛應(yīng)用,多媒體內(nèi)容創(chuàng)作市場在快速增長。公開資料顯示,目前,全世界有3.05億視頻創(chuàng)作者,43億視頻覆蓋群體,每天200億次以上的視頻播放量,視頻需求非常大。另據(jù)QYResearch最新研究顯示,預(yù)計(jì)2029年全球?qū)I(yè)音視頻系統(tǒng)市場規(guī)模將達(dá)到3632.7億美元,未來幾年年復(fù)合增長率CAGR為5.0%。
推出萬興“天幕”的萬興科技是中國數(shù)字創(chuàng)意軟件領(lǐng)域產(chǎn)品覆蓋面廣、營收體量大、全球化程度高的A股上市公司,也是國內(nèi)AIGC行業(yè)龍頭企業(yè),業(yè)務(wù)覆蓋200多個(gè)國家和地區(qū),全球累計(jì)用戶超15億,月活近1億,被視為“中國版Adobe”。
成立20年來,萬興科技一直緊跟技術(shù)浪潮,與時(shí)俱進(jìn)洞察市場需求,針對性賦能不同階段的內(nèi)容創(chuàng)作。面向全新展開的AIGC時(shí)代,萬興科技錨定數(shù)字創(chuàng)意創(chuàng)作場景,已推出萬興愛畫、萬興播爆、Wondershare Kwicut、Wondershare VirtuLook等AIGC創(chuàng)意新品;旗下萬興喵影、Wondershare PDFelement、萬興PDF、億圖圖示、億圖腦圖、墨刀等產(chǎn)品均已集成AIGC能力,并持續(xù)優(yōu)化上新,用AI讓世界更有創(chuàng)意。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。