國內(nèi)首個多媒體大模型萬興天幕4月28日公測文生視頻能力支持60秒+

本文作者：董子博

2024-04-19 15:40

導語：與 Sora 同賽道競爭的中國力量，又多了一員。

AI 生成視頻的賽道，要變天了。

2月，OpenAI 的視頻生成模型 Sora 橫空出世，讓不少國內(nèi)視頻賽道和 AI 賽道的廠商都沒能過個好年。外界看來，海外的技術已然如此成熟，而國內(nèi)卻似乎沒人能夠與其一競高下。

而事實上，中國廠商在音視頻生成上的技術積累一直沒有停止過。

4月18日，2024中國生成式AI大會在京舉辦，AIGC軟件A股上市公司萬興科技（300624.SZ）受邀參會，并重磅宣布旗下音視頻多媒體大模型萬興“天幕”將于4月28日正式公測，以通過廣泛的用戶參與和反饋，進一步優(yōu)化“天幕”性能和體驗，同時探索多媒體大模型技術在不同領域的應用潛力。

當前，萬興“天幕”大模型已通過中央網(wǎng)信辦備案，能力方面已涵蓋文生視頻、視頻生視頻、文生音樂、視頻配樂、文生音效、文生圖、圖生圖等原子能力，相關能力已在萬興科技旗下產(chǎn)品規(guī)?；逃?。其中文生視頻能力上，已實現(xiàn)不同風格、豐富場景及主題的連貫性，且一鍵生成時長支持60秒+。

國內(nèi)首個多媒體大模型萬興天幕4月28日公測文生視頻能力支持60秒+

萬興天幕大模型4月28日公測

作為國內(nèi)首個音視頻多媒體大模型，萬興“天幕”聚焦數(shù)字創(chuàng)意垂類創(chuàng)作場景，基于15億用戶行為及百億本土化高質(zhì)量音視頻數(shù)據(jù)沉淀，以音視頻生成式AI技術為基礎，打造基于大模型架構的AIGC應用基礎底座，全鏈路賦能全球創(chuàng)作者，推進大模型進入2.0時代。

未來，萬興“天幕”近百項音視頻原子能力將全面集成到公司矩陣產(chǎn)品中落地應用。公測期間，公司將重點開啟視頻創(chuàng)意、音頻創(chuàng)意、圖像創(chuàng)意等領域多個場景下的應用測試，如文生視頻、視頻生視頻、文生音樂、文生音效等。其中，視頻生視頻功能支持一鍵視頻風格轉(zhuǎn)換，讓畫面更出彩；文生音樂、文生音效進一步升級對文本的深度理解，以及基于內(nèi)容理解生成對應風格音頻的多維整合能力，支持輸入文本生成擬真聲音及倍速音效。

國內(nèi)首個多媒體大模型萬興天幕4月28日公測文生視頻能力支持60秒+

萬興“天幕”文生視頻《男孩的探險之行》畫面截圖

大會上，萬興科技副總裁朱偉同阿里、騰訊、英偉達等企業(yè)嘉賓，以及北大、清華等學術嘉賓在內(nèi)的超50位重量級產(chǎn)學研投界代表同臺論道，并帶來《音視頻多媒體大模型市場洞察與落地實踐》主題演講。

過去的2023年，大模型作為基礎設施賦能千行百業(yè)，呈現(xiàn)井噴式增長，給行業(yè)帶來了超乎尋常的改變。據(jù)不完全統(tǒng)計，2023年國內(nèi)公開發(fā)布的大模型產(chǎn)品已達238+個，大模型產(chǎn)業(yè)競爭真正進入“百模大戰(zhàn)”階段。其中，絕大多數(shù)產(chǎn)品均以自然語言對話為主要功能，提供聊天對話、創(chuàng)意寫作、代碼生成等服務。

朱偉指出，當前大模型在文本和圖像領域已實現(xiàn)生產(chǎn)力商用，但在音視頻領域的應用還存在數(shù)據(jù)集缺失、視頻內(nèi)容結構及層級復雜、算力成本高等挑戰(zhàn)，其成熟應用尚需周期。根據(jù)硅谷知名風投公司a16z調(diào)研結果顯示，在2023年以前，市面上尚不存在公開的視頻模型，但2023一年內(nèi)誕生的模型就達數(shù)十個，全球用戶數(shù)量超過百萬級。目前，市場上已投入使用并取得一定進展的AI視頻模型數(shù)量達到21個。

朱偉同時表示，當前AI視頻模型尚不成熟，但伴隨行業(yè)發(fā)展，大模型正在從1.0圖文時代加速進入以音視頻多媒體為載體的2.0時代，2024年將迎來AI視頻年，AI視頻大有可為。目前萬興科技深耕創(chuàng)意軟件20余年，在音視頻數(shù)據(jù)、跨模態(tài)和多媒體技術上有豐富積淀，并對全球多媒體創(chuàng)作者有更為深刻的理解，現(xiàn)在的萬興“天幕”也許不盡完美，但正因為不完美，才更對未來無限憧憬，并愿為之不懈努力，相信公司會朝著新生代AIGC數(shù)字創(chuàng)意賦能者道路闊步前行。展望未來，萬興“天幕”將堅持內(nèi)部應用、外部開放并行，向外部企業(yè)逐步開放API接口，期待更多行業(yè)伙伴加入，共筑音視頻多媒體大模型開放生態(tài)，攜手共赴AI大時代。

國內(nèi)首個多媒體大模型萬興天幕4月28日公測文生視頻能力支持60秒+

萬興科技副總裁朱偉作《音視頻多媒體大模型市場洞察與落地實踐》主題演講

隨著數(shù)字化轉(zhuǎn)型的加速和AI技術的廣泛應用，多媒體內(nèi)容創(chuàng)作市場在快速增長。公開資料顯示，目前，全世界有3.05億視頻創(chuàng)作者，43億視頻覆蓋群體，每天200億次以上的視頻播放量，視頻需求非常大。另據(jù)QYResearch最新研究顯示，預計2029年全球?qū)I(yè)音視頻系統(tǒng)市場規(guī)模將達到3632.7億美元，未來幾年年復合增長率CAGR為5.0%。

推出萬興“天幕”的萬興科技是中國數(shù)字創(chuàng)意軟件領域產(chǎn)品覆蓋面廣、營收體量大、全球化程度高的A股上市公司，也是國內(nèi)AIGC行業(yè)龍頭企業(yè)，業(yè)務覆蓋200多個國家和地區(qū)，全球累計用戶超15億，月活近1億，被視為“中國版Adobe”。

成立20年來，萬興科技一直緊跟技術浪潮，與時俱進洞察市場需求，針對性賦能不同階段的內(nèi)容創(chuàng)作。面向全新展開的AIGC時代，萬興科技錨定數(shù)字創(chuàng)意創(chuàng)作場景，已推出萬興愛畫、萬興播爆、Wondershare Kwicut、Wondershare VirtuLook等AIGC創(chuàng)意新品；旗下萬興喵影、Wondershare PDFelement、萬興PDF、億圖圖示、億圖腦圖、墨刀等產(chǎn)品均已集成AIGC能力，并持續(xù)優(yōu)化上新，用AI讓世界更有創(chuàng)意。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))

雷峰網(wǎng)版權文章，未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

董子博

編輯

發(fā)私信

當月熱門文章

免費版Banana2來了，Vidu推出Q2生圖全家桶，限時無限免費

國內(nèi)首個多媒體大模型萬興天幕4月28日公測 文生視頻能力支持60秒+

國內(nèi)首個多媒體大模型萬興天幕4月28日公測文生視頻能力支持60秒+