0
本文作者: 業(yè)界評論 | 2025-09-25 17:46 |
9月25日,生數科技正式發(fā)布新一代圖生視頻大模型Vidu Q2。新模型以”Vidu Q2 看AI演戲"為主題,“細微表情生成”為核心提升場景,在極致表情變化、推拉運鏡、生成速度及語義理解方面取得的突破性進展,實現從“生成視頻”到“生成演技”,從“動態(tài)流暢”到“情感表達”的革命性跨越,標志著AI視頻生成技術正式從追求“形似”進入追求“神似”的新階段,將為內容創(chuàng)作、影視產業(yè)、廣告營銷等領域帶來全新升級。
本次更新的Vidu Q2主要包括圖生視頻、首尾幀視頻、時長可選(2-8s)、電影大片及閃電出片兩種模式,在復雜表情變化的文戲,常見的多人打斗場景的武戲,及影視劇情中令人震撼的炫酷特效中表現出彩,能夠通過媲美人類的AI真實表演,將AI演技強力滲透影視、短視頻劇情創(chuàng)作、廣告創(chuàng)意等生產力場景,推動AI視頻生成主角從原本僵硬、機械、無感情的“AI木頭”提升為靈動、有情感、會演戲“AI人“。
突破技術壁壘,AI視頻從“能動”到“會演”
當前,AI視頻生成已能實現基本的動作連貫,但生成的角色往往表情僵硬、眼神空洞,缺乏細節(jié)和打動人心的情感表達,AI生成視頻中的角色也常被詬病為“面癱”或表情僵化,這成為制約AI行業(yè)規(guī)模化發(fā)展的關鍵瓶頸。
Vidu Q2的誕生,正是為了突破這一“最后一道壁壘”。它能夠理解并生成極其細膩的面部微表情,例如嘴角不經意的抽動、眼神中一閃而過的猶豫、眉頭微蹙表達的疑慮等。這些細微、短暫且不受意識控制的表情,是人類傳遞復雜、真實情感的關鍵。Vidu Q2在細微表情生成中的成功技術攻克,使數字角色能夠展現出生動且充滿感染力的演技。
Vidu Q2 宣傳海報
生數科技首席執(zhí)行官駱怡航表示,“Vidu Q2的突破在于我們首次讓AI角色擁有了‘有趣的靈魂’。我們教會了AI‘演戲’,這不僅是技術的里程碑,更是通向更高級別人工智能不可或缺的一步?!?/p>
這一突破得益于Vidu Q2在多模態(tài)理解與生成技術上的深度融合。模型通過深度理解情感文本、圖文解析,并結合對人體面部動作單元的精細解構與物理模擬,從而在視頻中驅動角色面部肌肉、肢體肌肉產生符合情感邏輯的細微運動。除了微表情,Vidu Q2在生成可控及一致性等方面也有了多方位超越。
構建高效能產品矩陣,多場景應用效能躍升
在突破性的“演技”能力之下,Vidu Q2將AI化身演技派 ,構建了一套面向實際應用的高效能產品矩陣。本次發(fā)布的首尾幀、雙出片模式及2-8秒篩選等兼顧出片質量與效率的產品設計模式,網頁版、App版及API同步上線的多渠道化,使得Vidu Q2能夠靈活適配從高端影視制作到快速社交媒體內容生產的不同需求,并讓用戶與客戶都能快速體驗。
以“更大的幅度 × 更牛的運鏡 × 更快的速度 = Vidu Q2”的創(chuàng)作效率革命公式,在實際應用中,Vidu Q2展現出強大的場景適應性。在需要細膩情感表達的“感情”中,它能精準刻畫角色的內心沖突;在復雜的“動作”多人打斗場景中,它能確保每個角色的動作流暢且表情到位;而在需要視覺沖擊力的特效場景中,它更能生成與角色表演完美融合的炫酷效果。這種全方位的表現,使其成為一個真正意義上的“全能型”創(chuàng)作伙伴。
引領人機協作 賦能每一個故事講述者
Vidu Q2的發(fā)布,標志著內容創(chuàng)作范式的一次根本性轉移。它并非簡單的工具迭代,而是作為“表演主體”重新定義了AI在創(chuàng)作鏈中的角色。這意味著,創(chuàng)意生產的核心模式將從“人執(zhí)行”轉向“人指導”,創(chuàng)作者得以從繁瑣的實現過程中解放,將精力專注于最核心的創(chuàng)意與審美。
隨著技術的持續(xù)演進,生數科技Vidu Q2正在開啟一個“人機共創(chuàng)”的新紀元:AI負責精準、高效地完成“表演”,人類則扮演“總導演”的角色,把控故事的靈魂與情感表達。這種深度協作將極大釋放生產力,催生此前難以想象的創(chuàng)意形式,推動AI逐步深入電影預演、虛擬人交互等更復雜的工業(yè)流程,由AI承擔表演、人類主導創(chuàng)意的協作模式,必將釋放出更大的想象空間與商業(yè)價值。
雷峰網雷峰網(公眾號:雷峰網)雷峰網
雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。