0
本文作者: Nemo | 2025-09-02 16:42 |
9月2日,即夢(mèng)AI攜手火山引擎全面開(kāi)放API服務(wù),包括文生圖3.0、文生圖3.1、圖生圖3.0、視頻生成3.0pro、數(shù)字人OmniHuman、動(dòng)作模仿DreamActor M1等多款即夢(mèng)AI同源前沿模型,為企業(yè)級(jí)用戶提供豐富優(yōu)質(zhì)的圖像及視頻生成和編輯服務(wù)。開(kāi)發(fā)者無(wú)需額外申請(qǐng),通過(guò)自助下單即可快速完成接入。
即夢(mèng)AI系列模型,是即夢(mèng)AI基于Seedream、Seedance等字節(jié)跳動(dòng)自研模型,針對(duì)產(chǎn)品內(nèi)不同應(yīng)用場(chǎng)景和用戶多樣化需求,持續(xù)調(diào)優(yōu)開(kāi)發(fā)而來(lái)。目前,這些模型已經(jīng)在即夢(mèng)AI產(chǎn)品上得到大規(guī)模驗(yàn)證,能夠適配故事短片創(chuàng)作、營(yíng)銷物料制作、游戲素材設(shè)計(jì)、多媒體課件制作、自媒體玩法拓展等多種應(yīng)用場(chǎng)景,助力創(chuàng)意高效落地。
依托火山引擎在云服務(wù)、算力調(diào)度、運(yùn)維保障等領(lǐng)域的先進(jìn)技術(shù)能力,即夢(mèng)AI同款能力API上線后,能夠?qū)崿F(xiàn)高穩(wěn)定性的服務(wù)輸出,為企業(yè)用戶提供全天候技術(shù)支持與運(yùn)維服務(wù),有效降低企業(yè)接入前沿AI模型的技術(shù)門(mén)檻與運(yùn)維成本。
即夢(mèng)AI文生圖3.0可以支持多種海報(bào)場(chǎng)景
其中,即夢(mèng)AI文生圖3.0、即夢(mèng)AI文生圖3.1、圖生圖3.0 均為線上最新版本。文生圖3.0專門(mén)針對(duì)海報(bào)設(shè)計(jì)場(chǎng)景強(qiáng)化了圖文排版、藝術(shù)字體與文字準(zhǔn)確性,生成內(nèi)容更貼近商用設(shè)計(jì)需求,輕松輸出風(fēng)格統(tǒng)一、排版專業(yè)的營(yíng)銷素材。
文生圖3.1在繼承前代優(yōu)勢(shì)的基礎(chǔ)上,進(jìn)一步提升了畫(huà)面整體美感和場(chǎng)景豐富度,覆蓋寫(xiě)實(shí)、國(guó)潮、賽博朋克等數(shù)十種風(fēng)格,且還原精準(zhǔn)度大幅提升;色彩搭配、光影層次更具藝術(shù)感,有效提升畫(huà)面美感的塑造;同時(shí)還優(yōu)化了畫(huà)面細(xì)節(jié)豐富度,小到紋理質(zhì)感、大到場(chǎng)景層次均能清晰呈現(xiàn);該模型對(duì)文本指令的響應(yīng)也更加精準(zhǔn),可以高效還原用戶創(chuàng)意構(gòu)想。
圖生圖3.0新增了智能參考編輯功能,支持基于文本指令對(duì)圖像進(jìn)行精細(xì)化修改。該能力在兩大核心維度實(shí)現(xiàn)突破:一是精準(zhǔn)執(zhí)行編輯指令,無(wú)論是局部元素替換、風(fēng)格轉(zhuǎn)換,還是細(xì)節(jié)調(diào)整,均能精準(zhǔn)匹配用戶需求;二是在編輯過(guò)程中,能有效保持圖像內(nèi)容完整性,尤其在處理人物圖像時(shí),可完整保留人物五官特征、姿態(tài)細(xì)節(jié),在真實(shí)圖像優(yōu)化、海報(bào)圖文設(shè)計(jì)等場(chǎng)景中表現(xiàn)突出。
視頻生成3.0Pro具備多鏡頭敘事能力,可根據(jù)文本指令生成包含鏡頭切換、場(chǎng)景過(guò)渡的連貫視頻;對(duì)創(chuàng)作指令的遵循度更高,能精準(zhǔn)還原場(chǎng)景設(shè)定、人物動(dòng)作等需求;動(dòng)態(tài)表現(xiàn)更流暢自然,人物肢體動(dòng)作、物體運(yùn)動(dòng)軌跡無(wú)卡頓;支持生成1080P高清視頻,畫(huà)面質(zhì)感達(dá)專業(yè)制作水準(zhǔn),同時(shí)可實(shí)現(xiàn)動(dòng)漫、寫(xiě)實(shí)、復(fù)古等多元風(fēng)格化表達(dá)。功能上,既支持純文本生成視頻,也支持上傳首幀圖片并搭配文本提示詞生成視頻,滿足多樣化創(chuàng)作需求。
OmniHuman 能夠基于單張圖片與輸入音頻,生成全畫(huà)幅可控的數(shù)字人視頻。該模型能夠精準(zhǔn)捕捉音頻中的情緒,驅(qū)動(dòng)數(shù)字人呈現(xiàn)自然流暢的動(dòng)態(tài)變化,無(wú)論是高度逼真的人物,還是風(fēng)格多樣的動(dòng)漫卡通形象,皆能實(shí)現(xiàn)生動(dòng)且細(xì)膩的演繹,適用于宣傳帶貨、影視游戲創(chuàng)作、互動(dòng)表演及專業(yè)解說(shuō)等眾多商業(yè)化場(chǎng)景,有效提升創(chuàng)意表達(dá)與傳播效能。
DreamActor M1是一款基于圖像與視頻模板驅(qū)動(dòng)的人物動(dòng)態(tài)生成模型,支持通過(guò)單張圖片和一段模板視頻,精準(zhǔn)還原人物的動(dòng)作、表情及口型,同時(shí)保持原圖片中的主體形象與背景高度一致。該模型在橫屏輸出適配、肢體動(dòng)作表現(xiàn)等方面尤為出色,生成效果穩(wěn)定且逼真,適用于多種視頻合成場(chǎng)景,具備強(qiáng)大的商業(yè)化應(yīng)用潛力,適用于虛擬人創(chuàng)作、內(nèi)容營(yíng)銷、影視預(yù)制等多類場(chǎng)景。
即夢(mèng)AI相關(guān)負(fù)責(zé)人介紹,即夢(mèng)AI自誕生以來(lái),始終致力于幫助創(chuàng)作者解放創(chuàng)意,帶來(lái)效率提升,目前在C端產(chǎn)品上已經(jīng)有了嘗試和積累,此次聯(lián)合火山引擎開(kāi)放API服務(wù),是即夢(mèng)AI能力從“服務(wù)個(gè)人創(chuàng)意”向“賦能企業(yè)生產(chǎn)”的重要延伸。“我們希望將經(jīng)過(guò)大規(guī)模用戶驗(yàn)證的AI能力,通過(guò)更穩(wěn)定、更適配企業(yè)需求的方式輸出,幫助企業(yè)快速接入成熟的AI工具,提升創(chuàng)意生產(chǎn)效率”,該負(fù)責(zé)人表示。未來(lái)即夢(mèng)AI將攜手火山引擎持續(xù)拓展API服務(wù)能力,推動(dòng)AI在更多行業(yè)創(chuàng)意場(chǎng)景落地。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。