0
本文作者: 董子博 | 2024-07-31 19:04 |
7月30日,作為Sora全球首個挑戰(zhàn)者,且是國內(nèi)首個純自研的視頻大模型Vidu(www.vidu.studio)正式上線。生數(shù)科技宣布,目前Vidu無需申請,用戶直接用郵箱注冊即可上手體驗。
生數(shù)科技作為國內(nèi)最早布局多模態(tài)通用大模型的團(tuán)隊之一,今年4月聯(lián)合清華大學(xué)發(fā)布了國內(nèi)首款全面對標(biāo)OpenAI Sora的視頻大模型Vidu。自4月底首次亮相以來,Vidu憑借媲美Sora的文生長視頻能力,迅速在國內(nèi)外引起廣泛關(guān)注。此次Vidu全面開放了文生視頻、圖生視頻兩大功能,提供4s和8s兩種時長選擇,分辨率最高達(dá)1080P。
在效果上,Vidu不僅延續(xù)了四月份展示的高動態(tài)性、高逼真度、高一致性等優(yōu)勢,還在上線版本中新增了角色一致性(Character To Video)、動漫風(fēng)格、文字與特效畫面生成等特色能力。同時,在影響用戶體驗的推理速度層面,Vidu實現(xiàn)了業(yè)界最快的實測推理速度,生成一段4秒片段只需30秒。而市面上的主流AI視頻工具在生成4秒左右的視頻片段時,用戶通常需要等待1到5分鐘,甚至更長。 Vidu的高效推理不僅為用戶帶來了接近于無縫的創(chuàng)作體驗,更短的處理時間還意味著它能夠輕松應(yīng)對大量用戶的需求,提供個性化的服務(wù)。
眾所周知,視頻生成產(chǎn)品的開發(fā)周期長且費用高昂。而從發(fā)布到上線僅僅三個月,生數(shù)科技就完成了對Vidu的快速迭代,實現(xiàn)了高質(zhì)量的視頻生成效果,這離不開Vidu研發(fā)團(tuán)隊在模型高效訓(xùn)練方面積累的工程化經(jīng)驗。密集而快節(jié)奏的模型訓(xùn)練任務(wù),不僅需要大規(guī)模的算力,還需要從數(shù)據(jù)準(zhǔn)備到模型訓(xùn)練、再到模型推理的全鏈路保障。
Vidu在模型訓(xùn)練層面采用了百度百舸·AI異構(gòu)計算平臺。百舸是百度智能云基于過去多年在 AI 方面的沉淀,以GPU為核心搭建的異構(gòu)計算平臺,更適合大模型訓(xùn)練,保障模型訓(xùn)練的穩(wěn)定性和效率。
在提升模型訓(xùn)練效率方面,百舸可以把不同地點、不同規(guī)模、不同集群的算力統(tǒng)一管理起來,通過芯片性能優(yōu)化、自動芯片選型、潮汐混部這些經(jīng)驗和技術(shù),大幅提升智能算力效能,萬卡集群上的模型有效訓(xùn)練時長占比超過98.8%,線性加速比和帶寬有效性均超過了95%,是業(yè)界領(lǐng)先的算力效能。
在提升模型訓(xùn)練穩(wěn)定性方面,百舸提供了豐富的運維和可觀測工具以及容錯保障能力,提升了大規(guī)模集群長期運行的穩(wěn)定性,降低因為故障導(dǎo)致訓(xùn)推任務(wù)異常終止的概率,減少業(yè)務(wù)損失。
同時,百舸支持混合多芯,兼容昆侖芯、昇騰、海光DCU、英偉達(dá)、英特爾等國內(nèi)外主流AI芯片,支持同一智算集群中混合使用不同廠商芯片,最大程度上屏蔽硬件之間差異,幫助企業(yè)擺脫單一芯片依賴,實現(xiàn)更優(yōu)的成本,保證更有彈性的供應(yīng)鏈。在多芯混合訓(xùn)練任務(wù)中,百舸能夠?qū)涡酒寐省⑿酒g通信效率、集群整體效能發(fā)揮到極致,百卡規(guī)模性能損失不超過3%,千卡規(guī)模性能損失不超過5%,均為國內(nèi)領(lǐng)先水平。
百舸高效、穩(wěn)定、混合多芯等特點能夠幫助生數(shù)科技實現(xiàn)大模型開發(fā)的“快、穩(wěn)、省”,助力生數(shù)科技短時間低成本完成大模型的業(yè)務(wù)上線。目前,百舸已經(jīng)在互聯(lián)網(wǎng)、教育、汽車、生命科學(xué)等行業(yè)有了廣泛的落地實踐,幫助行業(yè)客戶實現(xiàn)大模型應(yīng)用的快速落地。
未來,生數(shù)科技將不斷基于百度百舸·AI異構(gòu)算力計算平臺持續(xù)訓(xùn)練、提升模型能力,并逐步通過百度智能云千帆平臺開放模型服務(wù)。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。