獨(dú)家 | 香港大學(xué)徐東教授新成立文生視頻大模型公司「徐圖智能」

本文作者：郭思

2023-12-07 14:55

導(dǎo)語(yǔ)：文生視頻領(lǐng)域或成下一個(gè)大模型創(chuàng)業(yè)浪潮。

作者丨郭思

編輯丨陳彩嫻

大模型的創(chuàng)業(yè)進(jìn)入2.0階段，除了此前如雨后春筍出現(xiàn)的自然語(yǔ)言公司之外，瞄準(zhǔn)視覺大模型應(yīng)用的創(chuàng)業(yè)公司也陸續(xù)成立。

近日，AI 科技評(píng)論獨(dú)家獲悉：IEEE Fellow、香港大學(xué)教授徐東成立了一家 AI 公司——徐圖智能，定位是基于視覺大模型技術(shù)，提供文生視頻等服務(wù)。

企查查信息顯示，該公司于今年6月成立，仍處于注冊(cè)狀態(tài)。

獨(dú)家 | 香港大學(xué)徐東教授新成立文生視頻大模型公司「徐圖智能」

團(tuán)隊(duì)成員方面，徐東擔(dān)任徐圖智能 CEO，他于2001年和2005年在中國(guó)科學(xué)技術(shù)大學(xué)取得學(xué)士和博士學(xué)位,目前擔(dān)任香港大學(xué)計(jì)算機(jī)系教授。

他曾在微軟亞洲研究院、香港中文大學(xué)和哥倫比亞大學(xué)從事研究工作，并在南洋理工大學(xué)和悉尼大學(xué)任教。徐東教授在計(jì)算機(jī)視覺、多媒體信號(hào)處理以及機(jī)器學(xué)習(xí)等領(lǐng)域做出了重要貢獻(xiàn),在IEEE Transactions和國(guó)際頂級(jí)會(huì)議上發(fā)表了150余篇論文，其中兩篇論文分別獲得T-MM 2014最佳論文獎(jiǎng)和CVPR 2010最佳學(xué)生論文獎(jiǎng)。徐東教授是IEEE和IAPR Fellow，于2018和2021年兩次入選科睿唯安 (Clarivate Analytics)高被引學(xué)者，同時(shí)也擔(dān)任ACM Computing Surveys (CSUR)資深副主編。

在徐東加碼之下，徐圖智能在文生視頻領(lǐng)域有強(qiáng)大的技術(shù)基礎(chǔ)，其團(tuán)隊(duì)或也絕大多數(shù)來(lái)自香港大學(xué)、商湯等名?；蛎?。

長(zhǎng)久以來(lái)，相對(duì)于文本、代碼和圖片生成，視頻生成（Text-to-Video）也一直被認(rèn)為是 AIGC 的“高地”，面臨龐大的計(jì)算需求、高質(zhì)量數(shù)據(jù)集短缺、可控性等挑戰(zhàn)。所以對(duì)于視頻的GPT時(shí)代，人們一直抱有期待但遲遲沒見其到來(lái)的跡象。

但近期，視頻領(lǐng)域似乎迎來(lái)了新的春風(fēng)。Runway 先后發(fā)布了 Gen1、Gen2， Motion Brush 則近期朝視頻可靠性向前了一步，Stability AI 也發(fā)布了自己的首個(gè) Text-to-Video 模型 Stable Video Diffusion。今年 7 月，Pika Labs 在 Discord 推出服務(wù)器，并在幾個(gè)月時(shí)間內(nèi)收獲了 50 萬(wàn)用戶。

不過相比起文本和圖像領(lǐng)域，視頻創(chuàng)業(yè)要想取得突破一段還有漫長(zhǎng)的路程。行業(yè)一致認(rèn)為，視頻生成的主要難題在于時(shí)長(zhǎng)，跟時(shí)長(zhǎng)相關(guān)的是動(dòng)作的意義，不僅要延長(zhǎng)視頻制作的時(shí)長(zhǎng)，還要關(guān)注動(dòng)作的意義，看它到底能做多復(fù)雜的動(dòng)作。

其次，視頻的清晰度也需要進(jìn)一步提高。盡管清晰度方面已經(jīng)有突破，但還沒有提高到電影級(jí)的水平，現(xiàn)在生成的視頻一般是720p分辨率，視頻的流暢性也不夠理想，特別是一些細(xì)節(jié)的texture。

而對(duì)于Pika Labs創(chuàng)始人提出的視頻生成處于類似GPT-2的時(shí)期，徐東則在2023年新一代人工智能創(chuàng)業(yè)大賽的主題演講中提出，視頻生成暫時(shí)還無(wú)法直接定義為來(lái)到了GPT時(shí)代，但可以肯定的是已經(jīng)初現(xiàn)曙光，這或許也和徐東此次創(chuàng)立文生視頻創(chuàng)業(yè)公司息息相關(guān)。

大模型創(chuàng)業(yè)公司的機(jī)會(huì)在哪里？文生視頻領(lǐng)域能否迎來(lái)GPT時(shí)刻的？歡迎添加作者微信（lionceau2046）交流，互通有無(wú)。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng)) 雷峰網(wǎng) 雷峰網(wǎng)

雷峰網(wǎng) 雷峰網(wǎng) 雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

郭思

主筆

發(fā)私信

當(dāng)月熱門文章