0
本文作者: 呂倩 | 2017-07-09 11:12 | 專題:GAIR 2017 |
過往視頻編導(dǎo)的標(biāo)簽幾乎都是熬夜、通宵,每天工作到凌晨三四點(diǎn)甚至通宵是常態(tài)?;鄞ㄖ悄蹸EO康洪文看來,這中間存在太多的重復(fù)勞作,因此,去年年底,康洪文與團(tuán)隊(duì)成員共同確定了AI+視頻的創(chuàng)業(yè)ider。
7月8日,在由中國計算機(jī)學(xué)會(CCF)主辦、雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的第二屆CCF-GAIR全球人工智能與機(jī)器人峰會AI+專場上,康洪文重點(diǎn)介紹了AI+視頻中,視頻的創(chuàng)作以及視頻處理理解兩方面工作。
首先,關(guān)于視頻創(chuàng)作,慧川智能希望做到“讓人只要會寫文章,就會做視頻”。對于人來講,創(chuàng)造力是無限的,文字工作者有強(qiáng)大的圖文創(chuàng)造能力與講故事能力,不該被制造視頻的繁瑣工作局限掉。加之如今短視頻市場的爆發(fā)趨勢,更該大力布局。
據(jù)雷鋒網(wǎng)了解,目前視頻網(wǎng)絡(luò)用戶已突破5.5億,并保持每年8.1%的增長速度。
康洪文以公眾號文章為例稱,通過到頭條以及微信公眾號平臺統(tǒng)計,這兩個平臺每天產(chǎn)出文章數(shù)量為100萬篇以上。根據(jù)大數(shù)據(jù)分析,里面67%的文章都非常適合用視頻的方式來呈現(xiàn),以及這種類型與慧川智能研發(fā)的技術(shù)也非常契合。重要的是,目前這兩個平臺上視頻覆蓋率還非常低,因此有一個非常大的空間等待填補(bǔ)。
除了公眾號,以淘寶為代表的電商上有十億級商品,也被寄予制成視頻的希望??岛槲默F(xiàn)場演示,基于網(wǎng)頁界面,將任意網(wǎng)頁或文字輸入,后臺AI算法會根據(jù)這段文字進(jìn)行分析,找到里面所有關(guān)鍵點(diǎn),比如提到阿爾法狗和柯潔的比賽,后臺就根據(jù)自然語言去處理這些關(guān)鍵部分,如時間、地點(diǎn)、人物。通過文章的語義分析,自動與素材進(jìn)行匹配,對每一段話、每一個句子找到對應(yīng)的多媒體素材,比如圖片、視頻、社交媒體分享,進(jìn)而自動生成故事線。
康洪文表示,如此步驟下,生成可以直接使用的視頻,是最理想狀態(tài),但如果有需要進(jìn)一步修改的話,可以在生成界面基礎(chǔ)上再進(jìn)行素材調(diào)整,比如,還可以截取每個視頻片段長度、起始時間,甚至在圖片上添加一些像畫字或者文字的信息。
據(jù)雷鋒網(wǎng)了解,通過慧川智能系統(tǒng),視頻制作效率可能被提升近百倍。之前花費(fèi)幾小時制作的視頻,如今通過智能手段,可被壓縮至幾十秒。
在具體步驟上,首先根據(jù)輸入文章或者網(wǎng)頁進(jìn)行文本分析,通過自然語言處理技術(shù)分析發(fā)現(xiàn)關(guān)鍵信息,之后再跟結(jié)構(gòu)化素材庫進(jìn)行匹配和搜索,找到相關(guān)的圖片、視頻片段和社交媒體,之后還有部分延伸的廣告進(jìn)行匹配?;鄞ㄖ悄芴峁┖啽愕脑诰€剪輯和預(yù)覽平臺,客戶只需要注冊一個賬號就可以進(jìn)行剪輯,以及視頻預(yù)覽,滿意之后直接點(diǎn)擊生成視頻,在云端即可生成下載。
整個提升視頻制作效率的系統(tǒng)結(jié)構(gòu),大致分為三部分——計算機(jī)視覺、自然語言處理、以及大規(guī)模計算。這三個部分正好對應(yīng)慧川智能三位創(chuàng)始人的背景——康洪文康慧文于卡耐基梅隆大學(xué)專攻人工智能視頻理解,CTO黃健博士是康在微軟的同事,在谷歌從事過搜索引擎與商品推薦,首席架構(gòu)官劉曦博士主攻大視頻分析平臺。
康慧文表示,面臨的最大挑戰(zhàn)是對視頻結(jié)構(gòu)化信息一無所知。從根本上講,慧川智能是希望將視頻結(jié)構(gòu)化,根據(jù)三維形態(tài)的視頻流,理解其內(nèi)部的人與物,以及他們正在進(jìn)行的動作,把它構(gòu)建一個精確到幀級的視頻內(nèi)容標(biāo)簽。
同時,康洪文表示,此次會開放一個API,幫助對視頻有需求的人進(jìn)行理解,進(jìn)而促進(jìn)全網(wǎng)視頻結(jié)構(gòu)化。其主要包括兩大功能——一個是視頻內(nèi)容的理解和標(biāo)簽化,提供包括時間、地點(diǎn)、人物、事件等一千多個視頻結(jié)構(gòu)化標(biāo)簽。另外,慧川創(chuàng)造了全球明星的數(shù)據(jù)庫,當(dāng)輸入一段視頻,后臺可以將這個視頻出現(xiàn)的所有明星,出現(xiàn)的位置,從第幾幀到第幾幀的具體位置全部標(biāo)注出來。目前慧川智能已收錄全球最知名的500位明星。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章