0
本文作者: 肖漫 | 2019-12-24 10:09 |
內(nèi)容產(chǎn)業(yè)龐大而復(fù)雜,涵蓋了文字、影響、語音等各個方面。不過,近年來,隨著 AI 的加入,內(nèi)容產(chǎn)業(yè)在各個方面都取得一定的突破——精準(zhǔn)的內(nèi)容分發(fā),全面的內(nèi)容應(yīng)用,自動化的影像生成,高質(zhì)量的語音合成、快速的語言傳譯等。
毋庸置疑,AI 為內(nèi)容產(chǎn)業(yè)打開了一扇全新的大門。
在此背景下,雷鋒網(wǎng)推出了「AI 最佳掘金案例年度評選」,從商業(yè)維度出發(fā),致力于尋找各個行業(yè)用戶/客戶問題解決能力強的最佳產(chǎn)品和解決方案。經(jīng)過多輪的篩選與評審,評選結(jié)果終于在日前正式揭曉。
在內(nèi)容領(lǐng)域,阿里文娛、影譜科技、深聲科技、汽車之家、搜狗同傳五家公司憑借各自的技術(shù)脫穎而出,分別獲得了“最佳內(nèi)容智能推薦獎”、“最佳 AI 影像自動化生產(chǎn)獎” 、"最佳語音合成獎”、“最佳 AI 內(nèi)容應(yīng)用創(chuàng)新獎” 、“最佳人工智能翻譯設(shè)備獎” 。
作為一個視頻內(nèi)容分發(fā)平臺,阿里文娛優(yōu)酷旨在為用戶提供個性化的服務(wù)。
目前,無論是影劇綜長視頻、資訊體育等垂類頻道,還是短視頻、小視頻信息流,基于推薦技術(shù)的視頻分發(fā)已遍布優(yōu)酷應(yīng)用的各個場景。2017 年,在優(yōu)酷實現(xiàn)全站的個性化推薦分發(fā)后,用戶觀看視頻播放量和觀看時長分別提升了 30% 和 10%。
得益于優(yōu)酷對短小視頻的精準(zhǔn)理解能力和對用戶興趣演變的實時建模能力,優(yōu)酷為用戶提供了千人千面的個性化推薦服務(wù)。
在短小視頻內(nèi)容的理解方案上,優(yōu)酷將文本、音頻、圖像等看作不同的視圖,對不同視圖的信息進(jìn)行拆分整合。先挖掘視圖間信息的共有性,然后分別提取各個視圖信息的私有性,最后對共有的同質(zhì)信息與私有的異質(zhì)信息進(jìn)行整合。
在用戶興趣演化建模方面,優(yōu)酷在傳統(tǒng)的推薦系統(tǒng)中加入了時間流模塊,提出了一種新穎的深度時間流框架,建模用戶在連續(xù)時間上的興趣演化,從而推薦用戶更感興趣的內(nèi)容。并且,該深度時間流框架已被 AAAI2020 收錄。
影譜科技是一家致力于智能影像生產(chǎn)技術(shù)落地應(yīng)用的視覺技術(shù)企業(yè),成立于 2009 年,是國內(nèi)智能影像生產(chǎn)技術(shù)提供商及應(yīng)用方案提供商。
通過對影像數(shù)據(jù)的多模態(tài)語義理解,借助深度學(xué)習(xí)技術(shù)實現(xiàn)影像再加工以及影像生成,影譜科技為傳統(tǒng)的人工結(jié)合 CG 的影像生產(chǎn)方式帶來效率和質(zhì)量的提高。
作為智能影像系統(tǒng)的開發(fā)者及提倡者,影譜科技專注于視頻影像的工業(yè)化進(jìn)程,推動傳統(tǒng)機器影像向智能影像的變革升級,在該領(lǐng)域有著技術(shù)與市場的領(lǐng)先優(yōu)勢。
另外,影譜科技還支持大批量數(shù)字內(nèi)容視頻化,融合多模態(tài)圖像識別、情感語境、關(guān)鍵幀捕捉等關(guān)鍵技術(shù),對視頻元數(shù)據(jù)進(jìn)分析和理解,進(jìn)而機器可以自動化生產(chǎn)一段全新視頻。
目前,影譜科技深入科教領(lǐng)域的教、管、研等環(huán)節(jié),為科教產(chǎn)業(yè)轉(zhuǎn)型升級賦能;探索挖掘視頻增值價值、視頻信息內(nèi)容增強、影視輕工業(yè)自動化生產(chǎn),優(yōu)化文化傳媒產(chǎn)業(yè)視覺呈現(xiàn);用技術(shù)賦能內(nèi)容自動化生產(chǎn),支持各級媒體融合,打造綜合智能化服務(wù)體系。
深聲科技是一家專注于“智能語音”技術(shù)研發(fā)和業(yè)務(wù)落地的人工智能公司,2018 年成立之初即獲得小米科技數(shù)千萬天使投資。
不到兩年,深聲科技已自主研發(fā)包括語音合成、聲音定制、聲音克隆等七大核心技術(shù),是業(yè)內(nèi)少有的擁有語音合成全鏈路技術(shù)能力的公司。
深聲科技采用可控的聲學(xué)模型和卓越的聲碼器模型,能快速學(xué)習(xí)目標(biāo)人的語音特征,將輸入的文字轉(zhuǎn)換成清晰自然的語音輸出,并支持語速、語調(diào)和音量的設(shè)置,可為持續(xù)應(yīng)用在同一或不同的場景。
另外,深聲科技還建成了豐富的語音合成語料庫,有專業(yè)的數(shù)據(jù)資源團(tuán)隊對數(shù)據(jù)大規(guī)模而嚴(yán)格的采集、拼音和韻律自動化標(biāo)注以及人工校正的品質(zhì)監(jiān)管,能夠向客戶提供海量發(fā)音人資源和多種優(yōu)質(zhì)音色。憑借先進(jìn)的技術(shù)和優(yōu)質(zhì)的業(yè)務(wù)能力,深聲科技獲得包括小米、金山、暢讀書城、中國科學(xué)院、探跡、同行者等客戶的青睞,合作覆蓋多個應(yīng)用場景。
在 2019 年 7 月斬獲國際語音合成大賽 Blizzard challenge2019 中,深聲 TTS 獲得了亞軍,代表著當(dāng)前行業(yè)商用語音合成技術(shù)的最高水平。
汽車之家是致力于為汽車消費者提供選車、買車、用車、換車等所有環(huán)節(jié)的全面、準(zhǔn)確、快捷的一站式服務(wù)。
如今,汽車之家已轉(zhuǎn)型升級為“基于數(shù)據(jù)技術(shù)的‘汽車’公司”,建設(shè)了“車媒體、車電商、車金融、車生活” 4 個圈,通過產(chǎn)品服務(wù)、數(shù)據(jù)技術(shù)、生態(tài)規(guī)則和資源更進(jìn)一步為客戶賦能。
作為全球訪問量最大的汽車網(wǎng)站,汽車之家構(gòu)建了汽車行業(yè)最大最全的知識網(wǎng)絡(luò),涵蓋各類汽車行業(yè)知識,實現(xiàn)多源異構(gòu)數(shù)據(jù)的語義集成,形成了三類場景化應(yīng)用:行業(yè)數(shù)據(jù)可視分析(之家大腦)、聊天機器人(家家小秘)和車機問答。
其中,“之家大腦”支持實體為中心的關(guān)聯(lián)探索分析,能夠進(jìn)行多維度展示;“家家小秘”滿足用戶在各個階段的答案需求,實現(xiàn)即問即答;“車機問答”彌補了傳統(tǒng)車機汽車知識性不足的缺陷,理解汽車專業(yè)領(lǐng)域意圖,涵蓋看車、買車、用車常見問題。
不僅如此,在第二屆中國 AI+ 創(chuàng)新創(chuàng)業(yè)大賽總決賽暨創(chuàng)新創(chuàng)業(yè)峰會上,汽車之家從 2000 多支隊伍中脫穎而出,榮獲了特等獎。
搜狗同傳利用搜狗先進(jìn)的語音識別和機器翻譯技術(shù),可以實現(xiàn)“中譯英”和“英譯中”兩種同傳工作,以中英雙語字幕形式呈現(xiàn),打破了國際會議語言溝通的障礙,大大提高信息傳遞效率。
自 2016 年首次亮相世界互聯(lián)網(wǎng)大會后,搜狗同傳已成為國內(nèi)、國際會議的“標(biāo)配”,支持過 T-EDGE 創(chuàng)新大會、GMIC 大會、TechCrunch 國際創(chuàng)新峰會、CNCC 中國計算機大會、中國車聯(lián)網(wǎng)博覽會、全球人工智能技術(shù)大會、世界電信和信息大會等數(shù)百場會議,覆蓋了醫(yī)療、科技、經(jīng)濟(jì)、汽車等多個領(lǐng)域。
與傳統(tǒng)的機器翻譯不同,搜狗同傳具備了聽、譯、改三種功能,不僅能流暢地記錄、翻譯內(nèi)容,還能很好地識別詞語和句子的停頓,覆蓋了語音斷句、語音識別、文本斷句、機器翻譯等多個技術(shù)維度,在各個大會上都有著穩(wěn)定可靠的臨場表現(xiàn)。
另外,在 2018 年,根據(jù)搜狗方面給出的預(yù)測數(shù)據(jù),搜狗語音識別的準(zhǔn)確率為 97%,支持最快每秒 400 字的高速聽寫,語音輸入日頻次高達(dá) 3.4 億次,搜狗語音翻譯的準(zhǔn)確率則可以達(dá)到 90%。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。