丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給新智造
發(fā)送

0

搜狗AI合成主播走出國門,向世界證明中國AI

本文作者: 新智造 2019-05-09 10:00
導(dǎo)語:相對于智能語音系統(tǒng),搜狗AI合成主播又多出了幾個維度的信息。

隨著搜狗AI合成主播技術(shù)升級,在完成兩次版本迭代后,近日因?qū)崿F(xiàn)“跨語言”出海而再度引起海外市場高度關(guān)注,成為海外媒體行業(yè)明星產(chǎn)品。

AI技術(shù)創(chuàng)新落地國際市場

搜狗官方近日對外公布,其已與阿布扎比媒體集團達成合作,將推出全球首個阿拉伯語AI合成主播。對于此次合作,阿聯(lián)酋文化和知識發(fā)展部部長努拉表示,阿布扎比媒體集團此次研發(fā)及應(yīng)用AI合成主播符合其戰(zhàn)略需求,將通過人工智能等數(shù)字化技術(shù)實現(xiàn)媒體智能化升級。

搜狗AI合成主播走出國門,向世界證明中國AI

阿布扎比媒體集團是阿聯(lián)酋的大型媒體企業(yè),旗下包括阿布扎比電視臺、廣播電臺、阿文《聯(lián)邦報》、英文《國家報》及雜志、網(wǎng)站等主流媒體,在海灣和阿拉伯地區(qū)擁有較高的知名度和影響力。據(jù)悉,本次該集團與搜狗合作打造的AI合成主播,將應(yīng)用于迪拜電視臺有線頻道及社交媒體端,用以播報時政新聞為主的欄目。

隨著我國政府「一帶一路」的政策加持,中國AI科技領(lǐng)域的優(yōu)秀企業(yè)開始在全球范圍內(nèi)嶄露頭角。搜狗官方也表示,此次搜狗AI合成主播出海,一方面,正是響應(yīng)國家「一帶一路」政策號召的針對性發(fā)展戰(zhàn)略;另一方面,對全球媒體行業(yè)而言,隨著搜狗AI合成主播背后的「搜狗分身」技術(shù)的升級迭代,把AI的觸角延伸到多個語種的信息領(lǐng)域,將進一步促進AI合成主播在全球范圍的應(yīng)用普及。

此次同阿布扎比媒體集團的合作,助力搜狗以AI技術(shù)的創(chuàng)新應(yīng)用成功撕開了國際市場,提升了海外知名度。后續(xù),在國家利好政策的持續(xù)加持下,搜狗在全球范圍內(nèi)AI落地應(yīng)用或許值得更多期待。

搜狗AI不斷突破,合成主播養(yǎng)成記

2018年11月7日,在第五屆世界互聯(lián)網(wǎng)大會上,搜狗與新華社聯(lián)合發(fā)布了全球首個全仿真智能AI主持人,搜狗AI合成主播首次亮相。

搜狗AI合成主播走出國門,向世界證明中國AI

首個AI合成主播以著名主持人邱浩為原型,具體功能方面,搜狗CEO王小川在發(fā)布會上介紹稱,“由真人主播面對鏡頭錄制一段播報新聞視頻,「搜狗分身」技術(shù)憑借這段視頻,將真人主播的聲音、唇形、表情動作等特征進行提取,然后再通過語音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報能力的AI合成主播。后續(xù)只需要提供文字,AI合成主播就能準(zhǔn)確無誤的像真人主播一樣播出新聞?!?/p>

相對而言,搜狗的第一代AI合成主播雖然驚艷,卻仍難免存在一些遺憾,如搜狗AI合成主播此前原型只有男性,沒有女性;合成主播只有面部表情,沒有肢體動作。而這些,也正是搜狗今年年初針對其AI合成主播重點升級的方向。2019年2月-3月,搜狗AI合成主播實現(xiàn)兩次版本迭代,從過去的「坐著播新聞」升級成結(jié)合肢體動作的「站立式播報」,并上線全球首位AI合成女主播「新小萌」,進一步增強了用戶的新聞視聽體驗。

搜狗AI合成主播走出國門,向世界證明中國AI

版本迭代的同時,搜狗AI合成主播的定制周期也在不斷縮減。雷鋒網(wǎng)了解到,由于早期技術(shù)不成熟,需要用到大量的數(shù)據(jù)?,F(xiàn)在錄制一個人,可以放在一天的時間內(nèi),把音頻和視頻全部錄完,同時錄得數(shù)據(jù)也比較少?,F(xiàn)在幾個小時的視頻資料就可以形成一個逼真形象。

雷鋒網(wǎng)了解到,搜狗AI合成主播自2018年11月正式面世半年以來,經(jīng)歷了兩次重大版本迭代,從「坐」到「站」,從「男」到「女」,如今更從漢語到多語種,這正源于搜狗在AI技術(shù)上多年來的積累優(yōu)勢。從做搜狗搜索引擎到做搜狗輸入法,再到做搜狗瀏覽器,在過去十年里,搜狗技術(shù)團隊在互聯(lián)網(wǎng)、大數(shù)據(jù)、AI技術(shù)上有了長足的積累。而搜狗AI合成主播正是基于此前的技術(shù)積累在媒體領(lǐng)域的創(chuàng)新落地應(yīng)用。

搜狗AI合成主播核心:「搜狗分身」技術(shù)

AI合成主播只需要輸入文字或語音文本,就可以實時高效輸出音視頻合成效果,獲得實時的播報視頻。被行業(yè)所驚嘆討論的是,AI合成主播不僅能用和真人一樣的聲音進行新聞或節(jié)目播報,連唇形、面部表情也能夠吻合。

那么搜狗打造AI合成主播所用到的「搜狗分身」技術(shù)為何物?

搜狗公司語音交互技術(shù)中心總經(jīng)理王硯峰介紹,「搜狗分身」技術(shù)是搜狗人工智能的核心技術(shù)之一,誕生于搜狗「自然交互+知識計算」這一人工智能理念之下。

搜狗AI合成主播走出國門,向世界證明中國AI

具體而言,搜狗分身技術(shù)是搜狗人工智能推出的多模態(tài)合成技術(shù),可以基于少量真實音視頻數(shù)據(jù),快速遷移生成虛擬的分身模型。使用時輸入一段文本,即可生成與真人無異的同步音視頻。

AI合成主播主要有兩大核心技術(shù)支撐:通過人工智能技術(shù),采集人的面部表情并標(biāo)簽化,并根據(jù)語義合成表情;通過機器學(xué)習(xí)自動生成仿真語音。而這兩大核心技術(shù)也正是基于搜狗語音合成和圖像生成的兩大引擎:

  • 在語音合成引擎中,基于用戶少量音頻數(shù)據(jù),使用搜狗個性化語音合成技術(shù),快速學(xué)習(xí)用戶音色、韻律、情感等多維度特征,建立輸入文本與輸出音頻信息的關(guān)聯(lián);

  • 在圖像生成引擎中,使用搜狗人臉識別、三維人臉重建、表情建模等技術(shù)對人臉表情動作進行特征學(xué)習(xí)和建模,建立輸入文本、輸出音頻與輸出視覺信息的關(guān)聯(lián)映射,最終生成輸出分身視頻。

前文提到,在不到半年的時間,搜狗AI合成主播便歷經(jīng)了多次版本升級:除了語言能力,逐漸加入微表情、肢體語言等能力,從漢語語種拓展到英語、阿拉伯語等多語言語種。短時間內(nèi)多方面能力的迅速迭代,也恰恰體現(xiàn)了搜狗AI技術(shù)的行業(yè)領(lǐng)先性。

AI合成主播將走向何處?

依托「搜狗分身」技術(shù)創(chuàng)新的信息傳播形式,AI合成主播能夠幫助傳媒行業(yè)在融媒體轉(zhuǎn)型、新聞時效性和跨語種傳播能力等方面再上臺階,推動其智能化發(fā)展。

據(jù)新華社官方信息顯示,AI合成主播自上線新華社以來已播報新聞3400余條,累計時長達10000多分鐘,參與了包括第五屆世界互聯(lián)網(wǎng)大會、首屆進博會等重要會議報道。同時,此次同阿布扎比媒體集團聯(lián)合推出的首個阿語主播,也將上崗迪拜電視臺有線頻道及社交媒體端的時政新聞欄目。

雷鋒網(wǎng)了解到,雖然搜狗AI合成主播目前主要應(yīng)用于媒體領(lǐng)域,然而,搜狗的目標(biāo)不僅僅是媒體領(lǐng)域。王小川前不久表示,作為AI合成主播的技術(shù)核心,「搜狗分身」技術(shù)未來還將應(yīng)用于娛樂、醫(yī)療、健康、教育、法律、金融等多個領(lǐng)域,通過提供個性化的行業(yè)解決方案,為不同職業(yè)賦能,從而提升整個社會的信息生產(chǎn)力,用AI科技來讓人類生活變得更加美好。

相關(guān)文章:

搜狗與阿布扎比媒體集團合作推出阿語AI合成主播 “中國造”人工智能走向全球

16問搜狗陳偉:搜狗逼真AI合成主播背后的“熱”技術(shù)

打造新華社「AI合成主播」的“分身術(shù)”為何物?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說