丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給何思思
發(fā)送

0

音頻AI技術(shù)的新路徑:脫離現(xiàn)實+極致擬真

本文作者: 何思思 2023-03-27 11:21
導(dǎo)語:AI不僅能降噪、消除回聲,還能讓人脫離現(xiàn)實,體驗擬真的音視頻世界。

雷峰網(wǎng)訊 近日,實時互動云服務(wù)商聲網(wǎng)發(fā)布了囊括 AI降噪、AI回聲消除、空間音頻、最佳音效在內(nèi)的新一代音頻技術(shù)智能引擎——鳳鳴AI引擎。

通過該引擎,開發(fā)者與企業(yè)可以如搭積木般靈活調(diào)用對應(yīng)組件,并廣泛應(yīng)用在語聊社交、在線K歌、線上會議、游戲競技、虛擬活動等諸多場景,為用戶帶來更純凈、更動聽、更沉浸的語音互動體驗,探索更多營收增長空間。

RTE場景不斷豐富,高音質(zhì)互動需求急需滿足

眾所周知,實時音視頻技術(shù)的發(fā)展帶出了大量的創(chuàng)新場景,從最初的狼人殺、直播連麥到直播電商、在線K歌、互動播客再到現(xiàn)在火熱的元宇宙,在場景的不斷擴展情況下,用戶對實時音視頻體驗的訴求也越來越高。

傳統(tǒng)的RTC概念,從信息傳遞的角度出發(fā),音頻功能僅提供簡單的語音溝通,滿足單一的場景和通話標準,對于音質(zhì)并無太高的需求,也就是所謂的“能夠溝通”。

但是伴隨著實時互動創(chuàng)新場景的涌現(xiàn),用戶對于音頻體驗的需求也產(chǎn)生了量變到質(zhì)變的進化。比如在線K歌、線上會議等場景,用戶的需求早已從能夠溝通到希望“脫離現(xiàn)實”,屏蔽外界干擾,實現(xiàn)純凈溝通;對于元宇宙、虛擬活動、游戲競技等場景,用戶則是希望從簡單溝通實現(xiàn)“極致擬真”的沉浸式體驗。

同時諸如聲網(wǎng)這類音視頻廠商還觀察到,音頻體驗的提升能夠增強平臺用戶的核心體驗。比如,對噪音的抑制能夠提升語聊房用戶活躍度和留存,以及游戲開黑場景的通話時長;回聲消除能顯著提升用戶的在線K歌體驗;而立體、具備空間感的音頻體驗則能提升元宇宙社交、游戲競技、線上會議、虛擬活動等場景中用戶的臨場感和沉浸感。

針對以上痛點和需求,聲網(wǎng)的鳳鳴AI引擎可謂順勢而生。在新一代引擎中,通過AI驅(qū)動的方式,聲網(wǎng)打通了音頻采集、前后處理、云端傳輸、編解碼等鏈路,旨在為用戶打造更純凈、更動聽、更沉浸的語音體驗,在現(xiàn)有實時互動玩法的基礎(chǔ)上錦上添花,賦能行業(yè)開發(fā)者和企業(yè)。

鳳鳴AI引擎的AI能力主要體現(xiàn)在三方面:

  • AI降噪強力抑制100+突發(fā)噪聲,兼顧語音無損傷與混響抑制

想要在“脫離現(xiàn)實”的環(huán)境中辦公、娛樂,屏蔽外界干擾是基礎(chǔ)。相比于傳統(tǒng)的降噪算法,鳳鳴·AI降噪的效果有顯著提升,可以一次性解決100+種突發(fā)性噪聲,比如辦公場景經(jīng)常遇到的敲鍵盤、鼠標點擊、電話鈴聲;家庭環(huán)境中遇到的小孩哭叫、裝修、廚房做飯聲;戶外環(huán)境中的風(fēng)聲、雨聲、汽車噪聲等。

鳳鳴·AI降噪在強降噪的同時還能兼顧高保真,即使在人聲密集場景下,也能實現(xiàn)純凈通話體驗,甚至還實現(xiàn)了在不增加額外運算量的前提下,對遠場語音具有明顯的混響抑制能力。如果用戶在一個房間中距離麥克風(fēng)較遠,這時候?qū)Ψ铰牭降穆曇羰悄:?,若使用了聲網(wǎng)的AI降噪算法,對端也能清晰地聽到該用戶的聲音。

此外,聲網(wǎng)自研的AI推理引擎可以使AI降噪算法在Android、iOS、Mac、Windows、Web等主流平臺以低精度損傷、高性能、低功耗方式運行,使用戶的設(shè)備不卡不燙。經(jīng)數(shù)據(jù)測算,僅開啟鳳鳴·AI降噪功能,相應(yīng)設(shè)備CPU消耗增幅平均值<1%。

  • AI 回聲消除強力抑制非線性回聲,還原本來音質(zhì)

回聲是影響音視頻通話質(zhì)量的主要因素之一,尤其在線上會議、在線K歌、多人連麥等場景中,不僅損害通話質(zhì)量,影響用戶體驗,還可能導(dǎo)致帶寬增加。鳳鳴·AI回聲消除利用算法對環(huán)境中產(chǎn)生的回聲混響進行有效抑制,智能適應(yīng)各類環(huán)境,實現(xiàn)精準音源分離,從混合的近端信號中消除不必要的遠端信號,保留近端人聲發(fā)送到遠端,全面消除回聲,實現(xiàn)高保真音頻體驗。比如,在雙人合唱等在線音樂場景下,AI回聲消除可以使得人聲自然流暢,增益效果顯著。

  • 空間音頻極致擬真,打造“聲臨其境”互動玩法

鳳鳴·空間音頻通過純軟件算法方案,模擬頭部球面區(qū)域立體聲場,利用范圍音頻、人聲模糊、空氣衰減模擬等能力,完美模擬現(xiàn)實聽覺感受。當(dāng)用戶操作相應(yīng)角色在虛擬場景里移動,可以實現(xiàn)根據(jù)虛擬人物的面部朝向、音源朝向、遠近距離與上下高度,呈現(xiàn)不同聲音效果。

空間音頻是元宇宙和游戲這類具備3D場景玩法的最佳搭檔,如狼人殺、虛擬演唱會、虛擬活動等場景,可以有效的增強用戶在線上的互動、聽覺體驗,重構(gòu)用戶在虛擬世界的沉浸感與臨場感。同時,開發(fā)者不必擔(dān)心空間音頻功能對于用戶設(shè)備的影響,據(jù)數(shù)據(jù)測算,開啟鳳鳴·空間音頻功能后,相應(yīng)設(shè)備CPU消耗增幅平均值<0.7%,內(nèi)存消耗增幅平均值<2M。

那么以上音頻能力該如何組合使用?

多年來,聲網(wǎng)匯總梳理語聊領(lǐng)域各類頭部App的音效配置,綜合聲網(wǎng)超過萬億分鐘的用戶音效偏好的數(shù)據(jù)模型,并結(jié)合聲網(wǎng)音頻專家的多年沉淀與研究,能夠為平臺提供針對各種語音場景的最佳音效配置,助力平臺用戶享受行業(yè)頂尖的音效體驗。

目前,已上線的最佳音效包括語聊社交、K歌、游戲陪玩、專業(yè)主播等場景。國內(nèi)某頭部語音社交平臺通過聲網(wǎng)提供的最佳音效配置方案,將空間音頻、美聲、電音等豐富的聲音玩法融入互動中,增強平臺留存和變現(xiàn)能力。

雷峰網(wǎng)了解到,鳳鳴AI引擎目前正在開發(fā)變聲這一功能,用戶將可以體驗20+變聲風(fēng)格,多樣角色扮演花式玩轉(zhuǎn)語聊場景。

聲網(wǎng)算法專家許冉指出,鳳鳴AI引擎代表聲網(wǎng)在 RTC音頻領(lǐng)域針對核心技術(shù)的長期投入和產(chǎn)出,以及聲網(wǎng)基于音頻核心能力衍生出各種復(fù)雜功能和高端效果的決心,未來聲網(wǎng)將基于鳳鳴AI引擎形成新一代RTC音頻解決方案,比如探索更個性化的語音方案、語音超分、co-experiencing場景等。

回看近幾年音頻社交行業(yè)的發(fā)展,仍呈現(xiàn)持續(xù)增長的態(tài)勢,依舊有廣闊的發(fā)展空間。總體來說,音頻社交的主要玩法集中在多人語聊房、1V1語聊、語音播客、游戲開黑等場景。薛達認為,作為用戶之間情感的遞進紐帶,語音結(jié)合虛擬人以及類似ChatGPT這樣的大模型,可能未來會帶來一波新的社交熱潮。

在市場火熱的前景下,音頻技術(shù)的提升對行業(yè)來說可謂如虎添翼。正如薛達提到的,降噪技術(shù)是實現(xiàn)元宇宙空間中用戶體驗的一個必不可少因素,因為一般娛樂場景中都會播放背景音樂,加上人聲和互動音效,如果沒有空間音頻和降噪,那用戶體驗會非常差。

從另一個角度出發(fā),聲音是打造差異化社交玩法的一個重要能力,在社交音頻這個賽道上,大致分為音視頻直播、音頻內(nèi)容生態(tài),以及泛娛樂音頻三個類型,音頻技術(shù)能力的提升可以有效助力業(yè)務(wù)端提升用戶體驗。

不僅國內(nèi)市場火熱,大量出海企業(yè)也押注音頻社交這一賽道且扎堆中東、東南亞市場。緣何會出現(xiàn)這樣的情況?劉武華認為,中東市場這種大R市場天然契合音頻社交的商業(yè)變現(xiàn)形態(tài),而東南亞市場年輕用戶多,社交需求旺盛又熱衷于嘗試新鮮事物,且這兩個市場已有成熟的產(chǎn)品形態(tài)和產(chǎn)業(yè)鏈。

但是從目前來看,東南亞和中東市場目前還處在快速發(fā)展階段,市場機遇大、用戶基數(shù)大,但還沒有絕對的寡頭形成,較之前傳統(tǒng)社交類型來講,音頻社交的留存能力也較高,企業(yè)需要在用戶感興趣的窗口期盡快實現(xiàn)轉(zhuǎn)化。

談到音頻社交的未來趨勢,劉武華表示,社交+游戲、社交+元宇宙、社交+ AIGC 這幾種玩法有不錯的發(fā)展空間和前景。楊帆也認為,元宇宙方向的場景會更受年輕人青睞,另外 AIGC 配合語音轉(zhuǎn)文字等應(yīng)用,應(yīng)該也會帶來一波新AI音頻社交熱潮。

(雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

工業(yè)口編輯

關(guān)注新基建,聚焦工業(yè)互聯(lián)網(wǎng)領(lǐng)域 網(wǎng)絡(luò)安全丨微信:15230152798
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說