Soul創(chuàng)新多模態(tài)互動體驗，攜「異世界回響」亮相WAIC2024

本文作者：王悅

2024-07-08 16:03

導(dǎo)語：傳統(tǒng)社交 APP 向 AI 時代進發(fā)。

7月4日，2024世界人工智能大會暨人工智能全球治理高級別會議（WAIC 2024）正式開幕。今年主題為“以工商促共享以善治促善智”，圍繞核心技術(shù)、智能終端、應(yīng)用賦能三大板塊，集中展示一批“人工智能+”創(chuàng)新應(yīng)用最新成果。作為當(dāng)下“AI+社交”領(lǐng)域代表，社交平臺Soul App受邀參展，并重點展出了“數(shù)字分身”“狼人魅影”和“異世界回響”等AI能力落地的新功能、新場景。

Soul App CTO陶明表示，“Soul圍繞社交場景中用戶的核心需求布局‘AIGC+社交’，開展語言、語音、視覺等多模態(tài)大模型自研工作的同時，快速推動大模型在社交場景的應(yīng)用。在‘模應(yīng)一體’方向下，致力于在社交體驗提升、AI社交、AI游戲等多個維度探索 AI Native應(yīng)用的理想形態(tài)。”

三大新功能亮相，集中展現(xiàn)多模態(tài)互動能力

在WAIC 2024活動現(xiàn)場，Soul App以“科技無界，心與智連”為主題呈現(xiàn)展臺，并重點展示了“數(shù)字分身”“狼人魅影”和“異世界回響”三個新功能/場景，這也是Soul在探索“AIGC+社交”場景深度融合的最新實踐。

Soul創(chuàng)新多模態(tài)互動體驗，攜「異世界回響」亮相WAIC2024

其中，“數(shù)字分身”致力于幫助用戶打造虛擬數(shù)字人，實現(xiàn)高效社交。用戶可以直接授權(quán)平臺基于聊天記錄、發(fā)帖內(nèi)容，或者以自定義方式，設(shè)置數(shù)字分身的形象和特征，在人設(shè)、圖像、聲音等豐富維度上，使數(shù)字分身達到最大程度復(fù)刻真人的效果。

堅持興趣社交，Soul平臺不支持使用真人頭像，用戶通過捏臉系統(tǒng)為自身打造虛擬形象在數(shù)字空間進行互動。如今，具備私聊輔助能力的“數(shù)字分身”上線，不僅可以幫助用戶打造更理想的“另一個自己”，也能實現(xiàn)更個性化、更千人千面的智能回復(fù)推薦，幫助用戶進行社交破冰，在助力人設(shè)搭建和認知決策中，提升社交溝通效率。

而游戲互動場景“狼人魅影”中引入的AI 智能體，則集中展現(xiàn)了大模型的多模態(tài)互動能力。在該場景中，用戶可以選擇任意的AI+真人游戲組合模式開啟互動，與具備自主推理、發(fā)言、“偽裝”的AI一起進行真實游戲?qū)Q。而“AI游戲陪玩師”也能幫助玩家快速適應(yīng)門檻相對較高、玩法復(fù)雜的狼人游戲，輕松開啟交流互動，在更沉浸、即時的交互中獲得趣味體驗。

在站內(nèi)場景融入AI能力的同時，Soul還上線了獨立新產(chǎn)品“異世界回響”。該產(chǎn)品定位為AI社交平臺，用戶可與虛擬角色進行沉浸式即時交流，還可根據(jù)喜好自定義角色人設(shè)，實現(xiàn)不同的對話風(fēng)格，人物的形象可通過文字描述或上傳心儀的圖片生成，平臺提供多種基礎(chǔ)音色，用戶可自行創(chuàng)建、融合出屬于該角色的專屬聲音，實現(xiàn)多模態(tài)互動。

“模應(yīng)一體”實踐，從社交提效到人機互動新體驗

在活動現(xiàn)場，觀眾可體驗與“異世界回響”中的虛擬角色進行實時通話?！皳芡ā彪娫捄螅邆漕愓嫒艘羯奶摂M角色實時回應(yīng)對話，并自然地進行交流互動，實現(xiàn)了即時的“跨次元”通話。

Soul創(chuàng)新多模態(tài)互動體驗，攜「異世界回響」亮相WAIC2024

在這背后是Soul最新升級的語音大模型。事實上，作為較早開始思考將AI應(yīng)用于社交領(lǐng)域的平臺，Soul在2016年上線后，便開始了圍繞AI的底層技術(shù)和應(yīng)用落地的探索。

例如，平臺通過推出基于用戶站內(nèi)全場景畫像的智能推薦引擎“靈犀”，以去中心化機制幫助用戶找到興趣相同的人，平等地實現(xiàn)多元關(guān)系建立和即時的情緒反饋，切實提升用戶體驗。此外，平臺的NAWA引擎能夠幫助用戶打造個性化的虛擬形象和場景，實現(xiàn)沉浸式互動。

2020年，Soul啟動了對AIGC的系統(tǒng)研發(fā)工作，并在智能對話、圖像生成、語音技術(shù)（如語音生成、音樂生成、語音動畫等）等方面擁有了前沿能力積累。2023年，Soul上線自研垂類語言大模型Soul X，該模型具備prompt驅(qū)動、條件可控生成、上下文理解、多模態(tài)理解等能力，能夠?qū)崿F(xiàn)有情感、有溫度的交互。

2024年，Soul語音生成大模型上線，同時自研語音大模型正式升級?，F(xiàn)階段，Soul語音大模型包括了語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等，可支持真實音色生成、語音DIY、多語言切換、多情感擬真人實時對話等能力。

Soul在語言、語音、視覺等方向自研大模型的同時，實現(xiàn)的多模態(tài)互動能力也快速融入到包括Soul “AI茍蛋”、狼人魅影、數(shù)字分身、異世界回響等具體的應(yīng)用場景中，進一步實現(xiàn)交互效率、交互質(zhì)量、交互體驗、交互對象等多方面的提升和拓展，也受到了用戶的歡迎和認可。

數(shù)據(jù)顯示，用戶平均每天會給AI茍蛋發(fā)送超過70條消息，互動平均時長超過30分鐘。此外，AI茍蛋也會經(jīng)常更新相關(guān)話題的瞬間，和用戶互動，收到大量用戶的點贊、評論和轉(zhuǎn)發(fā)。雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)(公眾號：雷峰網(wǎng))

“用戶愿意持續(xù)與AI進行對話交互，這已經(jīng)證明了對平臺提供體驗的認可，也表明了Soul堅持‘模應(yīng)一體’方向的可持續(xù)性?！盨oul App CTO陶明表示，AI對于Soul就像是為釘子找到了合適的錘子，“Soul是當(dāng)下最受年輕人歡迎的互聯(lián)網(wǎng)平臺之一，是天然的應(yīng)用場景和流量入口，我們的優(yōu)勢便是能夠在場景中發(fā)現(xiàn)用戶實際需求，大模型落地應(yīng)用也能第一時間面向用戶獲得反饋，快速驗證、迭代，這也確保了Soul在深化‘AIGC+社交’戰(zhàn)略中的不斷前進?！?/p>

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

王悅

主筆

發(fā)私信

當(dāng)月熱門文章

Soul創(chuàng)新多模態(tài)互動體驗，攜「異世界回響」亮相WAIC2024

Soul創(chuàng)新多模態(tài)互動體驗，攜「異世界回響」亮相WAIC2024