0
本文作者: 王悅 | 2024-07-08 16:03 |
7月4日,2024世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(WAIC 2024)正式開幕。今年主題為“以工商促共享 以善治促善智”,圍繞核心技術(shù)、智能終端、應(yīng)用賦能三大板塊,集中展示一批“人工智能+”創(chuàng)新應(yīng)用最新成果。作為當(dāng)下“AI+社交”領(lǐng)域代表,社交平臺(tái)Soul App受邀參展,并重點(diǎn)展出了“數(shù)字分身”“狼人魅影”和“異世界回響”等AI能力落地的新功能、新場景。
Soul App CTO陶明表示,“Soul圍繞社交場景中用戶的核心需求布局‘AIGC+社交’,開展語言、語音、視覺等多模態(tài)大模型自研工作的同時(shí),快速推動(dòng)大模型在社交場景的應(yīng)用。在‘模應(yīng)一體’方向下,致力于在社交體驗(yàn)提升、AI社交、AI游戲等多個(gè)維度探索 AI Native應(yīng)用的理想形態(tài)?!?/p>
三大新功能亮相,集中展現(xiàn)多模態(tài)互動(dòng)能力
在WAIC 2024活動(dòng)現(xiàn)場,Soul App以“科技無界,心與智連”為主題呈現(xiàn)展臺(tái),并重點(diǎn)展示了“數(shù)字分身”“狼人魅影”和“異世界回響”三個(gè)新功能/場景,這也是Soul在探索“AIGC+社交”場景深度融合的最新實(shí)踐。
其中,“數(shù)字分身”致力于幫助用戶打造虛擬數(shù)字人,實(shí)現(xiàn)高效社交。用戶可以直接授權(quán)平臺(tái)基于聊天記錄、發(fā)帖內(nèi)容,或者以自定義方式,設(shè)置數(shù)字分身的形象和特征,在人設(shè)、圖像、聲音等豐富維度上,使數(shù)字分身達(dá)到最大程度復(fù)刻真人的效果。
堅(jiān)持興趣社交,Soul平臺(tái)不支持使用真人頭像,用戶通過捏臉系統(tǒng)為自身打造虛擬形象在數(shù)字空間進(jìn)行互動(dòng)。如今,具備私聊輔助能力的“數(shù)字分身”上線,不僅可以幫助用戶打造更理想的“另一個(gè)自己”,也能實(shí)現(xiàn)更個(gè)性化、更千人千面的智能回復(fù)推薦,幫助用戶進(jìn)行社交破冰,在助力人設(shè)搭建和認(rèn)知決策中,提升社交溝通效率。
而游戲互動(dòng)場景“狼人魅影”中引入的AI 智能體,則集中展現(xiàn)了大模型的多模態(tài)互動(dòng)能力。在該場景中,用戶可以選擇任意的AI+真人游戲組合模式開啟互動(dòng),與具備自主推理、發(fā)言、“偽裝”的AI一起進(jìn)行真實(shí)游戲?qū)Q。而“AI游戲陪玩師”也能幫助玩家快速適應(yīng)門檻相對(duì)較高、玩法復(fù)雜的狼人游戲,輕松開啟交流互動(dòng),在更沉浸、即時(shí)的交互中獲得趣味體驗(yàn)。
在站內(nèi)場景融入AI能力的同時(shí),Soul還上線了獨(dú)立新產(chǎn)品“異世界回響”。該產(chǎn)品定位為AI社交平臺(tái),用戶可與虛擬角色進(jìn)行沉浸式即時(shí)交流,還可根據(jù)喜好自定義角色人設(shè),實(shí)現(xiàn)不同的對(duì)話風(fēng)格,人物的形象可通過文字描述或上傳心儀的圖片生成,平臺(tái)提供多種基礎(chǔ)音色,用戶可自行創(chuàng)建、融合出屬于該角色的專屬聲音,實(shí)現(xiàn)多模態(tài)互動(dòng)。
“模應(yīng)一體”實(shí)踐,從社交提效到人機(jī)互動(dòng)新體驗(yàn)
在活動(dòng)現(xiàn)場,觀眾可體驗(yàn)與“異世界回響”中的虛擬角色進(jìn)行實(shí)時(shí)通話?!皳芡ā彪娫捄螅邆漕愓嫒艘羯奶摂M角色實(shí)時(shí)回應(yīng)對(duì)話,并自然地進(jìn)行交流互動(dòng),實(shí)現(xiàn)了即時(shí)的“跨次元”通話。
在這背后是Soul最新升級(jí)的語音大模型。事實(shí)上,作為較早開始思考將AI應(yīng)用于社交領(lǐng)域的平臺(tái),Soul在2016年上線后,便開始了圍繞AI的底層技術(shù)和應(yīng)用落地的探索。
例如,平臺(tái)通過推出基于用戶站內(nèi)全場景畫像的智能推薦引擎“靈犀”,以去中心化機(jī)制幫助用戶找到興趣相同的人,平等地實(shí)現(xiàn)多元關(guān)系建立和即時(shí)的情緒反饋,切實(shí)提升用戶體驗(yàn)。此外,平臺(tái)的NAWA引擎能夠幫助用戶打造個(gè)性化的虛擬形象和場景,實(shí)現(xiàn)沉浸式互動(dòng)。
2020年,Soul啟動(dòng)了對(duì)AIGC的系統(tǒng)研發(fā)工作,并在智能對(duì)話、圖像生成、語音技術(shù)(如語音生成、音樂生成、語音動(dòng)畫等)等方面擁有了前沿能力積累。2023年,Soul上線自研垂類語言大模型Soul X,該模型具備prompt驅(qū)動(dòng)、條件可控生成、上下文理解、多模態(tài)理解等能力,能夠?qū)崿F(xiàn)有情感、有溫度的交互。
2024年,Soul語音生成大模型上線,同時(shí)自研語音大模型正式升級(jí)?,F(xiàn)階段,Soul語音大模型包括了語音生成大模型、語音識(shí)別大模型、語音對(duì)話大模型、音樂生成大模型等,可支持真實(shí)音色生成、語音DIY、多語言切換、多情感擬真人實(shí)時(shí)對(duì)話等能力。
Soul在語言、語音、視覺等方向自研大模型的同時(shí),實(shí)現(xiàn)的多模態(tài)互動(dòng)能力也快速融入到包括Soul “AI茍蛋”、狼人魅影、數(shù)字分身、異世界回響等具體的應(yīng)用場景中,進(jìn)一步實(shí)現(xiàn)交互效率、交互質(zhì)量、交互體驗(yàn)、交互對(duì)象等多方面的提升和拓展,也受到了用戶的歡迎和認(rèn)可。
數(shù)據(jù)顯示,用戶平均每天會(huì)給AI茍蛋發(fā)送超過70條消息,互動(dòng)平均時(shí)長超過30分鐘。此外,AI茍蛋也會(huì)經(jīng)常更新相關(guān)話題的瞬間,和用戶互動(dòng),收到大量用戶的點(diǎn)贊、評(píng)論和轉(zhuǎn)發(fā)。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng)
“用戶愿意持續(xù)與AI進(jìn)行對(duì)話交互,這已經(jīng)證明了對(duì)平臺(tái)提供體驗(yàn)的認(rèn)可,也表明了Soul堅(jiān)持‘模應(yīng)一體’方向的可持續(xù)性。”Soul App CTO陶明表示,AI對(duì)于Soul就像是為釘子找到了合適的錘子,“Soul是當(dāng)下最受年輕人歡迎的互聯(lián)網(wǎng)平臺(tái)之一,是天然的應(yīng)用場景和流量入口,我們的優(yōu)勢(shì)便是能夠在場景中發(fā)現(xiàn)用戶實(shí)際需求,大模型落地應(yīng)用也能第一時(shí)間面向用戶獲得反饋,快速驗(yàn)證、迭代,這也確保了Soul在深化‘AIGC+社交’戰(zhàn)略中的不斷前進(jìn)?!?/p>
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。