0
本文作者: 吳優(yōu) | 2025-01-31 19:11 |
AGI時(shí)代,擁有大模型基座的字節(jié)重新做硬件,故事的走向會(huì)有何不同?
Ola Friend,豆包的硬件入口
2024年10月初,字節(jié)發(fā)布的豆包AI耳機(jī)Ola Friend曾掀起一陣熱議。
Ola Friend售價(jià)1199元,無(wú)需打開(kāi)手機(jī)就能通過(guò)語(yǔ)音喚起豆包進(jìn)行對(duì)話,無(wú)論是信息查詢和旅游出行,還是口語(yǔ)練習(xí)和情感交流,都能給出及時(shí)的反饋,很像一位賽博好友。
4個(gè)月過(guò)去了,Ola Friend在京東、淘寶平臺(tái)上的銷量分別為1w+和6K+,累計(jì)銷量不到Airpods季度銷量的千分之一。目前字節(jié)AI耳機(jī)的話題熱度顯然被AI百鏡大戰(zhàn)蓋過(guò),比起耳機(jī),大家似乎更關(guān)注AI眼鏡進(jìn)度如何。
Ola Friend
確實(shí)與AI眼鏡相比,AI耳機(jī)是更加小眾的AI硬件,小眾到不足以各大電商平臺(tái)為其單獨(dú)設(shè)置品類,業(yè)界對(duì)AI耳機(jī)也沒(méi)有十分明確的定義。
聲智科技產(chǎn)品副總裁黃赟賀在雷峰網(wǎng)連線直播時(shí)解釋了AI耳機(jī)與傳統(tǒng)TWS、OWS耳機(jī)的不同之處,這可能是感知AI耳機(jī)比較直觀的方式。
“AI耳機(jī)進(jìn)一步提升了用戶體驗(yàn)的智能化及豐富性。從技術(shù)層面看,AI耳機(jī)需要人工智能與聲學(xué)算法的交叉技術(shù)作為底座,即要能夠提供復(fù)雜場(chǎng)景內(nèi)高質(zhì)量的聲音傳輸,還要具備低延時(shí)的語(yǔ)音交互的能力,實(shí)現(xiàn)從圖形界面交互到語(yǔ)音交互的人機(jī)交互形態(tài)升級(jí)。從功能體驗(yàn)看,搭載AI智能體的AI耳機(jī)服務(wù)場(chǎng)景更多元,包含教育、工作、娛樂(lè)、生活等領(lǐng)域的‘管家式’服務(wù),提供更便捷的信息獲取方式。對(duì)于追求科技感和體驗(yàn)升級(jí)的消費(fèi)者而言,AI耳機(jī)無(wú)疑提供了更前沿的選擇?!?/p>
Ola Friend除了在功能上更偏向生活助理的角色,其他方面符合黃赟賀對(duì)AI耳機(jī)的定義。
但在IKKO聯(lián)合創(chuàng)始人Echo Chan看來(lái),真正的AI硬件應(yīng)該有獨(dú)立的載體和算力,即可以脫離手機(jī)APP獨(dú)立運(yùn)行,而Ola Friend本質(zhì)上是通過(guò)手機(jī)APP完成所有功能,嚴(yán)格來(lái)講不屬于AI耳機(jī)。
作為獨(dú)立智能體的擁護(hù)派,往往會(huì)給耳機(jī)倉(cāng)配備智能屏且開(kāi)發(fā)了一套自有操作系統(tǒng),即不連接手機(jī)APP耳機(jī)也能正常運(yùn)行。既存在旨在幫助用戶提高學(xué)習(xí)以及生產(chǎn)效率,實(shí)現(xiàn)會(huì)議錄音和轉(zhuǎn)寫等AI輔助功能的產(chǎn)品,例如IKKO;也存在想要實(shí)現(xiàn)AI生活助理的愿景,包括存儲(chǔ)用戶即時(shí)輸入的語(yǔ)音信息并發(fā)出提醒,幫助用戶構(gòu)建外部大腦,與豆包耳機(jī)的功能更加接近的生活助理類AI的產(chǎn)品,例如WISHEE。
信奉“最先愿意為新技術(shù)服務(wù)的人群一定愿意為生產(chǎn)力工具付費(fèi)”的Echo Chan不認(rèn)同AI耳機(jī)作為生活助理暫時(shí)能夠?yàn)橛脩籼峁┒啻髱椭?,但他肯定字?jié)發(fā)布AI耳機(jī)的價(jià)值:
“字節(jié)推出的這款產(chǎn)品擴(kuò)大了大家對(duì)AI耳機(jī)的認(rèn)知,且將價(jià)格定位在千元以上,已經(jīng)產(chǎn)生品牌溢價(jià),這對(duì)行業(yè)來(lái)說(shuō)是積極的信號(hào)”,Echo Chan說(shuō)到。
在接受雷峰網(wǎng)采訪的幾周前,IKKO剛剛結(jié)束一場(chǎng)與小紅書的直播合作,在直播15分鐘完成100萬(wàn)gmv目標(biāo)。談及比豆包耳機(jī)更高的定價(jià),Echo Chan表示前期打好用戶基礎(chǔ)非常重要,高價(jià)能夠?yàn)楫a(chǎn)品打下很好的用戶基礎(chǔ),與用戶之間的互動(dòng)能推動(dòng)更加高效的產(chǎn)品迭代。
Echo Chan向雷峰網(wǎng)透露,2024年IKKO的出貨量大概達(dá)到6000萬(wàn)營(yíng)業(yè)額,主要銷往美國(guó)和歐洲,目前每個(gè)月的復(fù)合增長(zhǎng)率達(dá)到30%以上,按照目前的增長(zhǎng)趨勢(shì)不下滑且產(chǎn)能充足的情況下,2025年的營(yíng)業(yè)額能夠達(dá)到1億至2億。庫(kù)存不足是IKKO目前所面臨的最大難題,生產(chǎn)效率有待進(jìn)一步提升。
IKKO可以是獨(dú)立設(shè)備,豆包耳機(jī)離不開(kāi)豆包APP,“只是作為鏈接豆包大模型的入口”也是Ola Friend被業(yè)界詬病最多的地方,認(rèn)為這只是一次TWS耳機(jī)與語(yǔ)言大模型的粗糙結(jié)合,字節(jié)拿著錘子找釘子,在為豆包大模型找應(yīng)用場(chǎng)景,Ola Friend沒(méi)有很強(qiáng)的不可替代性。
雷峰網(wǎng)了解到,字節(jié)曾與不止兩家耳機(jī)公司洽談合作事宜,條件是只接入豆包一家語(yǔ)言大模型,不少潛在合作對(duì)象認(rèn)為豆包大模型和ChatGPT還有一定差距,且不愿意與豆包大模型深度綁定,因此拒絕了與字節(jié)的合作。
但Oladance創(chuàng)始人李浩乾把耳機(jī)這一可穿戴設(shè)備當(dāng)做入口的思路卻意外與字節(jié)契合。李浩乾曾在2021年接受雷峰網(wǎng)采訪時(shí)提出,元宇宙主要有兩個(gè)入口場(chǎng)景,在家和辦公室依托于重設(shè)備,在外通勤依托輕設(shè)備,耳機(jī)瞄準(zhǔn)的是通勤場(chǎng)景,Oladance希望在TWS上做突破,建立鏈接元宇宙的入口。
當(dāng)時(shí)ChatGPT3.5尚未發(fā)布,元宇宙和Web3.0還是當(dāng)紅概念,TWS耳機(jī)的競(jìng)爭(zhēng)已十分激烈,除了骨傳導(dǎo)和助聽(tīng)器,業(yè)界對(duì)TWS耳機(jī)想象乏力。李浩乾的觀點(diǎn)卻讓業(yè)界耳目一新,在新消費(fèi)資本市場(chǎng)最低迷的時(shí)候,李浩乾的電話被投資人打爆。
沒(méi)能等到元宇宙,先等來(lái)了字節(jié)的豆包大模型。今年4月,字節(jié)跳動(dòng)以3-5億元的價(jià)格收購(gòu)Oladance,6個(gè)月的時(shí)間,Oladance作為人機(jī)語(yǔ)音交互的入口,完成了向AI耳機(jī)的華麗轉(zhuǎn)身。
是AI重要還是耳機(jī)重要?
追問(wèn)字節(jié)能否做好一款A(yù)I耳機(jī),本質(zhì)上是在追問(wèn)AI硬件到底是AI本身的能力更重要還是硬件能力更重要。
許多AI耳機(jī)賽道的玩家在同雷峰網(wǎng)的交流中表達(dá)了同樣的觀點(diǎn):不認(rèn)為自己是一家耳機(jī)公司,只是在開(kāi)發(fā)AI硬件道路上恰好選中耳機(jī)這一形態(tài)。
在第一波AI浪潮中創(chuàng)辦時(shí)空壺的田力對(duì)此具有發(fā)言權(quán),其W系列翻譯耳機(jī)保留了TWS耳機(jī)的產(chǎn)品形態(tài),但卻舍棄了最核心的聽(tīng)音樂(lè)功能,更早期的產(chǎn)品甚至不能接電話。
當(dāng)時(shí)田力剛剛離開(kāi)一家機(jī)器人硬件公司,想用AI技術(shù)本身做點(diǎn)有價(jià)值的事情。田力認(rèn)為,彼時(shí)AI技術(shù)雖然很發(fā)達(dá),但還缺少與普通人的需求鏈接。恰逢父母海外旅游時(shí)遇到交流障礙,在田力看來(lái),盡管語(yǔ)音識(shí)別與機(jī)器翻譯的技術(shù)已經(jīng)較為成熟,但人們出國(guó)時(shí)依舊沒(méi)有意識(shí)到可以利用該技術(shù)隨時(shí)自由溝通,這表明AI技術(shù)與現(xiàn)實(shí)需求仍存在距離。
在感知到AI領(lǐng)域的市場(chǎng)機(jī)遇及行業(yè)中潛存的問(wèn)題后,2016年田力迅速組建團(tuán)隊(duì),試圖以“AI+翻譯”構(gòu)建跨語(yǔ)言溝通的多樣場(chǎng)景。身為科幻迷的田力從《銀河系漫游指南》中巴別魚的設(shè)想中獲得靈感,他認(rèn)為在跨語(yǔ)言交流中,翻譯不是要解決的核心問(wèn)題,而是交流的沉浸感。
從技術(shù)實(shí)現(xiàn)的角度,翻譯耳機(jī)要求對(duì)話中的雙方都擁有相同的耳機(jī)設(shè)備,只有在共享一副支持雙通道耳機(jī)的情況下才能實(shí)現(xiàn)這一場(chǎng)景。早期的TWS耳機(jī)采用單通道互聯(lián)技術(shù),手機(jī)發(fā)射藍(lán)牙信號(hào)時(shí)主耳先收到信號(hào),再將信號(hào)發(fā)送給副耳,會(huì)出現(xiàn)信號(hào)不同步的情況。另外,如果增加聽(tīng)音樂(lè)的功能就要犧牲翻譯所需要的算力,與田力所期望的沉浸感相悖。
他認(rèn)為既然時(shí)空壺要解決的核心問(wèn)題是跨語(yǔ)言交流,就不應(yīng)該給消費(fèi)者“購(gòu)買一副附帶翻譯功能耳機(jī)”的預(yù)期,田力團(tuán)隊(duì)重新撰寫部分藍(lán)牙協(xié)議,摒棄音樂(lè)播放功能,一副形似耳機(jī)實(shí)則是AI翻譯設(shè)備由此而來(lái)。
另一AI耳機(jī)品牌WISHEE聯(lián)合創(chuàng)始人兼董事長(zhǎng)張博在與雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))的交流過(guò)程中也多次提及WISHEE想要做的是獨(dú)立的AI智能體而不是TWS耳機(jī)。
這源于張博和團(tuán)隊(duì)其他同事此前的工作經(jīng)歷。張博在參與WISHEE創(chuàng)辦之前是OPPO語(yǔ)音助手項(xiàng)目中的一員,見(jiàn)證過(guò)OPPO語(yǔ)音助手從0到1的搭建。在參與手機(jī)語(yǔ)音助手的項(xiàng)目過(guò)程中,張博發(fā)現(xiàn),手機(jī)語(yǔ)音助手的本質(zhì)是在和用戶的對(duì)話框模式使用習(xí)慣打架,打贏的概率微乎其微。
2011年,喬布斯推出Siri不久后離世,給蘋果留下了Siri到底是做搜索引擎還是做智能助手的世紀(jì)難題,后來(lái)Siri團(tuán)隊(duì)核心成員離開(kāi),Siri的發(fā)展更是撲朔迷離。張博堅(jiān)信喬布斯對(duì)Siri有更宏大的設(shè)想,重建可以直接進(jìn)行語(yǔ)音交互調(diào)用的獨(dú)立系統(tǒng)或許是未來(lái)方向之一。
建立在這一構(gòu)想之上,WISHEE推出了一款A(yù)I智能體產(chǎn)品AiEar并于2024年618正式售賣,售價(jià)1999元。從用戶體驗(yàn)來(lái)看,AiEar比傳統(tǒng)TWS多了一款植入耳機(jī)艙表面的智能屏幕,擁有獨(dú)立的OS系統(tǒng),可以插入esim卡實(shí)現(xiàn)語(yǔ)音通話,也可以作為移動(dòng)wifi供其他移動(dòng)設(shè)備連網(wǎng)使用。
電影《Her》中的AI智能體設(shè)備
WISHEE的市場(chǎng)負(fù)責(zé)人向雷峰網(wǎng)展示了AiEar的其他功能,包括敲木魚小游戲、電子寵物、番茄時(shí)鐘、GPS導(dǎo)航、語(yǔ)音記憶等功能,談及對(duì)AiEar未來(lái)的想象,這位負(fù)責(zé)人情緒飽滿,表示還有更多的功能正在開(kāi)發(fā)中。在加入WISHEE團(tuán)隊(duì)之前,WISHEE的市場(chǎng)負(fù)責(zé)人是一家公關(guān)公司的老板,服務(wù)過(guò)眾多手機(jī)、耳機(jī)品牌,如今他幾乎關(guān)掉了自己公關(guān)公司的業(yè)務(wù),全盤押注WISHEE。
據(jù)他透露,目前有一些考研黨在使用AiEar,還有一部分不希望小朋友玩游戲的家長(zhǎng)會(huì)買來(lái)送給孩子,WISHEE目前主要面向國(guó)內(nèi)市場(chǎng),正在與海外眾籌平臺(tái)洽談?dòng)?jì)劃出海。
基于過(guò)往在AI聲學(xué)領(lǐng)域的經(jīng)驗(yàn)積累,科大訊飛旗下的未來(lái)智能是少有承認(rèn)自己在做AI耳機(jī)的公司,且在產(chǎn)品研發(fā)的過(guò)程中愈發(fā)感受到硬件能力的重要性。
未來(lái)智能CPO柳達(dá)本身也是一名耳機(jī)重度使用者。未來(lái)智能還沒(méi)成立之前,柳達(dá)在科大訊飛消費(fèi)者BG做云助手項(xiàng)目,每天的工作被大量的會(huì)議與信息充斥,耳機(jī)成為柳達(dá)最親密的工作伙伴。在使用TWS耳機(jī)的過(guò)程中,柳達(dá)愈發(fā)覺(jué)得傳統(tǒng)TWS耳機(jī)只滿足了消費(fèi)者最基本的需求,對(duì)于信息輸入大于輸出的用戶來(lái)講,完全沒(méi)有發(fā)揮其作為工具的潛力,完全可以基于TWS耳機(jī)針對(duì)會(huì)議錄音和紀(jì)要等功能進(jìn)一步改善。
柳達(dá)向雷峰網(wǎng)表示,早期組建團(tuán)隊(duì)時(shí)低估了硬件的重要性,團(tuán)隊(duì)軟件成員數(shù)量遠(yuǎn)大于硬件人員,直到第一代產(chǎn)品發(fā)布,收到來(lái)自消費(fèi)者的反饋認(rèn)為與同等價(jià)位的TWS耳機(jī)相比,訊飛AI會(huì)議耳機(jī)作為硬件產(chǎn)品不達(dá)預(yù)期,后來(lái)及時(shí)調(diào)整提高硬件人員的占比,耳機(jī)品質(zhì)才得以改善。
一副兼具TWS基本能力的AI耳機(jī)在硬件層面需要解決來(lái)自續(xù)航能力、聲學(xué)設(shè)計(jì)、硬件堆疊與散熱等方面的技術(shù)難題。TWS耳機(jī)要求體積小,能夠容納的電池體積有限,對(duì)續(xù)航能力構(gòu)成挑戰(zhàn),尤其是主動(dòng)降噪式耳機(jī)需要多顆麥克風(fēng),如果要實(shí)現(xiàn)本地存儲(chǔ)功能還需要額外增加閃存芯片,進(jìn)一步壓縮電池空間。AI功能的增加和運(yùn)行會(huì)消耗更多電量并產(chǎn)生熱量,例如語(yǔ)音識(shí)別、語(yǔ)義理解、語(yǔ)音增強(qiáng)等功能的實(shí)現(xiàn)都需要持續(xù)供電。
少數(shù)高端TWS耳機(jī)有能力采用SiP封裝節(jié)省空間,但這一封裝方式技術(shù)難度大且價(jià)格昂貴,也會(huì)增加產(chǎn)品成本。
“可以想象成是把聰明的大腦裝進(jìn)小盒子里,需要非常流暢、精準(zhǔn)和省電”,柳達(dá)如此形容。
通過(guò)不斷增強(qiáng)硬件隊(duì)伍和幾代耳機(jī)的研發(fā)升級(jí),未來(lái)智能推出的訊飛AI會(huì)議耳機(jī)iFLYBUDS PRO2在續(xù)航方面已經(jīng)做到單次使用長(zhǎng)達(dá)9小時(shí),搭配充電盒可延長(zhǎng)至36小時(shí)。在去年雙十一上,訊飛AI會(huì)議耳機(jī)的銷售額在天貓、抖音兩大平臺(tái)的入耳式藍(lán)牙耳機(jī)大類目中銷售額排名第一,在京東AI耳機(jī)品類占據(jù)榜首。
回到豆包AI耳機(jī)本身,字節(jié)坐擁AI基礎(chǔ)設(shè)施,至少與需要調(diào)用非自家大模型API的創(chuàng)業(yè)公司相比,豆包AI耳機(jī)將最核心的數(shù)據(jù)資產(chǎn)始終握在自己手中,但另一方面與某一模型深度綁定也意味著前期需要經(jīng)歷漫長(zhǎng)的磨合期和迭代期,與可以同時(shí)接入多家大模型的中小廠商相比,前期語(yǔ)音交互的準(zhǔn)確率不占優(yōu)勢(shì)。
與此同時(shí),大廠做AI硬件也有決策慢、流程長(zhǎng)的問(wèn)題。一位業(yè)內(nèi)人士告訴雷峰網(wǎng),目前還沒(méi)有聽(tīng)聞大廠All in AI硬件的消息,基本都是中小廠All in,大廠內(nèi)部審批及決策流程非常漫長(zhǎng),需要結(jié)合公司主營(yíng)業(yè)務(wù)拓展賽道,預(yù)計(jì)25年下半年才會(huì)有大廠正式入局AI硬件,留給中小廠的窗口期還有半年至一年。有關(guān)大廠AI硬件的最新動(dòng)態(tài),歡迎添加本文作者微信Yolanda_Zuu爆料。
Echo Chan也表示,預(yù)計(jì)25年下半年IKKO才會(huì)遇到真正的競(jìng)爭(zhēng)對(duì)手,且更有可能來(lái)自手機(jī)大廠而非互聯(lián)網(wǎng)大廠,因?yàn)槭謾C(jī)廠商在硬件供應(yīng)鏈方面比互聯(lián)網(wǎng)大廠更強(qiáng)勢(shì)。
FoloToy創(chuàng)始人王樂(lè)認(rèn)為只有高集成度才能提升系統(tǒng)級(jí)的體驗(yàn),手機(jī)廠商這方面占據(jù)優(yōu)勢(shì)。
以字節(jié)為首的互聯(lián)網(wǎng)大廠做AI硬件具備人才與資金優(yōu)勢(shì)。關(guān)注AI硬件創(chuàng)業(yè)的真格基金投資經(jīng)理李鈺看好互聯(lián)網(wǎng)大廠的軟件產(chǎn)品經(jīng)理創(chuàng)業(yè)做AI硬件,如果再找到懂供應(yīng)鏈和硬件生產(chǎn)的專家一起組建團(tuán)隊(duì),會(huì)是一個(gè)好標(biāo)的?!耙?yàn)橛布臉I(yè)者只擅長(zhǎng)做標(biāo)準(zhǔn)化,售后受限,不適合主導(dǎo)這件事,而軟件是需要持續(xù)迭代?!?/p>
王樂(lè)也表示,深圳做硬件和方案的公司轉(zhuǎn)型做AI的難點(diǎn)在于之前做方案的毛利很低,利潤(rùn)不足以支撐公司招軟件和AI方面的人才,成本挑戰(zhàn)大。
下一代爆款移動(dòng)設(shè)備誕生前夜,AI耳機(jī)只是過(guò)渡產(chǎn)品?
“AI是技術(shù)基座,耳機(jī)本身是交互載體,各占一半,但最終服務(wù)的是人,用戶體驗(yàn)才是最重要的”,田力認(rèn)為找到能夠?yàn)橛脩籼峁┓?wù)的切入點(diǎn)比討論AI重要還是耳機(jī)重要更有意義。
無(wú)論是否承認(rèn)自己是一家AI耳機(jī)公司,還是將自己?jiǎn)渭兌x為AI硬件公司,這些選擇將AI與耳機(jī)產(chǎn)品形態(tài)結(jié)合的公司無(wú)一例外都認(rèn)同從供應(yīng)鏈成熟度以及AI語(yǔ)音交互形式來(lái)看,現(xiàn)階段耳機(jī)是比眼鏡更能承載AI能力的硬件載體。
目前市面上的AI硬件產(chǎn)品大致可以分為兩大類,一類是在傳統(tǒng)智能硬件的基礎(chǔ)上做生成式AI的加持,例如在眼鏡、耳機(jī)上增加AI功能,不改變?cè)械漠a(chǎn)品形態(tài);另一類是AI重塑產(chǎn)品形態(tài),創(chuàng)造新的用戶需求和應(yīng)用場(chǎng)景,例如一年前爆火的AI Pin和Rabbit。
第一類的支持者認(rèn)為從人類技術(shù)發(fā)展史來(lái)看,產(chǎn)品形態(tài)基本沒(méi)有太多變化,手表、手機(jī)、耳機(jī)等幾十年前就已經(jīng)存在,這證明用戶很難被教育,AI硬件需要在原本不夠智能化的地方發(fā)力,而不是創(chuàng)造全新且無(wú)用的東西再思考如何智能化。
第二類的支持者一部分認(rèn)為AI的能力強(qiáng)大到需要全新的產(chǎn)品形態(tài)來(lái)承載,另一部分集中在研發(fā)為人類提供陪伴和情緒價(jià)值的AI玩具,因娛樂(lè)性和高容錯(cuò)性也已經(jīng)有一定的市場(chǎng)。歡迎添加本文作者Yolanda_Zuu交流討論中國(guó)AI硬件江湖。
AI耳機(jī)更像是介于第一類和第二類之間的產(chǎn)品。耳機(jī)本身發(fā)展已久,TWS耳機(jī)掀起的浪潮已經(jīng)培養(yǎng)起用戶對(duì)耳機(jī)的依賴和長(zhǎng)期佩戴的可能性。根據(jù)Canalys的最新研究,TWS在2024年第二季度仍然是全球智能個(gè)人音頻市場(chǎng)的領(lǐng)導(dǎo)者,以12.6%的年增長(zhǎng)率鞏固了72.6%的市場(chǎng)份額。
TWS耳機(jī)的爆火已經(jīng)證明了耳機(jī)本身不與手機(jī)直接競(jìng)爭(zhēng),甚至填充了無(wú)法使用手機(jī)的時(shí)間,在交互形式上具備優(yōu)勢(shì)。建立在大家對(duì)耳機(jī)高接受度的基礎(chǔ)之上,一方面可以基于生成式大模型在AI語(yǔ)音助手再升級(jí),另一方面耳機(jī)艙也有很多可探索的空間。
進(jìn)入低價(jià)競(jìng)爭(zhēng)時(shí)代的TWS耳機(jī)也已經(jīng)建立起成熟的產(chǎn)業(yè)供應(yīng)鏈,即便是AI耳機(jī)需要根據(jù)新增的功能植入存儲(chǔ)器、射頻等器件,與TWS耳機(jī)供應(yīng)鏈有所不同,但也能被成熟的手機(jī)供應(yīng)鏈所覆蓋。
從交互習(xí)慣的角度來(lái)看,也有觀點(diǎn)認(rèn)為AI耳機(jī)沒(méi)有想象中那么容易被用戶接受。
RWKV聯(lián)合創(chuàng)始人羅璇表示:與手指操作相比,純語(yǔ)音交互是一件更加困難、更加耗能且泄漏隱私的事情。而且在人類歷史上,手指操作工具比語(yǔ)言更早出現(xiàn)。因此更看好AI眼鏡,手指+語(yǔ)音的模式。
柳達(dá)在十年前就思考過(guò),何時(shí)我們使用語(yǔ)音交互的頻率能夠同對(duì)話框交互一樣高:一是需要在技術(shù)和體驗(yàn)層面有重大突破,不僅是技術(shù)改進(jìn)還包括用戶習(xí)慣的改變;二是語(yǔ)音識(shí)別需要更加精準(zhǔn),對(duì)話的自然度和流暢度進(jìn)一步提高,語(yǔ)義理解能力進(jìn)一步增強(qiáng);三是多模態(tài)融合會(huì)是未來(lái)大趨勢(shì),語(yǔ)言交互和指尖交互無(wú)縫切換。
這也是AI耳機(jī)玩家們?cè)?jīng)思考過(guò)或正在思考的問(wèn)題。李浩乾曾在2021年與雷峰網(wǎng)對(duì)話時(shí)表示,Oladance在做TWS耳機(jī)之前就是嘗試過(guò)做眼鏡,但發(fā)現(xiàn)市場(chǎng)不成熟最后選擇放棄。WISHEE曾經(jīng)也嘗試探索AI眼鏡,發(fā)現(xiàn)AI眼鏡不僅需要考慮如何存儲(chǔ)視頻數(shù)據(jù),還需要高維度提取特征,而AI耳機(jī)在技術(shù)上已經(jīng)準(zhǔn)備好。IKKO也表示,在做AI耳機(jī)的同時(shí)也有對(duì)AI眼鏡的積極探索。
或許從多模態(tài)融合的趨勢(shì)來(lái)看,有視覺(jué)交互可能性的AI眼鏡確實(shí)會(huì)是AI耳機(jī)的終極形態(tài),但從AI耳機(jī)到AI眼鏡還有很長(zhǎng)的一段路要走。AI硬件大戰(zhàn),好戲才剛剛開(kāi)始。
雷峰網(wǎng)持續(xù)關(guān)注創(chuàng)新硬件產(chǎn)業(yè)動(dòng)態(tài),后續(xù)將推出AI眼鏡相關(guān)報(bào)道《AI眼鏡,等待小米發(fā)牌》,更多創(chuàng)新硬件的精彩故事,歡迎添加本文作者微信Yolanda_Zuu。
相關(guān)文章:
做AI硬件產(chǎn)品,技術(shù)說(shuō)教那套早過(guò)時(shí)了|鯨犀百人談No.23
朱嘯虎首個(gè)AI硬件項(xiàng)目,AI眼鏡界“賣鏟人”「Gyges Labs」完成數(shù)千萬(wàn)元Pre-A輪融資
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。