0
本文作者: 嘉嘉 | 2022-02-16 11:32 |
AI芯片應(yīng)用領(lǐng)域不斷向多維度方向發(fā)展,例如CV(計(jì)算機(jī)視覺)、自動(dòng)駕駛、智能手機(jī)以及語音交互。而在語音交互領(lǐng)域,中國智能語音市場(chǎng)正在維持高速增長。根據(jù)德勤報(bào)告顯示,預(yù)計(jì)2030年消費(fèi)級(jí)應(yīng)用場(chǎng)景超過700億元,企業(yè)級(jí)場(chǎng)景達(dá)到發(fā)展空間也預(yù)計(jì)將達(dá)到千億級(jí)規(guī)模。
為了讓智能終端擁有更好的交互體驗(yàn),針對(duì)語音算法打造相匹配的AI芯片,采用軟硬一體化的解決方案幾乎是目前行業(yè)最為普遍的選擇,這也是技術(shù)迭代的必然路徑。如今智能語音賽道云集了眾多玩家,如百度、科大訊飛、云知聲、思必馳、出門問問、啟英泰倫等都紛紛布局了芯片產(chǎn)業(yè)。
智能語音在技術(shù)關(guān)聯(lián)和數(shù)據(jù)層次上天生具有更高的復(fù)雜度,單單自然語言理解和處理的能力就花費(fèi)了科學(xué)家們數(shù)十年的心血才換來今日的交互體驗(yàn)。而能夠?qū)⒄Z音識(shí)別、語義理解、自然語言處理、語音合成、聲音降噪等技術(shù)實(shí)現(xiàn)“云端芯”一體化,把業(yè)務(wù)延伸到芯片甚至硬件,才是將技術(shù)商業(yè)化的合理路徑。
通用芯片架構(gòu)并非為AI專門設(shè)計(jì),天然存在性能、功耗等方面的局限性已是老生常談。近幾年在業(yè)內(nèi)眾多企業(yè)的努力下,解決了傳統(tǒng)通用芯片的適配問題,公司也紛紛投入到專用芯片的制造。
在技術(shù)問題得到解決后,AI語音芯片在商業(yè)化的道路上仍面臨很多挑戰(zhàn):
l 首先,如何達(dá)到在成本約束下的性能最優(yōu)化。智能語音技術(shù)是緊耦合的,東拼西湊的技術(shù)無法得到理想的交互效果。需要納入考量的是將全棧式的解決方案搭載到芯片上,同時(shí)每多一項(xiàng)功能就意味著成本的增加。低成本、易實(shí)施、低功耗的產(chǎn)品特點(diǎn)需要與解決方案密切結(jié)合。
l 第二,縱觀布局AI語音芯片公司,它們所選的應(yīng)用終端都集中在家居、電器、機(jī)器人、車載等場(chǎng)景。然而這幾類場(chǎng)景產(chǎn)品品類眾多分散是一大特點(diǎn),尤其是家居電器,大到一臺(tái)空調(diào),小到一個(gè)插座都有對(duì)語音芯片的需求。如何在這些設(shè)備上適配芯片,判斷芯片每一項(xiàng)效用的必要性,都需要對(duì)終端產(chǎn)品功能Know-How有著深刻的掌握。
l 第三,由于客戶廠商天然的分散性,標(biāo)準(zhǔn)產(chǎn)品加工具定制是最高效的合作模式。擁有高效的工具鏈,降低定制化所需要的時(shí)間以及邊際成本,將會(huì)很大程度提升語音芯片商業(yè)化進(jìn)程。
云知聲作為行業(yè)內(nèi)第一批布局邊緣側(cè)芯片設(shè)計(jì)并提供軟硬一體產(chǎn)品的企業(yè)之一,到如已經(jīng)基于自研或第三方芯片發(fā)布三代共6款全棧語音AI芯片軟硬一體產(chǎn)品,芯片及模組出貨量已達(dá)千萬級(jí)水平,積累近800家合作客戶。
早在2015年云知聲就開始搭建芯片團(tuán)隊(duì),不僅來自于其行業(yè)嗅覺,也是環(huán)境使然。云知聲的芯片方案均內(nèi)置了為語音識(shí)別而優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)加速方案,實(shí)現(xiàn)設(shè)備的語音離在線識(shí)別。與此同時(shí),語音交互的核心環(huán)節(jié)也取得了重大的突破。語音識(shí)別環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場(chǎng)識(shí)別,到語音分析和語義理解也有了巨大提升,呈現(xiàn)出整體的交互方案。
2018年,云知聲第一代UniOne“雨燕”(Swift)芯片第一次流片成功并量產(chǎn)出貨?!坝暄唷毙酒窃浦曖槍?duì)智能家居語音交互場(chǎng)景推出的高性能、低成本、一體化的芯片解決方案?!坝暄唷奔軜?gòu)內(nèi)置的數(shù)字信號(hào)處理器uDSP,以及AI加速器DeepNet(云知聲完全自主研發(fā)的深度神經(jīng)網(wǎng)絡(luò)處理器,NPU),支持DNN/LSTM/CNN等多種深度神經(jīng)網(wǎng)絡(luò)模型,能實(shí)現(xiàn)語音識(shí)別、理解、合成所需的深度學(xué)習(xí)計(jì)算加速。和通用CPU相比,這款A(yù)SIC芯片的處理速度和效率都有明顯提升。
對(duì)于業(yè)務(wù)的場(chǎng)景選擇,云知聲的端側(cè)智能語音芯片精準(zhǔn)面向小家電市場(chǎng)。這條賽道的選擇契機(jī)是始于自2014年與格力、美的等電器廠商的合作。在此領(lǐng)域,云知聲已經(jīng)積累了7年有余的經(jīng)驗(yàn),對(duì)于場(chǎng)景和電器產(chǎn)品的特點(diǎn)駕輕就熟。
以麥克風(fēng)陣列的技術(shù)為例,毋庸置疑的是,麥克風(fēng)越多越容易實(shí)現(xiàn)更好的降噪和語音增強(qiáng)效果。但比起行業(yè)內(nèi)炒的如火如荼的多麥克陣列方案,單麥克卻成為了家電產(chǎn)業(yè)中出貨量最大的方案。這是因?yàn)樾Ч牟顒e僅對(duì)具有聲源定位需求的產(chǎn)品存在影響,而對(duì)于家電市場(chǎng),一些本來就需要靠墻擺放的設(shè)備如空調(diào)、電視機(jī)等,八麥克風(fēng)陣列的應(yīng)用明顯是多余的。所以考慮到實(shí)施成本、結(jié)構(gòu)設(shè)計(jì)和生產(chǎn)安裝等方面,單雙麥克是該應(yīng)用場(chǎng)景最適合搭載的方案——這些經(jīng)驗(yàn)就來自于對(duì)行業(yè)功能Know-How的掌握。
于是云知聲面向小家電市場(chǎng)的二代芯片“蜂鳥”(Hummingbird)在2019年流片成功?!胺澍B” 芯片是云知聲專門為離線遠(yuǎn)場(chǎng)語音交互場(chǎng)景設(shè)計(jì)的高性能,高集成度,高性價(jià)比的語音智能IoT芯片。相比語音行業(yè)通用芯片“雨燕”,“蜂鳥”芯片定位更輕巧靈活,可以持續(xù)降低適配設(shè)備的門檻,為客戶提供性價(jià)比更高的解決方案。
蜂鳥系列芯片應(yīng)用了遠(yuǎn)場(chǎng)拾音、高性能識(shí)別、低功耗喚醒的功能。配備單雙麥克可實(shí)現(xiàn)10米遠(yuǎn)場(chǎng)拾音,安靜環(huán)境5米識(shí)別率達(dá)到95%以上。主要面對(duì)家居環(huán)境下的廚房、客廳、臥室、浴室等在內(nèi)的白電和小家電(燈具、廚電、智能插座等)產(chǎn)品領(lǐng)域。作為白電和小家電領(lǐng)域領(lǐng)先大規(guī)模量產(chǎn)的語音方案,蜂鳥及相關(guān)系列的芯片出貨量達(dá)到千萬級(jí)。覆蓋了包括格力、美的、海爾、奧克斯、華帝等國內(nèi)一線家電廠商。
與此同時(shí),隨著大眾對(duì)用戶隱私問題的關(guān)注,相較于需要系統(tǒng)連接上傳數(shù)據(jù)的云端服務(wù),特定場(chǎng)景下離線語音交互的需求在逐步增加。低功耗、低成本、快速響應(yīng)以及融合離在線的交互模式,系統(tǒng)能智能決策離在線的處理方式都成為研發(fā)語音AI芯片的必要條件。所以云知聲的芯片產(chǎn)品矩陣也布局了面向車載市場(chǎng)的高端芯片。
云知聲與吉利集團(tuán)旗下億咖通成立合資公司芯智科技,并推出了一款高性能車規(guī)級(jí)離在線語音芯片“雪豹”(Leopard),預(yù)計(jì)搭載該芯片的車型在今年上市。這款芯片也集合了云知聲的感知和認(rèn)知技術(shù)。面向車載網(wǎng)絡(luò)環(huán)境不穩(wěn)定的特性,在純離線場(chǎng)景下,”雪豹”提供堪比在線體驗(yàn)的自然語言交互和全國范圍內(nèi)尋址,以及多麥克風(fēng)降噪功能。同時(shí)雪豹獲得車規(guī)級(jí)AEC-Q100認(rèn)證,具有完全自主知識(shí)產(chǎn)權(quán),為汽車提供純本地語音解決方案。這種本地化的服務(wù),不僅能讓用戶體驗(yàn)到流暢的語音交互功能,還可以解決用戶的隱私泄露問題。
隨著自動(dòng)駕駛和智能座艙也成為炙手可熱的行業(yè),基于車聯(lián)網(wǎng)的以車輛為中心的生態(tài)系統(tǒng)建設(shè)也是加速智能語音企業(yè)發(fā)展的戰(zhàn)略方向。將互聯(lián)網(wǎng)生態(tài)、用戶個(gè)性、環(huán)境交互等充分融合,毫無疑問也是云知聲選擇專攻車載芯片的考量。
在物聯(lián)網(wǎng)的不同應(yīng)用場(chǎng)景下,海量終端設(shè)備要實(shí)現(xiàn)功能智能化必須云端配合,即形成邊緣算力和云端算力的動(dòng)態(tài)平衡。云端互動(dòng)的命題需要 AI 芯片的強(qiáng)有力支持,進(jìn)一步也深刻影響到芯片的設(shè)計(jì)以及最終的交付。
隨著2021年Google推出的Switch Transformer模型將小樣本甚至零樣本的學(xué)習(xí)能力刷新大眾認(rèn)知,預(yù)訓(xùn)練大模型也預(yù)示著AI技術(shù)新風(fēng)向的爆發(fā)。人們可以更加順利地在模型注入需要學(xué)習(xí)的知識(shí),就意味著復(fù)雜和大量定制任務(wù)得以實(shí)現(xiàn)適配和推理計(jì)算。同樣,云知聲也利用預(yù)訓(xùn)練模型高效地解決物聯(lián)網(wǎng)產(chǎn)品定制的痛點(diǎn),為AIoT產(chǎn)品定制建立了開發(fā)者平臺(tái)。
語音控制、對(duì)接IoT控制以及設(shè)備控制,通過平臺(tái)自助生成能達(dá)到算法原廠線下支持和研發(fā)人員的編碼實(shí)現(xiàn)的效果,將原本需要幾周的工作周期下降到30分鐘。例如,離線標(biāo)準(zhǔn)方案可以進(jìn)行麥克數(shù)量與間距配置、自定義喚醒詞、音色配置、命令詞和應(yīng)答語自定義并且進(jìn)行一鍵下載版本燒錄。客戶只需要專注自己熟悉的電控部分,無需額外的硬件能力即可定制專屬智能語音方案。
標(biāo)準(zhǔn)化的交付模式極大降低了客戶端的門檻,通過產(chǎn)品端,云端一站式開發(fā),快速實(shí)現(xiàn)智能語音控制,讓零基礎(chǔ)企業(yè)輕松實(shí)現(xiàn)智能化。再加上強(qiáng)運(yùn)營的特點(diǎn),平臺(tái)支持上百種可供配置的云端技能,同時(shí)還可自定義技能或者接入第三方技能。截至目前,活躍客戶在該平臺(tái)已構(gòu)建超過25000個(gè)產(chǎn)品版本。
近十年來,AI技術(shù)不斷取得突破性競(jìng)爭,百花齊放的AI行業(yè)也將迎來它的后半場(chǎng)。面對(duì)現(xiàn)階段繁榮的智能語音市場(chǎng)以及互聯(lián)網(wǎng)巨頭的加入,盡管技術(shù)水平差不多的企業(yè),在垂直行業(yè)和細(xì)分場(chǎng)景的取舍也會(huì)造成截然不同的導(dǎo)向,AI芯片的落地和場(chǎng)景也需要進(jìn)行密切結(jié)合。
在解決功能約束下的性能最優(yōu)化、不同場(chǎng)景下自由配置、便捷工具鏈的問題后,以云知聲為代表的智能語音技術(shù)企業(yè)需要繼續(xù)加速垂直行業(yè)進(jìn)行滲透和布局,讓智能語音賦能多形態(tài)的終端,以“中國芯”的力量協(xié)同構(gòu)建全產(chǎn)業(yè)生態(tài)圈。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。