1
本文作者: 包永剛 | 2019-01-05 15:04 |
AI熱潮催生了很多初創(chuàng)公司,其中有不少AI芯片公司。我們看到許多巨頭和初創(chuàng)公司都把目光鎖定在AI視覺芯片。不過,從2018年上半年開始AI語音芯片也陸續(xù)發(fā)布,2019年1月4日,思必馳在北京正式發(fā)布第一代AI語音芯片TAIHANG。值得注意的是,這款芯片出自思必馳與中芯國際下屬投資公司中芯聚源的合資公司上海深聰智能,這究竟是為什么?
AI語音技術(shù)真的比圖像挑戰(zhàn)小嗎?
AI圖像和語音是AI技術(shù)應(yīng)用的兩大方向,相比之下圖像如今受到了更大的關(guān)注,一方面是因為有安防和自動駕駛汽車等應(yīng)用市場的驅(qū)動,另一方面也有政策的支持。與此同時,有人認(rèn)為相比圖像,語音的技術(shù)挑戰(zhàn)更小,現(xiàn)有的芯片也已經(jīng)能夠滿足AI語音的需求,這是否存在一些誤解?
思必馳CTO/深聰智能CEO周偉達(dá)接受雷鋒網(wǎng)專訪時表示:“目前AI圖像處理大部分使用CNN,CNN最大的瓶頸不是帶寬和存儲,而是并行計算,但解決并行計算問題用馮諾依曼CPU架構(gòu)做乘法的加速相對而言是好做的事。AI語音則使用DNN,RNN系列的LSTM、BLSTM,這其實有比圖像更大的挑戰(zhàn),一個是并行乘法計算,另一個是模型參數(shù)更大,這會讓目前的CPU架構(gòu)面臨很大的帶寬瓶頸。”
“之所以AI圖像更先受到業(yè)界的關(guān)注,一方面是市場的需求,另一方面是因為學(xué)術(shù)圈和工業(yè)界認(rèn)為CNN的硬件優(yōu)化難度小于LSTM的大規(guī)模參數(shù)模型。”周偉達(dá)進(jìn)一步說明。
因此,可以明確的是深度學(xué)習(xí)算法從2005年提出到現(xiàn)在,其在語音識別、圖像視覺領(lǐng)域相比傳統(tǒng)算法都帶來了明顯的改進(jìn)。并且,無論是AI圖像還是AI語音,現(xiàn)有的芯片都能夠處理,但算力不夠效率不高,都需要專用的AI芯片。
思必馳CTO/深聰智能CEO周偉達(dá)
為什么選擇自研AI芯片?
AI的火熱讓市場上涌現(xiàn)了不少AI芯片初創(chuàng)公司,但芯片是一個技術(shù)密集、人才密集、資金密集的高門檻的行業(yè),并且芯片真正的成功并非量產(chǎn),還有后續(xù)的落地應(yīng)用以及不斷的迭代。這也讓芯片的投資回報周期比較長。思必馳作為一家以算法和軟件見長的公司,是什么讓他們下定決心自主研發(fā)芯片?
周偉達(dá)在言由芯生——2019年思必馳AI芯片暨戰(zhàn)略發(fā)布會上舉了個例子,他表示思必馳曾經(jīng)對接過一個最復(fù)雜的場景,算法運行在4核Arm的芯片上,占用了芯片50%-60%的計算量,語音作為一種交互手段占用這么高的計算量在許多應(yīng)用場景是難以接受的。
因此,思必馳決定做AI語音專用芯片希望解決通用芯片的三個閉環(huán):通用芯片無法和數(shù)據(jù)產(chǎn)生連接;通用芯片無法和市場產(chǎn)生連接;更重要的是通用芯片沒有算法,算法是靈魂,芯片是框架。沒有靈魂的框架產(chǎn)生不了價值的,必須借由專用芯片才能夠?qū)崿F(xiàn)芯片未來的潛能。
AI語音對專用芯片的需求毋庸置疑,但市場需求才是更強的驅(qū)動力。思必馳CEO高始興在發(fā)布會上提到,思必馳打通了全鏈路對話技術(shù),深化軟硬結(jié)合,借助DUI平臺推進(jìn)定制規(guī)?;?,通過“會話精靈”提供交互式信息服務(wù),實現(xiàn)快速落地。在車聯(lián)網(wǎng)后裝、智能音箱、兒童平板/故事機、知識機器人等領(lǐng)域市場占有率均第一,在汽車前裝、電視/白電、智能客服等重點領(lǐng)域市場增速第一。未來,思必馳將整合智能終端方案能力與會話精靈智慧服務(wù)能力,形成All In One解決方案,進(jìn)入酒店、地產(chǎn)、物流、養(yǎng)老、醫(yī)療、教育、安全、社區(qū)等更多行業(yè)。
雷鋒網(wǎng)也了解到,思必馳在2017年實現(xiàn)了收支平衡,2018年邁向了盈利。這其中有市場對語音需求的快速增長的大背景,比如智能音箱的出貨量將從2018年的1800萬增加到2000萬,故事機在2018年出貨也將超過2000萬,以及智能手機在2018年都陸續(xù)加入了語音助手的功能。當(dāng)然,思必馳在各個領(lǐng)域保持市場占有率第一更是他們最終選擇進(jìn)入芯片領(lǐng)域的底氣。但是,周偉達(dá)接受采訪時表示思必馳擅長的是算法和軟件,最終決定最A(yù)I芯片也有很多顧慮。
為何走出不一樣的AI芯片路?
既然已經(jīng)決定自主研發(fā)AI芯片,如何做就是接下來的關(guān)鍵問題。周偉達(dá)告訴雷鋒網(wǎng),思必馳進(jìn)從2017年開始行了一年的調(diào)研,剛開始想與IP提供方合作,包括將思必馳的算法移植到他們的CPU、DSP上,但最終發(fā)現(xiàn)不對硬件做優(yōu)化,直接進(jìn)行算法的移植效率并沒有明顯提升。
與IP提供方的合作帶來的提升這與思必馳的期待相差甚遠(yuǎn),接下來,思必馳又接觸了芯片外包設(shè)計公司,這類公司可以根據(jù)給定的芯片需求設(shè)計出芯片,但由于芯片外包設(shè)計公司采用項目制,在芯片實現(xiàn)之后,后續(xù)PPA(Performance、Power、Area)的優(yōu)化他們不會繼續(xù)進(jìn)行。但高效能的芯片可能設(shè)計需要20%的精力,后續(xù)的優(yōu)化則需要80%的工作量。
與芯片外包公司的合作也行不通,思必馳又嘗試與具備豐富芯片設(shè)計經(jīng)驗和市場經(jīng)驗的SoC公司合作,但是即便思必馳免費投入算法團隊與SoC公司聯(lián)合設(shè)計和優(yōu)化,一年下來計算效率也只改進(jìn)了20%。
思必馳發(fā)現(xiàn)與芯片設(shè)計公司合作的方式也走不通,因此想到能否建立更深度的合作,也就是芯片公司出設(shè)計團隊,思必馳出算法團隊組建合資公司。但這其中也有不少困難,比如SoC公司意愿不強,以及未來還會涉及知識產(chǎn)權(quán)的問題。
同樣是深度合作的模式,思必馳又想到與芯片代工廠合作,因為芯片代工廠對IP的驗證以及芯片的生產(chǎn)非常有經(jīng)驗,也與芯片產(chǎn)業(yè)鏈的上下游都有很好的對接,對芯片的量產(chǎn)、良率、訂貨和交貨周期都有很好的保障,對思必馳而言是一個不錯的選擇,當(dāng)然,代工廠希望合作的是成熟的IP。
最終,思必馳在拜訪了芯片產(chǎn)業(yè)鏈上大大小小的近百家企業(yè),并在調(diào)研的過程中付諸了行動之后,2018年3月,思必馳攜手中芯國際下屬投資公司中芯聚源,共同注資成立上海深聰半導(dǎo)體有限責(zé)任公司(簡稱“深聰智能”)正式開啟造芯之路,8月開始流片,11月點亮驗證。
首代AI芯片典型工作場景功耗實現(xiàn)毫瓦級
基于此前的調(diào)研以及在2017年12月份通過傳統(tǒng)對接平臺就已經(jīng)完善了所有算法的移植定點化和優(yōu)化,深聰智能成立之后就開始正式定義思必馳的第一款人工智能語音芯片,一個月的時間定義了芯片完整的規(guī)格書,4月份開始進(jìn)行了芯片的底層的技術(shù)研發(fā),集成驗證以及仿真以及優(yōu)化,不到5個月的時間思必馳的第一款芯片在8月7日成功流片,并在當(dāng)天點亮。
不過,AI算法還在不斷演進(jìn),這對終端AI芯片的設(shè)計提出了更大的挑戰(zhàn)。對此,周偉達(dá)表示,得益于思必馳在市場上對接過大量的這IoT智能設(shè)備,我們對市場的需求非常了解。另外我們14篇論文入選ICASSP刷新國家級自主創(chuàng)新能力新記錄,我們的算法研究是超前的,對未來兩三年或者更長時間都有規(guī)劃預(yù)測。思必馳的AI芯片已經(jīng)做好了設(shè)計和規(guī)劃,首先是保證目前的算法能很快的移植進(jìn)去,其次是我們對接下來兩三年內(nèi)的做優(yōu)化留了一定的空間。
這款快速流片的AI芯片就是深聰TH1520,據(jù)深聰智能CTO朱澄宇介紹,TH1520進(jìn)行了算法硬件優(yōu)化,基于雙DSP架構(gòu),內(nèi)部集成codec編解碼器以及大容量的內(nèi)置存儲單元,同時,TH1520采用了AI指令集擴展和算法硬件加速的方式,使其相較于傳統(tǒng)通用芯片具有10X以上的效率提升。此外,TH1520在架構(gòu)上具有算力及存儲資源的靈活性,支持未來算法的升級和擴展。
TH1520兼具低功耗及實用性,采用多級喚醒模式,內(nèi)置低功耗IP,使其在always-on監(jiān)聽階段的功耗低至毫瓦級,典型工作場景功耗僅需幾十毫瓦,極端場景峰值功耗不超過百毫瓦。
對比來看,如果使用Arm芯片,工作場景性能表現(xiàn)優(yōu)化好的至少需要500毫瓦,有些則是瓦級功耗。周偉達(dá)接受專訪時表示,毫不夸張的說,我們做AI算法跟硬件結(jié)合做優(yōu)化的時候,算法優(yōu)化到指令集,內(nèi)存優(yōu)化到byte級。當(dāng)然,這個過程中也經(jīng)歷了軟硬件團隊從互相不理解到最終的默契配合。
另外,TH1520支持單麥、雙麥、線性4麥、環(huán)形4麥、環(huán)形6麥等全系列麥克風(fēng)陣列,同時支持USB/SPI/UART/I2S/I2C/GPIO等應(yīng)用接口和多種格式的參考音,能在各類IoT產(chǎn)品中靈活部署應(yīng)用。
周偉達(dá)也表示,TH1520定位于各類終端設(shè)備,并針對家居環(huán)境進(jìn)行算法優(yōu)化,能夠快速落地,降低成本、降低功耗,大幅度提升電視、盒子、白電、平板、燈具等產(chǎn)品的用戶體驗。
發(fā)布會現(xiàn)場,思必馳展示了TH1520在音箱、電視以及洗碗機的三個Demo,并表示更高級的功能還在調(diào)試中。
另外,周偉達(dá)向雷鋒網(wǎng)透露TH1520最晚將在今年Q2產(chǎn)量。他還透露思必馳對于芯片也有自己明確的規(guī)劃,目標(biāo)是能夠研發(fā)出合適的類腦芯片,目前已經(jīng)取得了一些進(jìn)展。
開放是思必馳的態(tài)度
有了自研的AI芯片之后,思必馳能讓終端語音處理能力的提升,這不僅能夠?qū)崿F(xiàn)更多的離線語音功能提升體驗,減少數(shù)據(jù)傳輸?shù)皆贫?,同時基于芯片中加入的芯片密碼,能夠更好地保護用戶的隱私。
當(dāng)然,更重要的是思必馳-深聰將打造更貼合產(chǎn)品需求的人工智能交互 “云+芯” 整體解決方案。這是否意味著思必馳更傾向于提供完整的解決方案,周偉達(dá)表示我們會根據(jù)客戶的需求,可以提供軟硬一體的IP,芯片到Turnkey解決方案,我們更希望以產(chǎn)品的性價比吸引用戶,也希大家能夠一起先把語音市場做大。
思必馳的開放不僅僅體現(xiàn)在最終的產(chǎn)品方案上,周偉達(dá)表示深聰智能也希望能與芯片產(chǎn)業(yè)鏈的各方合作,包括IP提供方,芯片設(shè)計外包公司。另外,深聰智能希望不僅做人機語音的交互,未來也可能做圖像,深聰智能歡迎更多做視覺,做圖像甚至做AI金融的公司一起與跟深聰智能合作研發(fā)更智能的類人腦的高效能的人工智能計算芯片。
雷鋒網(wǎng)小結(jié)
芯片是AI發(fā)展的關(guān)鍵要素之一,當(dāng)然對于算力的追求也讓更多的芯片公司意識到需要與算法和軟件公司合作。不過在思必馳AI芯片的研發(fā)中則是思必馳這家以AI語音算法見長的公司從語音算法和市場需求的角度出發(fā),進(jìn)入芯片市場,經(jīng)過長期調(diào)研和慎重考慮最終以合資公司的方式完成AI芯片的研發(fā),這個過程克服了許多挑戰(zhàn),現(xiàn)在還很難說這種模式一定能獲得最好的成果,但卻是思必馳經(jīng)過探索后最合理的選擇。
在采訪的過程中,也能明顯的感受到思必馳開放的態(tài)度,不僅是對于研發(fā)AI芯片合作的開放,更是以開放的態(tài)度聯(lián)合更多的人去推動AI語音技術(shù)的普及。
相關(guān)文章:
專訪初敏:思必馳入局企業(yè)智慧服務(wù)領(lǐng)域,推會話精靈
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。