0
本文作者: 任然 | 2019-01-04 19:28 |
雷鋒網(wǎng)消息,當前我們正處于5G爆發(fā)的邊緣,5G與AI的結合將真正促使AIoT智慧物聯(lián)的落地與實現(xiàn)??梢灶A見的是,未來巨量的多維數(shù)據(jù)(如語音、圖像、視頻等)集中處理與邊緣式分布計算的需求,將進一步挑戰(zhàn)AI芯片的計算能力。
2019年1月2日,云知聲在北京召開新聞發(fā)布會,正式公布了其多模態(tài)AI芯片戰(zhàn)略與規(guī)劃,并同步曝光了在研的三款定位不同場景的AI芯片。
2018年,“多模態(tài)”逐漸成為了業(yè)界研究的一個重點。如果把模態(tài)理解為感官,那么多模態(tài)即是調(diào)用多種感官的交互方式,它跨過了自然語言,其方式也更加貼近人,是AI未來的一個發(fā)展方向。
云知聲創(chuàng)始人兼CEO黃偉認為,隨著AIoT場景的逐漸豐富,未來應用對于端云互動有更強的需求,二者需要緊密結合,這要求對芯片設計和云端架構進行統(tǒng)一考量,具備多維度AI數(shù)據(jù)集中處理能力的多模態(tài)AI芯片將成必由之路。云知聲接下來將依托AI算法與AI芯片構建場景優(yōu)勢,關鍵就在于多模態(tài)AI芯片戰(zhàn)略。
基于此,云知聲進一步對傳統(tǒng)SoC(System on Chip)概念提出全新定義,其中S代表不同的AI服務能力即Skills,O代表云端與邊緣側的互動On/Off Cloud,C代表具備智能處理能力的AI芯片。
同時,云知聲發(fā)布了DeepNet2.0多模態(tài)人工智能核心IP,其AI處理能力也從1.0的語音進化到2.0的多模態(tài),支持語音、圖像等處理能力。DeepNet2.0可兼容LSTM/CNN/RNN/TDNN等多種推理網(wǎng)絡,支持可重構計算與Winograd處理,最高可配置算力達4Tops。目前云知聲DeepNet2.0已在FPGA上得到驗證,將在今年的全新多模態(tài)AI芯片海豚(Dolphin)上落地。
在會后的交流中,黃偉特別向雷鋒網(wǎng)強調(diào)“多模態(tài)不是為了做視覺而做視覺,而是產(chǎn)品真正需要這種能力”。他以自動駕駛為例,可以通過面部圖像識別司機注意力是否集中、是否疲勞駕駛,并根據(jù)識別結果提醒司機安全駕駛?!坝秩缫归g行車時視野不如白天清晰,這時如果有實時圖像增強的幫助就能大大提升安全性?!?/p>
作為一家國內(nèi)領先的AI企業(yè),云知聲2014年開始切入物聯(lián)網(wǎng)AI硬件芯片方案(IVM),并于2015年開始量產(chǎn)出貨。在深入場景提供服務的過程中,為彌補通用芯片方案在給定成本和功耗條件下的能效比問題,以及在邊緣算力、多模態(tài)AI數(shù)據(jù)處理方面的能力短板,2015年云知聲正式啟動自研AI芯片計劃。
去年5月,云知聲推出業(yè)內(nèi)首款面向IoT的AI芯片UniOne及其解決方案雨燕(Swift),加速商業(yè)擴張與應用。該芯片采用云知聲自主AI指令集,擁有具備完整自主知識產(chǎn)權的DeepNet1.0、uDSP(數(shù)字信號處理器),并支持DNN/LSTM/CNN等多種深度神經(jīng)網(wǎng)絡模型,性能較通用方案提升超50倍。
云知聲聯(lián)合創(chuàng)始人李霄寒曾指出,“UniOne不是一顆芯片,而是一系列芯片,它代表了云知聲對于物聯(lián)網(wǎng)AI芯片發(fā)展戰(zhàn)略的整體構想”。在今天的發(fā)布會上,李霄寒再次從三方面論證了物聯(lián)網(wǎng)多模態(tài)AI芯片的必要性。他認為,當前物聯(lián)網(wǎng)產(chǎn)品線的AI芯片越來越明顯地體現(xiàn)出三個趨勢:
場景化:芯片設計正在由原來的片面追求PPA,即性能(Power)、功耗(Performance)和面積(Area),逐漸演變成基于軟硬一體,甚至包括云端服務的方式來解決某個垂直領域的具體問題,芯片本身上升成為整個解決方案中的重要部分,而非唯一;
端云互動:在物聯(lián)網(wǎng)的不同應用場景下,海量終端設備要實現(xiàn)功能智能化必須端云配合,即形成邊緣算力和云端算力的動態(tài)平衡。端云互動的命題需要AI芯片的強有力支持,進一步也深刻影響到芯片的設計,以及最終的交付;
數(shù)據(jù)多模態(tài):在以5G驅動的萬物智聯(lián)場景下,芯片所接觸到的數(shù)據(jù)維度將由原來的單一化走向多元化,芯片所需處理的數(shù)據(jù)也由單模態(tài)變成多模態(tài),這對芯片尤其是物聯(lián)網(wǎng)人工智能芯片的設計提出了新的挑戰(zhàn)。
以此來看,面向物聯(lián)網(wǎng)終端場景的AI芯片核心是解決垂直場景問題的能力,其呈現(xiàn)形式將不再是一個單一的硬件,而是承載著邊緣能力與云端能力的多模態(tài)AI軟硬一體解決方案。
在首款量產(chǎn)芯片雨燕已有大批客戶導入,占領市場先發(fā)優(yōu)勢的背景下,2019年云知聲在芯片落地規(guī)劃方面仍將保持積極態(tài)度。
李霄寒向雷鋒網(wǎng)透露,在持續(xù)迭代升級現(xiàn)有雨燕芯片的性能與服務之外,目前云知聲多款面向不同方向的芯片也已在研發(fā)中,包括適用性更廣的超輕量級物聯(lián)網(wǎng)語音AI芯片雨燕Lite、可面向智慧城市場景提供對語音和圖像等多模態(tài)計算支持的多模態(tài)AI芯片海豚(Dolphin),以及與吉利集團旗下生態(tài)鏈企業(yè)億咖通科技共同打造的面向智慧出行場景的多模態(tài)車規(guī)級AI芯片雪豹(Leopard),三款芯片計劃于2019年啟動量產(chǎn)。
為實現(xiàn)多模態(tài)AI芯片的戰(zhàn)略落地,目前云知聲已在加速技術布局,并在機器視覺方面取得飛速進展。其中,面向機器視覺的輕量級圖像信號處理器已可實現(xiàn)在不依賴外部內(nèi)存的情況下,在30fps的速率下實時對傳感器的圖片進行預處理,以進一步提高后續(xù)機器視覺處理模塊的處理速度和效果。
據(jù)悉,借助基于人臉信息分析的多模態(tài)技術,已可實現(xiàn)人臉/物體識別、表情分析、標簽化、唇動狀態(tài)跟蹤等功能,可為產(chǎn)品交互和用戶體驗提供更多的可玩性和靈活性。
此外,在圖像與芯片技術的產(chǎn)學研合作方面,云知聲還與杜克大學所領導的美國自然科學基金旗下唯一人工智能計算中心ASIC達成深度合作,致力于AI芯片算法壓縮與量化技術,以及非馮·諾依曼架構的新型AI芯片計算架構研究,將進一步為云知聲多模態(tài)AI芯片戰(zhàn)略的推進夯實基礎。
目前,依托在家居、車載等真實場景下豐富的產(chǎn)品經(jīng)驗,以及具備先發(fā)優(yōu)勢的AI芯片能力,云知聲將業(yè)務覆蓋到包括智能家居、智能汽車、智能兒童機器人、智慧酒店、智慧交通等諸多場景。未來云知聲將持續(xù)發(fā)力多模態(tài)AI芯片,不斷拓展技術與場景生態(tài),以實現(xiàn)面向未來AIoT時代的全面賦能。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。