丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

本文作者: 包永剛   2025-07-29 15:22
導(dǎo)語(yǔ):?jiǎn)涡酒?60TOPS就能運(yùn)行百億參數(shù)大模型的漫界M50,是后摩智能獨(dú)特競(jìng)爭(zhēng)力的體現(xiàn)。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

“四年前創(chuàng)業(yè)時(shí),我常被問(wèn)道:存算一體那么好,為什么別人不做?”后摩智能創(chuàng)始人兼CEO吳強(qiáng)深有體會(huì),“現(xiàn)在一些上市公司或者即將上市的公司都說(shuō)要布局存算一體,沒(méi)有人再問(wèn)四年前的問(wèn)題,大家意識(shí)到了存算一體芯片對(duì)于大模型的優(yōu)勢(shì)。

存算一體芯片的賽道過(guò)去幾年確實(shí)十分熱鬧,國(guó)內(nèi)就有十多家公司布局不同技術(shù)路線、不同算力的存算一體芯片。

后摩的壁壘是什么?吳強(qiáng)說(shuō),“看論文做一個(gè)測(cè)試芯片,證明技術(shù)原理不難。我們的壁壘是將存算一體芯片量產(chǎn),過(guò)去四年我們趟過(guò)無(wú)數(shù)的坑,解決了一個(gè)又一個(gè)量產(chǎn)難題。

世界人工智能大會(huì)2025(WAIC)前夕,后摩智能發(fā)布了即將在今年第四季度量產(chǎn)的端邊大模型AI芯片——后摩漫界M50,這是一款單芯片就能運(yùn)行百億參數(shù)大模型的存算一體芯片。

吳強(qiáng)透露,后摩智能已啟動(dòng)下一代 DRAM-PIM 技術(shù)研發(fā)。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

率先起跑,一次轉(zhuǎn)向,后摩智能建起壁壘

2020年吳強(qiáng)創(chuàng)業(yè)時(shí),選擇存算一體技術(shù)路線有兩個(gè)核心原因,一個(gè)原因是吳強(qiáng)博士論文的方向是高能效比計(jì)算芯片以及編譯器,吳強(qiáng)甚至要解決功耗墻和存儲(chǔ)墻問(wèn)題,必須走存算一體路線。另一個(gè)是看到英偉達(dá)的強(qiáng)大,決定用創(chuàng)新的架構(gòu)另辟蹊徑,嘗試彎道超車。

存算一體技術(shù)在學(xué)術(shù)界研究很多,但要將學(xué)術(shù)研究轉(zhuǎn)化成商業(yè)化落地的產(chǎn)品,中間還有巨大的鴻溝。

“論文里能看到理論和原理,但要把存算一體技術(shù)轉(zhuǎn)化為量產(chǎn)產(chǎn)品,必須解決可測(cè)性和可靠性問(wèn)題,中間有無(wú)數(shù)的坑。”吳強(qiáng)說(shuō),“沒(méi)有人做過(guò)存算的DFT(Design for Testability,可測(cè)性設(shè)計(jì)),也不知道怎么做BIST(Built-in Self-Test,內(nèi)建自測(cè)試技術(shù)),如何解決小面積大算力帶來(lái)的電源穩(wěn)定性問(wèn)題?”

業(yè)界沒(méi)有人遇到這些問(wèn)題,也沒(méi)有對(duì)應(yīng)的制造工藝和EDA軟件,后摩智能的團(tuán)隊(duì)就只能用普通的工藝和EDA軟件填補(bǔ)中間巨大的鴻溝。

“我們非常希望友商一起做,把存算一體芯片的生態(tài)做好?!眳菑?qiáng)說(shuō)。

靠著后摩研發(fā)團(tuán)隊(duì)攻克一個(gè)個(gè)難題,2023年后摩發(fā)布了國(guó)內(nèi)首款大算力存算一體智駕芯片鴻途H30,最高物理算力256TOPS,典型功耗35W。

此后雖有后摩智能融資的消息,但一直沒(méi)有后摩智能產(chǎn)品和落地方面的消息,直到2025年7月的世界人工智能大會(huì)2025(WAIC)。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

談及此事,吳強(qiáng)告訴雷峰網(wǎng),2023年下半年整個(gè)自動(dòng)駕駛賽道競(jìng)爭(zhēng)非常激烈,格局逐漸穩(wěn)定,給新入局者的機(jī)會(huì)越來(lái)越少。

“我們第一代芯片為了體現(xiàn)存算一體的優(yōu)勢(shì),算力很高,也意味著成本高。但當(dāng)時(shí)市場(chǎng)都在講低成本,我們的大算力芯片和汽車芯片市場(chǎng)的需求有鴻溝?!眳菑?qiáng)坦言,“那時(shí)候在糾結(jié)要不要轉(zhuǎn)型,放棄汽車市場(chǎng)到一個(gè)新領(lǐng)域很痛苦,但又知道自動(dòng)駕駛芯片對(duì)我們來(lái)說(shuō)是一條走不通的路?!?/p>

“最后生存的壓力戰(zhàn)勝了面子,2023年下半年開(kāi)始轉(zhuǎn)型?!?/strong>吳強(qiáng)說(shuō),“我們看到了端邊大模型的新興市場(chǎng),沒(méi)有巨頭公司,與存算一體芯片的適用場(chǎng)景又很契合,2024年初快速調(diào)整第一代芯片,針對(duì)大模型優(yōu)化推出了漫界M30。

在股東中國(guó)移動(dòng)的幫助下,后摩智能的漫界M30隨中國(guó)移動(dòng)在2024年的世界移動(dòng)通信大會(huì)(MWC)亮相,這款芯片能夠運(yùn)行60B參數(shù)的模型,給了吳強(qiáng)和團(tuán)隊(duì)信心。

于是后摩智能就堅(jiān)定轉(zhuǎn)到端邊大模型芯片的市場(chǎng),經(jīng)過(guò)近兩年時(shí)間,推出了第二代IPU架構(gòu)的存算一體量產(chǎn)芯片漫界M50。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

無(wú)論是將存算一體芯片從學(xué)術(shù)界推向商業(yè)市場(chǎng),還是芯片應(yīng)用落地的選擇,其中趟過(guò)的坑,走過(guò)的彎路積累下來(lái)的經(jīng)驗(yàn),都是后摩在存算一體賽道和國(guó)產(chǎn)芯片公司里的壁壘。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

這個(gè)壁壘,幫助后摩智能能夠更好設(shè)計(jì)第二代芯片。 

單芯片160TOPS,能運(yùn)行百億參數(shù)大模型

后摩漫界M50采用的是自研的第二代IPU 架構(gòu)——天璇,實(shí)現(xiàn)了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB內(nèi)存與153.6 GB/s的超高帶寬,典型功耗僅10W,相當(dāng)于手機(jī)快充的功率,就能讓PC、智能語(yǔ)音設(shè)備、機(jī)器人等智能移動(dòng)終端高效運(yùn)行1.5B到70B參數(shù)的本地大模型。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

得益于存算一體通過(guò)把計(jì)算和存儲(chǔ)單元集成在一起,讓數(shù)據(jù)就近處理,能從根本上解決傳統(tǒng)芯片“數(shù)據(jù)傳輸慢、功耗高”問(wèn)題的特性,和傳統(tǒng)架構(gòu)相比,M50的能效提升5~10倍,能充分滿足端邊設(shè)備"算得快又吃得少"的需求。

為了能夠最大程度發(fā)揮存算一體架構(gòu)的優(yōu)勢(shì)高效運(yùn)行大模型,后摩智能進(jìn)行了一系列的優(yōu)化,吳強(qiáng)重點(diǎn)分享了兩個(gè)優(yōu)化。

一個(gè)是彈性加速,這個(gè)技術(shù)與GPU的稀疏加速有點(diǎn)類似。GPU的稀疏加速,是在遇到權(quán)重參數(shù)為“0”時(shí),跳過(guò)計(jì)算,實(shí)現(xiàn)加速。但這種方式權(quán)重必須嚴(yán)格為“0”,在現(xiàn)實(shí)應(yīng)用中,要讓大量權(quán)重都恰好為“0”是非常困難的,因此GPU的稀疏加速效果往往不盡如人意。

SRAM存算一體技術(shù)是按照一個(gè)比特(bit)一個(gè)比特進(jìn)行串行計(jì)算,這意味著后摩可以做到更細(xì)粒度的優(yōu)化。

“我們并不需要整個(gè)權(quán)重是0,只要它在bit里面有0,就可能做彈性加速?!眳菑?qiáng)介紹,這讓加速的機(jī)會(huì)大大增加,也讓量化變得更加靈活,可以實(shí)現(xiàn)7bit、6bit甚至5bit的超低精度量化,從而在不犧牲太多精度的情況下,將性能壓榨到極致。

據(jù)悉,天璇架構(gòu)最高可實(shí)現(xiàn)160%的加速效果。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

另一個(gè)優(yōu)化是直接支持浮點(diǎn)運(yùn)算。“基于存算的架構(gòu)做浮點(diǎn)運(yùn)算,并把它量產(chǎn),我們?cè)跇I(yè)內(nèi)應(yīng)該是第一個(gè)?!眳菑?qiáng)解釋,芯片直接支持浮點(diǎn)運(yùn)算,意味著開(kāi)源或者FP16的浮點(diǎn)模型可以直接運(yùn)行,能夠提升適配和應(yīng)用的效率,只有特殊需要的情況下才會(huì)做額外的量化,這進(jìn)一步降低了漫界M50芯片應(yīng)用落地的難度。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

對(duì)于用戶來(lái)說(shuō),易用性還是取決于上層的軟件,包括編譯器。

“第一代編譯器用傳統(tǒng)的方案做,很多功能發(fā)揮不出來(lái),所以中間重構(gòu)了一遍,完全從0-1?!?/strong>吳強(qiáng)說(shuō),“我們也是逐漸地摸索,這種經(jīng)驗(yàn)在外面看不到,這是我們積累的壁壘。”

傳統(tǒng)的NPU編譯器有幾百個(gè)選項(xiàng),手動(dòng)調(diào)優(yōu)困難,導(dǎo)致上手門(mén)檻高、使用不便。

后摩重構(gòu)的編譯器后摩大道,應(yīng)用了自動(dòng)的優(yōu)化算子,只要給一些輸入的圖Graph,它就能自動(dòng)搜索最優(yōu)化的策略,無(wú)需開(kāi)發(fā)者手動(dòng)嘗試,支持浮點(diǎn)運(yùn)算,無(wú)需量化參數(shù)和精度調(diào)優(yōu),讓開(kāi)發(fā)者更容易上手。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

從硬件到軟件,后摩解決了AI芯片落地的技術(shù)難題,市場(chǎng)策略成為后摩走向商業(yè)化成功的下一個(gè)關(guān)鍵。

多元產(chǎn)品組合,重點(diǎn)拓展三大領(lǐng)域

基于漫界M50內(nèi)建的高速多芯互聯(lián)技術(shù),后摩智能推出了覆蓋端側(cè)到邊緣的多元算力方案。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

力擎LQ50 M.2 卡以口香糖大小的標(biāo)準(zhǔn) M.2 規(guī)格,為 AI PC、AI Stick、陪伴機(jī)器人等移動(dòng)終端提供 "即插即用" 的端側(cè) AI 能力,支持 7B/8B 模型推理超 25tokens/s。

力擎LQ50 Duo M.2 卡集成雙 M50 芯片,320TOPS 的算力,突破 14B/32B 大模型端側(cè)部署瓶頸。

力謀LM5050 加速卡與力謀LM5070 加速卡分別集成 2 顆、4 顆 M50 芯片,為單機(jī)及超大模型推理提供高密度算力,最高達(dá) 640TOPS。

BX50 計(jì)算盒子則以緊湊機(jī)身適配邊緣場(chǎng)景,支持 32 路視頻分析與本地大模型運(yùn)行。

目前后摩智能比較看重三個(gè)領(lǐng)域,一是平板和電腦這種消費(fèi)終端類,這是大模型生產(chǎn)力工具,對(duì)AI性能有剛需。二是智能語(yǔ)音系統(tǒng),大模型語(yǔ)音會(huì)議也是重點(diǎn)布局的一個(gè)方面。三是運(yùn)營(yíng)商的邊緣計(jì)算,看中了5G+AI是一個(gè)趨勢(shì)。

“目前這幾個(gè)方面都有早期客戶,消費(fèi)終端、智能辦公、智能工業(yè)我們重點(diǎn)布局的領(lǐng)域?!眳菑?qiáng)說(shuō),“我們精力有限,先把這三個(gè)領(lǐng)域做好,未來(lái)只要對(duì)大模型有需要,對(duì)功耗敏感,都是會(huì)逐步拓展的客戶?!?/strong>

在世界人工智能大會(huì)(WAIC)后摩的展臺(tái)上,后摩也展示了單顆漫界M50芯片運(yùn)行端側(cè)大模型的應(yīng)用,比如基于Qwen3-14b模型的Chatbot知識(shí)問(wèn)答;還有基于Qwen-8b模型的會(huì)議紀(jì)要,支持2K左右的上下文,一小時(shí)的會(huì)議,目前五六分鐘可以生成會(huì)議紀(jì)要;還有專門(mén)為信創(chuàng)市場(chǎng)提供服務(wù)的公文寫(xiě)作,采用純國(guó)產(chǎn)芯片和操作系統(tǒng),運(yùn)行Qwen2.5-7b模型,速度十分理想。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

目前,聯(lián)想的下一代AI PC,科大訊飛的訊飛聽(tīng)見(jiàn)下一代智能語(yǔ)音設(shè)備,以及中國(guó)移動(dòng)的新一代5G+AI邊緣計(jì)算盒子,都是后摩智能的意向客戶。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

吳強(qiáng)告訴雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)),目前后摩和算法合作伙伴以及OS都有合作,后摩的策略是每個(gè)領(lǐng)域與頭部客戶直接對(duì)接,腰部以及長(zhǎng)尾客戶用編譯器工具鏈降低客戶開(kāi)發(fā)的難度。

接下來(lái),后摩將研發(fā)下一代DRAM-PIM 技術(shù),通過(guò)將計(jì)算單元直接嵌入 DRAM 陣列,使計(jì)算與存儲(chǔ)的協(xié)同更加緊密高效,這一技術(shù)將突破 1TB/s 片內(nèi)帶寬,能效較現(xiàn)有水平再提升三倍,推動(dòng)百億參數(shù)大模型在終端設(shè)備實(shí)現(xiàn)普及,讓更強(qiáng)大的 AI 算力能夠融入 PC、平板等日常設(shè)備。

熱鬧的存算一體芯片賽道里,后摩的競(jìng)爭(zhēng)壁壘是什么? |WAIC 2025

從最初的孤獨(dú)求證,到如今的大模型端側(cè)芯片量產(chǎn),后摩智能讓存算一體不再只是學(xué)術(shù)概念,而成為國(guó)產(chǎn)AI芯片攻入新場(chǎng)景的“潛航器”。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄