丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

為什么用中臺理念做AI芯片和GPU?

本文作者: 包永剛 2022-09-05 17:16
導語:瀚博也進軍高性能GPU市場了。

對于互聯(lián)網(wǎng)公司來說,中臺是一個非常熟悉的概念。

但在芯片領(lǐng)域,提中臺概念的人并不多。

2022世界人工智能大會上,瀚博半導體創(chuàng)始人兼CEO錢軍在談及協(xié)同兩個產(chǎn)品線時說道:“我們用了中臺的概念。核心的IP就類似中臺,然后上層有統(tǒng)一的開發(fā)平臺。可以根據(jù)產(chǎn)品和規(guī)劃和側(cè)重點,設(shè)計和推出更符合市場需求的產(chǎn)品。”

瀚博踐行這一理念的關(guān)鍵是自主研制的統(tǒng)一計算架構(gòu)(Vastai Unified Compute Architecture)。

為什么用中臺理念做AI芯片和GPU?

所謂的統(tǒng)一計算架構(gòu),是將多款高性能計算引擎進行整合,擁有高效統(tǒng)一的存儲管理、一致性接口和低鏈接延遲、完整的虛擬化功能、統(tǒng)一的底層軟件設(shè)計、模塊化的上層計算算子庫和功能模塊。

錢軍說:“瀚博統(tǒng)一架構(gòu)讓計算密集型的AI、視頻、渲染任務(wù)性能得到最大化硬件加速,同時端到端縮小延時,一體化助力云端實時圖形渲染、AI增強處理、視頻編解碼等需求。這個架構(gòu)包含硬件架構(gòu)和軟件架構(gòu)。

與瀚博統(tǒng)一計算架構(gòu)同時推出的是瀚博的軟件平臺VastStream,有統(tǒng)一接口、靈活調(diào)度、通用AI計算、多路高效視頻轉(zhuǎn)碼+AI增強、易編程快遷移、工具鏈完備等,可加速各類AI應用部署,包括計算機視覺、視頻處理、自然語言處理、搜索與推薦、算子自定義擴展等。

基于這樣的理念和軟硬件統(tǒng)一架構(gòu),更容易理解瀚豐富的產(chǎn)品線,以及統(tǒng)一架構(gòu)的價值。

基于統(tǒng)一計算架構(gòu)的AI和GPU芯片

去年,瀚博半導體發(fā)布了其首款云端AI推理芯片SV102及搭載此芯片的載天系列通用加速卡VA1。

“我們的第一個產(chǎn)品選擇了AI+視頻領(lǐng)域,這是我們的突破口。”錢軍透露,“在第一款芯片SV102中,就有一個性能不錯的圖形渲染模塊,只是我們沒有對外宣傳。兩款產(chǎn)品都基于瀚博的統(tǒng)一計算架構(gòu)中。”

可以將瀚博的統(tǒng)一計算架構(gòu)理解為一個構(gòu)建好的房屋整體框架,框架確定了不同的功能區(qū)域,也就是對應不同的加速核。根據(jù)需求,房屋建設(shè)的時候可以在架構(gòu)不變的前提下可以調(diào)整功能區(qū)并裝修成不同風格,對應到芯片上,也就是不同性能、功能有所差異的芯片。

這樣做最大的優(yōu)勢是可以復用很多資源,以最少的投入滿足更多的需求,其實也就是互聯(lián)網(wǎng)公司所提的中臺的優(yōu)勢。

體現(xiàn)到產(chǎn)品中,基于統(tǒng)一的計算架構(gòu),瀚博既能開發(fā)出高性能云端推理芯片以及邊緣的AI芯片,也能推出GPU。

2022世界人工智能大會期間,瀚博不僅發(fā)布了數(shù)據(jù)中心推理卡載天VA10,以及首款面向邊緣大算力場景推理卡載天VE1系列,還展示了即將發(fā)布的7你們云端GPU芯片SG100。

載天V10是VA1的后續(xù)產(chǎn)品,最大的亮點是Int8峰值算力達400TOPS,刷新業(yè)界紀錄,適用于直播視頻增強、智慧交通管理、實時語義理解等場景。

瀚博給出的數(shù)據(jù)顯示,載天VA10的功耗為150瓦,整體最高推理性能達到同功耗主流GPU的2倍以上,且延時低至后者的6%。在低延時場景(低于4毫秒的YoloV3檢測算法場景)下,載天VA10推理性能達到同功耗市場主流GPU的3倍以上。

瀚博75瓦的加速卡就可以替代150瓦的卡,之所以我們還是150瓦的卡,主要是考慮到服務(wù)器有不同結(jié)構(gòu),有的結(jié)構(gòu)不一定能插入16+75瓦的卡,150瓦的加速卡適用性更廣。”錢軍表示。

載天VE1系列是瀚博首款面向邊緣大算力的推理卡,具有超低時延與超高吞吐率、低功耗、大算力的特性。在40-65瓦功耗下,INT8峰值算力達100 TOPS,支持60路1080P視頻實時解碼,支持主流AI框架的模型,提供從模型編譯到推理優(yōu)化的全流程低代碼開發(fā)框架VastPipe,提供端到端的軟硬件AI推理解決方案。

為什么用中臺理念做AI芯片和GPU?

另據(jù)瀚博的測試數(shù)據(jù),載天VE1吞吐率達到主流GPU的2倍,時延僅為其的1/5。

“載天VE1可以在非常適用于智慧交通、車路協(xié)同、工業(yè)質(zhì)檢等邊緣打算力場景,充分發(fā)揮超高吞吐率和超低時延的優(yōu)勢?!卞X軍表示。

AI芯片之外,瀚博新產(chǎn)品的一大亮點就是7nm云端GPU——瀚博SG100。

錢軍稱SG100 GPU擁有世界領(lǐng)先的超高吞吐、超高質(zhì)量、低延時的編碼能力,集渲染、AI、視頻于一體,還提供世界一流的SR-IOV虛擬化支持。

為什么用中臺理念做AI芯片和GPU?

雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,SG100會在不久的將在正式發(fā)布和量產(chǎn)。

對于推出GPU,錢軍表示這一直在其公司的計劃中,也相信元宇宙的發(fā)展回對圖形渲染有爆炸式的需求增長,瀚博的GPU看好的是這一市場需求。

當然,瀚博能設(shè)計出GPU還有團隊的關(guān)鍵因素。錢軍在創(chuàng)業(yè)前是AMD 高管,曾帶領(lǐng)AMD中國團隊設(shè)計量產(chǎn)了業(yè)界第一顆7納米圖形處理器和第一顆7納米GPGPU架構(gòu)的AI芯片。瀚博和核心研發(fā)團隊也都擁有18年以上高端芯片設(shè)計和量產(chǎn)的經(jīng)驗。

統(tǒng)一計算架構(gòu)對產(chǎn)品落地的價值

對于一家初創(chuàng)公司來說,同時布局云端推理、邊緣高性能推理以及GPU三條產(chǎn)品線需要大量的資金投入,是一個巨大的挑戰(zhàn)。以中臺的理念,用統(tǒng)一計算架構(gòu)的方式,能夠在很大程度上提升研發(fā)的效率,降低投入。

實際上芯片巨頭也在采用這樣的路線,比如高通就提出了統(tǒng)一的技術(shù)路線圖。

中臺理念,或者說統(tǒng)一計算架構(gòu)在實際執(zhí)行中面臨著諸多挑戰(zhàn),要在一個統(tǒng)一的計算架構(gòu)下,涵蓋多款不同特性的產(chǎn)品,非??简灱軜?gòu)設(shè)計者的能力,必須要有長遠的考慮,有架構(gòu)思維,保證架構(gòu)有足夠的靈活性,同時要兼顧效率等要求。

軟件層面,由于要直接面對最終用戶,在各種不同的需求下,要兼顧易用性和靈活性,同時還需要面對效率的挑戰(zhàn),并且還要在統(tǒng)一架構(gòu)的框架下,保證產(chǎn)品的延續(xù)性。

這就意味著,統(tǒng)一的架構(gòu)能帶來效率的提升,但也考驗著底層架構(gòu)設(shè)計者的經(jīng)驗和能力,以及最終產(chǎn)品實現(xiàn)時的堅定決心。當然,統(tǒng)一架構(gòu)的優(yōu)勢也十分明顯,在構(gòu)建生態(tài)以及產(chǎn)品落地時,能夠集中力量,更快發(fā)展。

2022年,瀚博先后與福建大數(shù)據(jù)集團、國寧瑞能,高新興、超聚變等企業(yè),在智慧城市、智慧政務(wù)、智慧交通、智慧園區(qū)、智慧能源等場景開展了深入合作。

接下來,隨著邊緣大算力AI產(chǎn)品的推出和落地,加上即將發(fā)布的GPU,我們將能夠看到瀚博的統(tǒng)一架構(gòu)戰(zhàn)略的成敗。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說