丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給趙之齊
發(fā)送

0

博通的「英偉達(dá)時(shí)刻」,靠X+ASIC成就

本文作者: 趙之齊   2024-12-18 16:07
導(dǎo)語:用ASIC還是GPU?這是一個(gè)問題。

當(dāng)GPT-4被問到在GPU(圖形處理單元)上和在ASIC(專用集成電路)上運(yùn)行,哪個(gè)會(huì)更高效時(shí),它答道:「如果我使用專門為AI任務(wù)設(shè)計(jì)的ASIC,我可能會(huì)實(shí)現(xiàn)更快的性能和更高的效率?!?/p>

在訓(xùn)練大模型數(shù)據(jù)出現(xiàn)可預(yù)見枯竭的當(dāng)下,ASIC逐漸進(jìn)入人們視野,注重研發(fā)ASIC芯片的博通(Broadcom)乘風(fēng)而起。上周五晚,美股市場出現(xiàn)買博通、賣英偉達(dá)(NVIDIA)的場景——博通股價(jià)大漲超24%,創(chuàng)下歷史最高當(dāng)日漲幅記錄,成為繼英偉達(dá)和臺積電后,第三家市值突破一萬億美元的半導(dǎo)體公司。

據(jù)雷峰網(wǎng)了解,目前博通的市盈率(P/E Ratio)已高于英偉達(dá):按12月17日收盤價(jià),博通的市盈率為184.79,而英偉達(dá)的市盈率為51.54。這似乎也表明,投資者們更看好博通的未來。

與注重研發(fā)通用芯片GPU的英偉達(dá)不同,博通更專注于ASIC定制化芯片。這類能耗較低、專為特定任務(wù)設(shè)計(jì)的芯片,對企業(yè)的研發(fā)技術(shù)水平要求很高、制作流程也耗時(shí)較長。也因此,有行業(yè)人士指出「這些芯片并不適合所有人」。不過,在AI大模型推理被提上日程的今天,GPU的性價(jià)比也逐漸被打上問號?;蛟S,博通和英偉達(dá)的未來發(fā)展,不僅是兩家科技公司的商業(yè)策略相較,也是GPU和ASIC兩種芯片應(yīng)用場景的一較高下。

博通的「英偉達(dá)時(shí)刻」,靠X+ASIC成就

圖源:greenmossinv


博通的崛起:天時(shí)地利人和

今年12月,博通發(fā)布的最新一期第四財(cái)季財(cái)報(bào)顯示,其全年AI相關(guān)業(yè)務(wù)收入同比實(shí)現(xiàn)增長220%。

博通CEO Hock Tan指,這得益于公司旗下AI XPU類芯片和以太網(wǎng)產(chǎn)品組合的需求支撐。他續(xù)透露,目前博通已有三家超大規(guī)模客戶制定自己的多代AI XPU路線圖,預(yù)計(jì)到2027年,每個(gè)客戶在單一網(wǎng)絡(luò)架構(gòu)中將部署100萬個(gè)XPU集群;同時(shí),博通還在為兩家新的超大規(guī)??蛻粼O(shè)計(jì)開發(fā)相應(yīng)下一代AI XPU產(chǎn)品,預(yù)計(jì)將在2025年下半年實(shí)現(xiàn)對3nm XPU的大規(guī)模出貨。

根據(jù)業(yè)界分析,博通ASIC芯片的大客戶主要包括谷歌、Meta。也有傳言稱,字節(jié)跳動(dòng)和Open AI已與博通合作開發(fā)芯片。近日也有消息透露,蘋果似乎正與博通合作計(jì)劃開發(fā)AI服務(wù)器芯片。

據(jù)了解,博通為這些知名科技公司開發(fā)用于AI、通用數(shù)據(jù)處理等用途的芯片,一般是與其客戶確定工作的負(fù)載需求后,跟合作伙伴確定芯片的規(guī)格,利用博通在硅片設(shè)計(jì)方面的專業(yè)知識,開發(fā)其主要存在差異化因素的關(guān)鍵方面,如處理單元架構(gòu)。之后,博通在硅片中實(shí)現(xiàn)該架構(gòu),并配備平臺特定的IP、緩存、芯片間互聯(lián)接口。

博通的AI計(jì)算ASIC還利用共封裝光學(xué)器件來提高能源效率和可擴(kuò)展性,減少系統(tǒng)延遲,滿足更復(fù)雜的計(jì)算要求。與傳統(tǒng)的光學(xué)器件相比,其功耗可節(jié)省高達(dá)30%。

在今年12月初,博通宣布推出其3.5D eXtreme Dimension系統(tǒng)級封裝 (XDSiP?) 平臺技術(shù),使消費(fèi)級AI客戶能夠開發(fā)下一代定制加速器 (XPU)和計(jì)算ASIC。3.5D XDSiP在一個(gè)封裝設(shè)備中集成了超過6000平方毫米的硅片,和多達(dá)12個(gè)高帶寬內(nèi)存 (HBM) 堆棧,可實(shí)現(xiàn)大規(guī)模AI的高效、低功耗計(jì)算。博通推出的這款業(yè)界首個(gè)Face-to-Face (F2F) 3.5D XPU,是一個(gè)重要的里程碑。

訓(xùn)練生成式AI模型所需的巨大算力依賴于10萬個(gè)到100萬個(gè)XPU的大規(guī)模集群。這些XPU需要越來越復(fù)雜的計(jì)算、內(nèi)存和I/O功能集成,同時(shí)最大限度地降低功耗和成本。在過去十年中,2.5D集成——涉及在中介層上集成多個(gè)芯片(面積高達(dá)250mm2)和HBM模塊(高達(dá) 8 HBM)——已被證明對XPU的開發(fā)很有價(jià)值。然而,隨著漸趨復(fù)雜的LLM(大型語言模型)推出,它們的訓(xùn)練需要3D硅堆疊,以達(dá)到更好的尺寸、功率和成本。因此,將3D硅堆疊與2.5D封裝相結(jié)合的3.5D集成,有望成為未來十年下一代XPU的首選技術(shù)。

與F2B(正面對背面)相比,博通的3.5D XDSiP平臺在互連密度和功率效率方面取得了顯著的改進(jìn),其堆疊芯片之間的信號密度提高了7倍。并且,通過使用3D HCB而非平面芯片到芯片PHY,可將芯片到芯片接口的功耗降低10倍。在此基礎(chǔ)上,這一技術(shù)還可最大限度地減少3D堆棧內(nèi)計(jì)算、內(nèi)存和I/O組件之間的延遲;并實(shí)現(xiàn)更小的中介層和封裝尺寸,節(jié)省成本并改善封裝翹曲。

成立于1991年的老博通,最初是一家專注于寬帶通信解決方案的小型半導(dǎo)體公司,產(chǎn)品范圍涵蓋有線和無線通信、企業(yè)存儲和數(shù)據(jù)中心解決方案。該公司在2016年被Avago Technologies收購后采用博通(Broadcom)這個(gè)名字。如今,博通為當(dāng)下最關(guān)鍵的技術(shù)提供支持,包括5G網(wǎng)絡(luò)、人工智能和物聯(lián)網(wǎng) (IoT)。

博通在人工智能市場的成功很大程度上歸功于其定制硅片解決方案和高速網(wǎng)絡(luò)產(chǎn)品。它已成為主要科技巨頭的人工智能芯片的主要供應(yīng)商,其XPU技術(shù)在超大規(guī)??蛻糁性絹碓绞軞g迎。博通還指出,芯片市場正從以CPU為中心轉(zhuǎn)向以連接為中心,而后者正是博通的專長。Piper Sandler分析師Harsh Kumar也看好博通:「我們繼續(xù)認(rèn)為博通是最好的AI公司(不包括英偉達(dá)),因?yàn)樗诙ㄖ艫SIC業(yè)務(wù)中占據(jù)強(qiáng)勢地位,并且擁有強(qiáng)大的軟件產(chǎn)品組合」。

在AI革命熱潮下,博通的多管齊下戰(zhàn)略,包括投入資金進(jìn)行收購、提供定制芯片和擴(kuò)展到軟件業(yè)務(wù),使其成為強(qiáng)大的競爭對手。

與此同時(shí),隨著AI大模型訓(xùn)練數(shù)據(jù)漸趨枯竭,AI領(lǐng)域的任務(wù)從訓(xùn)練端逐步轉(zhuǎn)向推理端。有行業(yè)人士指,這一轉(zhuǎn)型或意味著人們對芯片的計(jì)算精度要求相對可能降低,但對計(jì)算速度、能效成本等要求提高,而能以較低功耗實(shí)現(xiàn)快速推理計(jì)算的ASIC正好滿足這一需求。對此,博通CEO Hock Tan預(yù)測:未來50%的AI算力都會(huì)是ASIC提供。他更放言:2027年市場對定制AI芯片ASIC的需求規(guī)模將達(dá)600億至900億美元。

博通在AI領(lǐng)域的大膽舉措,為AI芯片市場的史詩級對決埋下伏筆。


X+ASIC vs 英偉達(dá)軟硬件 「護(hù)城河」被攻破了嗎

在英偉達(dá)占據(jù)AI芯片主要市場份額的情況下,大型科技公司都希望能減少對其依賴,博通也將自己定為替代方案。在此之下蓬勃生長的博通,甚至讓英偉達(dá)CEO黃仁勛感到威脅。他承認(rèn):「博通(和其他初創(chuàng)公司)的復(fù)蘇讓英偉達(dá)的規(guī)劃者感到緊張。」

與長期主導(dǎo)行業(yè)的英偉達(dá)GPU不同,博通在市場上的差異化在于它正在為全球頂級科技公司制造非常昂貴的定制AI芯片,承諾幫助他們將速度提高20%至30%,并將功耗降低25%。ASIC為擁有大量穩(wěn)定AI工作負(fù)載的科技巨頭,提供巨大的商機(jī),可以幫助企業(yè)在資本支出和功耗方面節(jié)省大量成本,這使其成為更具成本效益的選擇。

不過,這些芯片對企業(yè)的研發(fā)技術(shù)水平要求較高,且需要大量初始資本投資,制作流程也較長。據(jù)悉,做一款A(yù)SIC芯片,需經(jīng)過代碼設(shè)計(jì)、綜合、后端等復(fù)雜的設(shè)計(jì)流程,再經(jīng)幾個(gè)月生產(chǎn)加工以及封裝測試,才能拿到芯片來搭建系統(tǒng)。有分析師指出:「你必須是谷歌、Meta、微軟或甲骨文這樣的公司才能使用這些芯片,這些芯片并不適合所有人?!?/p>

因此,英偉達(dá)在市場的領(lǐng)導(dǎo)地位尚未被削弱。

英偉達(dá)豎起的堅(jiān)固壁壘,靠的不僅是其通用芯片,還有平臺衍生出的龐大軟件生態(tài)。英偉達(dá)公認(rèn)的強(qiáng)大「護(hù)城河」CUDA,作為一種專門用于加速GPU運(yùn)算的專利軟件技術(shù),能讓工程師省下大量撰寫低階語法的時(shí)間,直接使用諸如C++或Java等高階語法,來編寫應(yīng)用于通用GPU上的演算法,解決平行運(yùn)算中復(fù)雜的問題。這一軟件配以英偉達(dá)的GPU和網(wǎng)絡(luò)傳輸NVLINK——后者是一種高速、低延遲的互聯(lián)技術(shù)——三張王牌合力,強(qiáng)大的軟硬件協(xié)同完善的生態(tài),鞏固其廣泛的客戶群體。

但業(yè)界對CUDA的過于依賴,已讓不少主打AI的公司開始警惕。而做網(wǎng)絡(luò)出身的博通,強(qiáng)大的技術(shù)積累能為客戶提供高性能網(wǎng)絡(luò)傳輸;同時(shí),客戶在配備博通AI芯片的前提下,可以繼續(xù)使用自己公司的算法、系統(tǒng)和模型,無需考慮芯片是否適應(yīng)英偉達(dá)的CUDA——這讓它逐漸成為一個(gè)有力的選項(xiàng)。

在歷史上,英偉達(dá)曾面對諸多強(qiáng)大的對手,如Google、微軟、META等巨頭均有涉及制造GPU,但因?yàn)楫a(chǎn)能、CUDA等限制,這些公司都無法與英偉達(dá)競爭;但現(xiàn)在在ASIC芯片這一賽道上,由于場景在上述巨頭手上,從而繞開了對英偉達(dá)生態(tài)體系的依賴。

換言之,博通與英偉達(dá)之前的對手如AMD、Intel不同,后者更多是在技術(shù)上與英偉達(dá)展開競爭,但博通則是通過與其他對AI算力有需求的商業(yè)巨頭的合作,當(dāng)Google、Amazon等自己設(shè)計(jì)芯片后,交由博通完成后續(xù)的制造,在商業(yè)模式上撼動(dòng)英偉達(dá)的領(lǐng)導(dǎo)者地位。

這種 X+ASIC vs 英偉達(dá)的模式,也正是讓英偉達(dá)感到緊張的原因。

在半導(dǎo)體芯片的歷史上,類似的模式最成功的案例是ARM,不同的是,ARM采取的是IP授權(quán)模式,它不向市場出售成品芯片,而是靠將其研發(fā)的指令集架構(gòu)和處理器IP而獲利。憑借這一模式,ARM在移動(dòng)互聯(lián)網(wǎng)時(shí)代戰(zhàn)勝了強(qiáng)大的Intel,拿下了今天移動(dòng)終端的大市場。

不可否認(rèn)的是,ASIC是專門為特定應(yīng)用開發(fā)的,靈活性較差,且開發(fā)成本高昂耗時(shí);而GPU是可編程的,靈活性高,可用于各種任務(wù),可快速實(shí)施,擁有成熟的軟件和硬件基礎(chǔ)設(shè)施,包括廣泛使用的編程語言和庫。即使在可擴(kuò)展性方面,GPU迄今為止也得分頗高。英偉達(dá)目前是最受歡迎的AI芯片制造商之一不足為奇。

但是,這樣的局面還能持續(xù)多久?


達(dá)到的極限GPU 能否交給ASIC接力

目前,主流AI芯片主要包含以GPU為代表的通用芯片、ASIC定制化為代表的專用芯片及FPGA為代表的半定制化芯片。當(dāng)談?wù)摯笳Z言模型及訓(xùn)練集群或一般的人工智能時(shí),GPU仍是默認(rèn)選擇——專為圖形處理而生的GPU,并行處理能力出色,符合AI計(jì)算場景的需求,如處理大量數(shù)據(jù)集和加快模型訓(xùn)練時(shí)間等。英偉達(dá)的GPU仍被用于為最強(qiáng)大AI模型的訓(xùn)練和運(yùn)行提供動(dòng)力。

然而,盡管在訓(xùn)練場景中效率很高,GPU在擴(kuò)展AI應(yīng)用以進(jìn)行廣泛使用方面,卻仍面臨著重大的缺點(diǎn)。在成本和能源上,它是一種昂貴的選擇。雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,GPU設(shè)計(jì)側(cè)重于64位元素來處理廣泛的計(jì)算任務(wù),但在實(shí)時(shí)AI工作負(fù)載中,放棄64位組件可以將芯片尺寸和能源需求減少多達(dá)三分之一,同時(shí)仍能滿足大多數(shù)AI處理需求。

隨著AI走向推理,特別是處于必須在靠近源頭的地方處理數(shù)據(jù)的邊緣環(huán)境時(shí),與GPU相關(guān)的高成本和功耗將變得越來越難以承受。GPU或已達(dá)到極限。

相反,專用于AI的ASIC現(xiàn)在為特定推理任務(wù)提供了更具成本效益和更強(qiáng)大的替代方案。進(jìn)行推理更強(qiáng)調(diào)的是適合邊緣部署的可擴(kuò)展、節(jié)能的硬件解決方案——邊緣AI設(shè)備在現(xiàn)場處理數(shù)據(jù),而非將其傳輸?shù)街醒霐?shù)據(jù)中心,因此,它們會(huì)受益于輕量級、專用的芯片。

除了博通,另一家相對年輕的ASIC制造商Etched研發(fā)出了世界上第一款Transformer ASIC 「Sohu」。他們對未來的信心不僅在產(chǎn)品上,還在ASIC的發(fā)展勢頭上——

過去幾年內(nèi),AI模型已變得如此智能,甚至比人類更好地執(zhí)行標(biāo)準(zhǔn)化測試,這得益于它們獲得越來越多的計(jì)算能力。然而,數(shù)據(jù)中心的擴(kuò)展并非無限,Etched指出:「再擴(kuò)大1000倍將是昂貴的,下一代數(shù)據(jù)中心的成本將超過一個(gè)小國的GDP。按照目前的速度,我們的硬件、電網(wǎng)和錢包都跟不上」

「如果模型的訓(xùn)練成本超過10億美元,推理成本超過100億美元,那么專用芯片是不可避免的。在這種規(guī)模下,1%的改進(jìn)就足以證明一個(gè)價(jià)值5000萬至1億美元的專用芯片項(xiàng)目是合理的」,Etched說道。

此外,在另一個(gè)領(lǐng)域——挖礦,ASIC和GPU也各有所長。ASIC作為定制專用芯片,在可靠性、保密性、算力、能效上,都比通用芯片更強(qiáng),相較于GPU和CPU,在挖礦時(shí)效率也會(huì)更高。據(jù)統(tǒng)計(jì),ASIC計(jì)算哈希(Hashes)的速度比GPU和CPU快10萬倍,一臺ASIC礦機(jī)可以提供約3000美元的高端哈希算力。

不過,由于ASIC是為開采特定貨幣而制造的專用集成電路,因此在應(yīng)對加密貨幣挖礦業(yè)務(wù)或挖礦難度的變化方面,則缺乏靈活性。雖然ASIC礦機(jī)效率高、盈利能力強(qiáng),但零售礦工和剛進(jìn)入挖礦行業(yè)的個(gè)人,或會(huì)對ASIC礦機(jī)的高昂起始成本望而卻步。

相較而言,GPU由于其多功能性,能挖掘各種加密貨幣,礦工可以在不同的加密貨幣之間切換,以應(yīng)對網(wǎng)絡(luò)難度和挖礦操作的變化。但GPU能耗高,經(jīng)濟(jì)性較差,且需要大量顯卡和輔助冷卻設(shè)備,GPU設(shè)備也需要更大的空間,這對于空間有限的礦工可能會(huì)成為問題。

不可否認(rèn)的是,GPU將繼續(xù)在人工智能訓(xùn)練中發(fā)揮關(guān)鍵作用,但由于其成本和能源效率限制,行業(yè)向ASIC的轉(zhuǎn)變也已出現(xiàn)。未來GPU是否依然能占據(jù)大量的市場份額?ASIC漫長的開發(fā)周期和初始成本,又能否滿足日新月異的AI時(shí)代下用戶的需求?在對AI大模型的發(fā)展由訓(xùn)練轉(zhuǎn)向推理的當(dāng)下,一切懸而未決。



參考資料:

https://www.cnbc.com/2024/12/14/broadcoms-long-path-to-the-trillion-dollar-club-and-trumps-role.html

https://www.investing.com/news/swot-analysis/broadcoms-swot-analysis-ai-chip-leaders-stock-poised-for-growth-93CH-3775161

https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-gpu-clusters-with-one-million-gpus-are-planned-for-2027-broadcom-says-three-ai-supercomputers-are-in-the-works

https://finance.yahoo.com/news/nvidia-broadcom-top-analyst-picks-141957599.html

https://www.artificialintelligence-news.com/news/broadcom-ai-surge-challenges-nvidia-dominance/

https://theafricalogistics.com/money/broadcoms-journey-to-the-1-trillion-club-a-semiconductor-success-story/

https://www.bitdeer.com/learn/asic-vs-gpu-what-are-the-main-differences-to-consider

https://www.all-about-industries.com/asics-versus-gpus-does-the-ai-future-not-lie-in-nvidias-hands-a-616108ac6928e3d542c757192c7c26e7/

https://awavesemi.com/is-a-gpu-asic-or-chiplet-based-soc-better-for-ai-as-we-switch-from-training-to-inference/


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說