丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn)，強(qiáng)烈建議使用更快更安全的瀏覽器

此為臨時(shí)鏈接，僅用于文章預(yù)覽，將在時(shí)失效

芯片設(shè)計(jì) 正文

發(fā)私信給趙之齊

發(fā)送

0

自研芯片公司：英偉達(dá)在前，其余公司能否望其項(xiàng)背？

本文作者：趙之齊

2024-12-17 11:10

導(dǎo)語(yǔ)：道阻且長(zhǎng)，各家公司如何打出自己的王牌產(chǎn)品？

在追求構(gòu)建更強(qiáng)大人工智能（AI）模型的當(dāng)下，一般的通用芯片已難以支撐，行業(yè)對(duì)人工智能芯片的需求顯著增長(zhǎng)。在AI芯片領(lǐng)域，有英偉達(dá)（NVIDIA）、超威半導(dǎo)體（AMD）、英特爾（Intel）等耳熟能詳?shù)拇蠊境掷m(xù)深耕，也有Groq、SambaNova Systems、Cerebras Systems等后起之秀雨后春筍般涌出。AI勢(shì)頭正盛，未來(lái)AI芯片領(lǐng)域中，誰(shuí)能躋身前列？雷峰網(wǎng)根據(jù)行業(yè)現(xiàn)有報(bào)告，梳理目前頂尖的AI硬件公司，回顧其發(fā)展動(dòng)態(tài)。

自研芯片公司：英偉達(dá)在前，其余公司能否望其項(xiàng)背？

主要的芯片領(lǐng)導(dǎo)者

1.英偉達(dá)NVIDIA

受益于生成式AI市場(chǎng)的爆發(fā)，英偉達(dá)成了數(shù)據(jù)中心人工智能芯片領(lǐng)域霸主——據(jù)統(tǒng)計(jì)，英偉達(dá)目前在數(shù)據(jù)中心AI市場(chǎng)擁有98%的市場(chǎng)份額，相比之下，AMD僅有1.2%的市場(chǎng)份額，英特爾則只有不到1%，英偉達(dá)的領(lǐng)導(dǎo)者地位毋庸置疑。

1990年代以來(lái)，英偉達(dá)一直在為游戲領(lǐng)域生產(chǎn)圖形處理單元(GPU)，PlayStation3和Xbox都使用英偉達(dá)的視頻圖形陣列。同時(shí)，英偉達(dá)也生產(chǎn)Volta、Xavier和Tesla等人工智能芯片，其芯片組旨在解決各行業(yè)的業(yè)務(wù)問(wèn)題。例如，Xavier是自動(dòng)駕駛解決方案的基礎(chǔ)，Volta則是針對(duì)數(shù)據(jù)中心；而DGX?A100和H100是英偉達(dá)成功的旗艦AI芯片，專為數(shù)據(jù)中心的AI訓(xùn)練和推理而設(shè)計(jì)。目前為止，英偉達(dá)發(fā)布了H200、B200和GB200芯片，HGX服務(wù)器（如結(jié)合了8個(gè)此類芯片的HGX H200和HGX B200）；將更多芯片組合成大型叢集的NVL系列和GB200 SuperPod。

不過(guò)，需指出的是，由于英偉達(dá)的AI芯片價(jià)格高昂，且存在供應(yīng)不足的問(wèn)題，部分客戶也希望選擇其他替代產(chǎn)品。

而在云端GPU上，英偉達(dá)也幾乎處于壟斷地位，大多數(shù)云端廠商只將英偉達(dá)GPU作為云端GPU。英偉達(dá)也推出了DGX Cloud產(chǎn)品，直接向企業(yè)提供云端的GPU基礎(chǔ)架構(gòu)。

近年來(lái)，國(guó)內(nèi)廠商華為海思、景嘉微、海光信息、寒武紀(jì)、芯原股份、龍芯中科等，也在加速GPU領(lǐng)域的研發(fā)。

2、超威半導(dǎo)體（AMD）

AMD是一家擁有CPU、GPU和AI加速器產(chǎn)品的芯片制造商。在ChatGPT引發(fā)生成式AI熱潮后，人們對(duì)英偉達(dá)AI硬件的需求迅速增加，導(dǎo)致其采購(gòu)更難。在2023年開(kāi)始，有初創(chuàng)公司、研究機(jī)構(gòu)、企業(yè)和科技巨頭開(kāi)始采用AMD硬件。

2023年底，AMD發(fā)布了新一代AI/HPC專用加速器Instinct MI300系列，包括純GPU設(shè)計(jì)的MI300X、CPU+GPU融合設(shè)計(jì)的MI300A，全面對(duì)標(biāo)英偉達(dá)H100系列。由于AI算力需求激增，MI300銷量增長(zhǎng)迅速，在2024年二季度的收入超過(guò)10億美元，成為AMD有史以來(lái)增長(zhǎng)速度最快的產(chǎn)品。

據(jù)悉，AMD將發(fā)布MI350系列來(lái)取代MI300，并與英偉達(dá)的H200競(jìng)爭(zhēng)。此外，Instinct MI325X預(yù)計(jì)于2024年第四季度發(fā)貨，與H200的大規(guī)模交付僅相差一個(gè)季度——AMD表示，在運(yùn)行Llama 3.1 和Mixtral 等大型AI模型時(shí)，MI325X的推理性能會(huì)比現(xiàn)有市場(chǎng)領(lǐng)先者H200高出20%至40%。

AMD也與HuggingFace等機(jī)器學(xué)習(xí)公司合作，使數(shù)據(jù)科學(xué)家能更有效地使用他們的硬件。不過(guò)，開(kāi)發(fā)硬件的同時(shí)，軟件生態(tài)系統(tǒng)也至關(guān)重要，因硬件效能很大程度上依賴軟件優(yōu)化。例如，AMD和英偉達(dá)在H100和MI300基準(zhǔn)測(cè)試上存在公開(kāi)分歧，分歧焦點(diǎn)是基準(zhǔn)測(cè)試中使用的包和浮點(diǎn)數(shù)。根據(jù)最新的基準(zhǔn)測(cè)試，對(duì)于70B LLM的推理，MI300似乎更好、或與H100相當(dāng)。

3.英特爾Intel

英特爾是CPU市場(chǎng)最大的廠商，擁有悠久的半導(dǎo)體開(kāi)發(fā)歷史。2017年，英特爾成為全球第一家銷售額突破10億美元大關(guān)的AI芯片公司。

英特爾的至強(qiáng)CPU適用于各種工作，包括數(shù)據(jù)中心的處理，對(duì)其商業(yè)成功產(chǎn)生了影響。在2024年9月底，英特爾發(fā)布了新一代至強(qiáng)6性能核處理器，代號(hào)Granite Ridge，專為滿足AI、數(shù)據(jù)分析、科學(xué)計(jì)算等計(jì)算密集型業(yè)務(wù)的需求而設(shè)計(jì)。據(jù)官方數(shù)據(jù)，與第五代至強(qiáng)相比，至強(qiáng)6處理器擁有多達(dá)2倍的每路核心數(shù)，平均單核性能提升高達(dá)1.2倍，平均每瓦性能提升高達(dá)1.6倍。

此外，Gaudi3是英特爾最新的AI加速器處理器，英特爾稱其比英偉達(dá)的H100 GPU更快、更有效率，在訓(xùn)練大語(yǔ)言模型方面比H100快1.7倍，并且，Gaudi3的成本預(yù)算遠(yuǎn)比H100低。不過(guò)，自2024年4月公開(kāi)發(fā)布以來(lái)，目前對(duì)Gaudi3性能的基準(zhǔn)測(cè)試仍較有限。

生產(chǎn)AI芯片的公共云提供商

4.AWS

AWS生產(chǎn)用于模型訓(xùn)練的Tranium芯片和用于推理的Inferentia芯片。在2024年12月，AWS宣布Trainium2正式可用，其性能比第一代產(chǎn)品提升4倍，能在極短的時(shí)間內(nèi)訓(xùn)練基礎(chǔ)模型和大語(yǔ)言模型，且能源效率提升多達(dá)2倍。AWS將推出一款由數(shù)十萬(wàn)顆自研Trainium芯片組成的巨型人工智能超級(jí)計(jì)算機(jī)。蘋(píng)果也會(huì)成為其最新的芯片客戶之一。

雷峰網(wǎng)還了解到，在全球云計(jì)算服務(wù)市場(chǎng)中，AWS獨(dú)占近半壁江山。根據(jù)2022年的統(tǒng)計(jì)，AWS占據(jù)全球IaaS市場(chǎng)份額的40%。不過(guò)，AWS是在谷歌之后才開(kāi)始構(gòu)建自己的芯片。

5.谷歌云平臺(tái)

TPU是谷歌推出的神經(jīng)網(wǎng)絡(luò)專用芯片，為優(yōu)化自身的TensorFlow機(jī)器學(xué)習(xí)框架而打造。其Google Cloud TPU為翻譯、照片、搜索、助手和Gmail 等產(chǎn)品提供支持，也可以通過(guò)Google Cloud使用。

谷歌在2016年發(fā)布了TPU，在2024年推出第六代TPU：Trillium。谷歌表示，Trillium TPU每一晶片峰值計(jì)算效能提升了4.7 倍，是“相當(dāng)驚人的表現(xiàn)”，且Trillium TPU可以更快速地訓(xùn)練下一代基礎(chǔ)模型，以較短的延遲時(shí)間與較低成本提供模型服務(wù)。谷歌亦強(qiáng)調(diào)這一產(chǎn)品的永續(xù)特質(zhì)：與TPU v5e相比，Trillium TPU的能源效率高出67%。

除此之外，Edge TPU是谷歌Alphabet的另一款加速器芯片，它適用于多種設(shè)備類型的原型設(shè)計(jì)和生產(chǎn)設(shè)備，比一分硬幣還小，專為智能手機(jī)、平板電腦和物聯(lián)網(wǎng)設(shè)備等邊緣設(shè)備而設(shè)計(jì)。

6.阿里巴巴

阿里巴巴于2019年發(fā)布了首款A(yù)I芯片“含光800”，這款云端AI芯片是當(dāng)時(shí)全球最高性能的AI推理芯片，主要應(yīng)用于視覺(jué)場(chǎng)景。據(jù)悉，其基于12nm工藝與自研架構(gòu)，集成了170億晶體管，性能峰值算力達(dá)820 TOPS。在業(yè)界標(biāo)準(zhǔn)的ResNet-50測(cè)試中，推理性能達(dá)到78563 IPS，比當(dāng)時(shí)業(yè)界最好的AI芯片性能高出四倍；能效比達(dá)500 IPS/W，是第二名的3.3倍。

7.IBM

IBM于2022年發(fā)布其最新的深度學(xué)習(xí)芯片——人工智能單元(AIU)。IBM表示，這是其第一個(gè)完整的系統(tǒng)單芯片，旨在比通用CPU更快、更有效率地運(yùn)行和訓(xùn)練深度學(xué)習(xí)模型。IBM正在考慮使用這些芯片為其生成式AI平臺(tái)watson.x提供支持。

AIU基于“IBM Telum處理器”構(gòu)建，該處理器為IBM Z大型機(jī)服務(wù)器的AI處理功能提供支持。Telum處理器推出時(shí)的突出用例包括欺詐檢測(cè)等。IBM還展示了合并計(jì)算和內(nèi)存可以提高效率，并在North Pole處理器原型中得到演示。

領(lǐng)先的AI芯片初創(chuàng)公司

一些AI芯片行業(yè)的初創(chuàng)公司盡管才剛剛成立，卻已經(jīng)籌集了數(shù)百萬(wàn)美元，未來(lái)我們可能會(huì)更頻繁聽(tīng)到它們的名字。

8.Groq

Groq由谷歌前員工創(chuàng)立。其自研的LPU（語(yǔ)言處理器），旨在以前所未有的速度加速AI模型。在2024年，Groq憑借自研的硬件加速器LPU，達(dá)成了500個(gè)token/s的神級(jí)推理速度，秒殺ChatGPT。行內(nèi)人士認(rèn)為，Groq代表了可用速度的一步變化，為L(zhǎng)LM提供了新的用例。Groq創(chuàng)始人表示，Groq的存在是為了消除“貧富差距”，幫助AI社區(qū)中的每個(gè)人蓬勃發(fā)展。

Groq專注于LLM推理，并發(fā)布了Llama-270B的基準(zhǔn)測(cè)試。2024年第一季度，該公司表示，有7萬(wàn)名開(kāi)發(fā)人員在其云平臺(tái)上注冊(cè)并構(gòu)建了1.9萬(wàn)個(gè)新應(yīng)用程序。而早在2022年3月1日，Groq收購(gòu)了Maxeler，后者為金融服務(wù)提供高性能計(jì)算(HPC)解決方案。Groq已經(jīng)籌集了約3.5億美元，并生產(chǎn)了GroqChip?處理器、GroqCard?加速器等。

9.SambaNova Systems

SambaNova Systems成立于2017年，旨在為大量生成式AI工作負(fù)載開(kāi)發(fā)高性能、高精度硬件軟件系統(tǒng)。該公司開(kāi)發(fā)了全球首款面向萬(wàn)億參數(shù)規(guī)模AI模型的AI芯片系統(tǒng)——基于可重構(gòu)數(shù)據(jù)流單元 (RDU) 的AI芯片SN40L。據(jù)悉，該芯片專門為運(yùn)行企業(yè)應(yīng)用程序的大型語(yǔ)言模型而構(gòu)建，其設(shè)計(jì)目標(biāo)是能承載ChatGPT高級(jí)版本兩倍容量以上的大模型，可為一個(gè)擁有5萬(wàn)億個(gè)參數(shù)的模型提供服務(wù)。對(duì)比英偉達(dá)的H100芯片，SN40L不僅推理性能達(dá)到了H100的3.1倍，在訓(xùn)練性能也達(dá)到了H100的2倍，而總擁有成本更僅有其1/10。

不僅如此，SambaNova Systems還將其平臺(tái)出租給企業(yè)。SambaNova的人工智能平臺(tái)即服務(wù)方式，使其系統(tǒng)更易于采用，并鼓勵(lì)硬件重復(fù)使用以實(shí)現(xiàn)循環(huán)經(jīng)濟(jì)。該公司也已籌集了超過(guò)11億美元的資金。

10.Cerebras Systems

Cerebras Systems成立于2015年，推動(dòng)了芯片設(shè)計(jì)領(lǐng)域的一場(chǎng)革命——將整片晶圓制成一個(gè)巨大的芯片。其于2019年推出的WSE-1，具有1.2萬(wàn)億個(gè)晶體管和40萬(wàn)個(gè)處理核心，可同時(shí)專注于AI和HPC（高性能計(jì)算機(jī)群）的工作負(fù)載。

而在2021年，Cerebras推出專為超級(jí)計(jì)算機(jī)任務(wù)打造的Wafer Scale Engine 2（WSE-2），為當(dāng)時(shí)全球最大AI芯片。與其之前推出的WSE-1相比，WSE-2在面積上沒(méi)有變化，但擁有創(chuàng)紀(jì)錄的2.6萬(wàn)億個(gè)晶體管以及85萬(wàn)個(gè)AI優(yōu)化核，其芯片的所有性能特征，均比一代增加了一倍以上。2024年3月，Cerebras發(fā)布擁有4萬(wàn)億個(gè)晶體管和90萬(wàn)個(gè)AI核心的WSE-3，將用于訓(xùn)練一些業(yè)界最大的人工智能模型，理論上能訓(xùn)練多達(dá)24萬(wàn)億個(gè)參數(shù)的AI模型。WSE-3采用臺(tái)積電先進(jìn)的5納米工藝技術(shù)，將其現(xiàn)有最快AI芯片的世界紀(jì)錄提升了一倍。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))了解到，Cerebras的系統(tǒng)還與阿斯利康和葛蘭素史克等制藥公司及研究實(shí)驗(yàn)室合作，如利用生物數(shù)據(jù)集訓(xùn)練大規(guī)模的語(yǔ)言模型，能顯著縮短AI模型訓(xùn)練時(shí)間、加快研發(fā)進(jìn)程，對(duì)新藥的發(fā)現(xiàn)和開(kāi)發(fā)具有重要意義。

11.Etched

他們選擇為了效率而犧牲了靈活性——將變壓器架構(gòu)刻錄到芯片中。

Etched宣布推出一款針對(duì)Transformer架構(gòu)專用的ASIC芯片“Sohu”。據(jù)稱，8個(gè)Sohu芯片每秒可以生成500,000個(gè)token，遠(yuǎn)超過(guò)配備8張英偉達(dá)最新的B200 GPU加速卡的服務(wù)器約10倍，其AI性能達(dá)到英偉達(dá)H100的20倍——這也意味著Sohu芯片將可以大幅降低現(xiàn)有AI數(shù)據(jù)中心的采購(gòu)成本和安裝成本。

不過(guò)，目前，這些都是基于團(tuán)隊(duì)的內(nèi)部測(cè)量，許多問(wèn)題還沒(méi)有得到解答：模型過(guò)時(shí)時(shí)如何處置？用戶是否需要購(gòu)買新芯片，還是舊芯片可以用下一個(gè)模型重新配置？他們?nèi)绾芜\(yùn)行基準(zhǔn)測(cè)試，使用了哪種量化和模型？此外，考慮到每隔幾個(gè)月就會(huì)發(fā)布新模型，將模型刻錄到芯片中的做法是否可持續(xù)，這一答案也令人期待。

12.Tenstorrent

Tenstorrent生產(chǎn)高性能AI芯片Wormhole芯片，可擴(kuò)展且成本效益高；還有供研究人員使用的臺(tái)式機(jī)和由Wormhole芯片驅(qū)動(dòng)的服務(wù)器（例如Tenstorrent Galaxy）。該公司還為其解決方案提供軟件棧。據(jù)悉，Tenstorrent于2024年12月從包括杰夫·貝佐斯(Jeff Bezos)在內(nèi)的投資者那里籌集了7億美元，估值超過(guò)26億美元。

即將到來(lái)的AI硬件生產(chǎn)商有哪些？

還有一些引人注目的AI硬件解決方案，但由于它們是市場(chǎng)新手，目前對(duì)其有效性的基準(zhǔn)測(cè)試有限。

蘋(píng)果作為一家主要的芯片設(shè)計(jì)商，也在自研數(shù)據(jù)中心AI芯片——項(xiàng)目名為ACDC。據(jù)稱，該公司正在與臺(tái)積電合作設(shè)計(jì)和生產(chǎn)這些人工智能芯片。這些服務(wù)器芯片的主要焦點(diǎn)可能是AI推理，其中涉及經(jīng)過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)模型從新數(shù)據(jù)中得出結(jié)論。而就在2024年12月底，有消息稱蘋(píng)果正與博通合作開(kāi)發(fā)AI芯片，是其首個(gè)專為人工智能設(shè)計(jì)的服務(wù)器芯片，或?yàn)樾袠I(yè)帶來(lái)更深刻的變革。

Meta也努力想在生成式AI領(lǐng)域趕上競(jìng)爭(zhēng)對(duì)手。在英特爾宣布其最新AI加速器硬件的第二天，Meta公布其芯片研發(fā)的最新成果：下一代 MTIA（Meta Training and Inference Accelerator），MTIA是專為Meta AI工作負(fù)載而設(shè)計(jì)的定制芯片系列。據(jù)悉，下一代MTIA基于臺(tái)積電5nm技術(shù)，據(jù)稱與MTIAv1相比性能提高了3倍。MTIA目前供Meta內(nèi)部使用，但未來(lái)如果Meta推出基于LLaMa的企業(yè)生成AI產(chǎn)品，這些芯片可以為此類產(chǎn)品提供支持。

此外，微軟于2023年11月推出Maia AI加速器。還有總部位于韓國(guó)的初創(chuàng)公司Rebellions在2024年籌集了1.24億美元，專注于LLM推理。

還有一些AI芯片生產(chǎn)商，如Graphcore，一家成立于2016年的英國(guó)公司，已發(fā)布其旗艦AI芯片IPU-POD256，能提供64 petaFLOPS的AI計(jì)算。該公司已獲得了約7億美元的融資，與DDN、Pure Storage和Vast Data等數(shù)據(jù)存儲(chǔ)公司建立了戰(zhàn)略合作伙伴關(guān)系，其AI芯片服務(wù)于牛津大學(xué)OMI量化金融研究院、布里斯托大學(xué)和加州大學(xué)伯克利分校等研究機(jī)構(gòu)。不過(guò)，該公司的長(zhǎng)期生存能力面臨風(fēng)險(xiǎn)，因其每年虧損約2億美元，2024年10月，軟銀（Softbank）以多于6億美元的價(jià)格收購(gòu)了它。

而成立于2012年、專注于邊緣AI的Mythic，走的是一條非常規(guī)的路線——模擬計(jì)算架構(gòu)，旨在提供節(jié)能的邊緣AI計(jì)算。它推出了模擬計(jì)算引擎（ACE）M1076 AMP、MM1076 key card等產(chǎn)品，并已籌集了約1.65億美元的資金。不過(guò)，Mythic在2023年3月的融資中解雇了大部分員工并重組了業(yè)務(wù)。

同時(shí)，OpenAI也在籌集資金打造自己的AI硬件。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

趙之齊

作者

關(guān)注算力、AI及相關(guān)IR話題等。微信：Ericazhao23。

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

MIT 融資安全車聯(lián)網(wǎng) 強(qiáng)化學(xué)習(xí) GPU 元宇宙 Gear VR iPhone 7 Evernote Galaxy

為了您的賬戶安全，請(qǐng)驗(yàn)證郵箱

您的郵箱還未驗(yàn)證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請(qǐng)驗(yàn)證您的郵箱

立即驗(yàn)證

完善賬號(hào)信息

您的賬號(hào)已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說(shuō)

<tfoot id="qgmsq"></tfoot>

<table id="qgmsq"></table>