0
本文作者: 王德清 | 2021-07-18 12:07 |
近日,騰訊招聘官網(wǎng)出現(xiàn)了多個與芯片有關的崗位,引發(fā)外界關注。
騰訊招聘披露的芯片研發(fā)崗位包括:芯片架構師、芯片驗證工程師、芯片設計工程師等多個職位,工作地點可選擇北京、上海、深圳等。
以芯片架構師為例,職責包括:負責AI芯片和通用處理器或者細分領域的需求分析,主導AI,處理器芯片架構設計,競爭分析和規(guī)格定義;負責芯片領域的技術演進路標、關鍵技術,主導關鍵技術和架構的研究;負責大型芯片的架構設計,關鍵模塊的把控和設計等。
而芯片設計工程師則要求精通數(shù)字電路設計流程,精通RTL代碼書寫,具有電路優(yōu)化的經(jīng)驗;4年以上數(shù)字前端設計經(jīng)驗,有大規(guī)模 SoC 芯片設計成功量產(chǎn)經(jīng)歷以及CPU/NPU 等設計經(jīng)驗者優(yōu)先等。
該招聘消息一經(jīng)爆出,業(yè)界開始紛紛猜測:騰訊真的要進軍“卡脖子”芯片領域?
對此疑問,7月16日騰訊相關人士回應稱,這是基于一些業(yè)務需要騰訊在特定領域有一些芯片研發(fā)的嘗試,主要是AI加速和視頻編解碼等,但這并非外界所認為的通用芯片。
實際上,騰訊幾年前就已經(jīng)開始了芯片領域的布局。
2016年11月,騰訊就與阿里一起領投了可編程芯片公司Barefoot Networks的2300萬美元C輪融資。
隨后在2018年,AI芯片公司——上海燧原科技有限公司獲得了騰訊領投的Pre-A輪3.4億元人民幣投資。
2019年6月,騰訊跟投燧原科技的新一輪融資,在今年,騰訊又繼續(xù)跟投了燧原科技的C輪融資。
據(jù)天眼查數(shù)據(jù)顯示,2020年3月19日深圳寶安灣騰訊云計算有限公司成立。該公司經(jīng)營范圍就包含了集成電路設計、研發(fā)等。
然而對于造芯這件事,騰訊并非是以BAT為代表的大型互聯(lián)網(wǎng)公司中的唯一一家。
早在2018年7月,百度公司發(fā)布云端全功能AI芯片“昆侖”,其中包含訓練芯片昆侖818-300,推理芯片昆侖818-100。
目前,百度第一代昆侖芯片已于2020年初量產(chǎn),目前已經(jīng)規(guī)模化部署超過2萬片,第二代昆侖芯片已經(jīng)流片成功,將于2021年下半年量產(chǎn)。
而阿里巴巴在2018年9月的云棲大會上宣布成立平頭哥半導體有限公司,主要任務是從事芯片的自研開發(fā)與戰(zhàn)略布局。2019年9月阿里巴巴第一顆自研芯片——AI推理芯片含光800正式問世,阿里巴巴表示該芯片已經(jīng)量產(chǎn),服務于阿里巴巴內部。
“隨著云計算承載的業(yè)務規(guī)模越來越大,傳統(tǒng)服務器難以完全滿足云計算數(shù)據(jù)中心場景下對超大規(guī)模、需求多樣、高性價比、安全可靠以及軟硬件一體化等方面的要求?!?/p>
2020 Techo Park開發(fā)者大會上騰訊云服務器與供應鏈管理部總經(jīng)理劉裕勛就曾對雷鋒網(wǎng)表示到。
隨著云計算產(chǎn)業(yè)的發(fā)展,從技術的角度說,云計算已經(jīng)超過IT基礎設施的范疇,正向上定義軟件應用服務,向下定義芯片、服務器等IT硬件。
從技術角度來看,20年前,虛擬化技術實現(xiàn)了硬件細節(jié)的抽象,讓基礎設施成為由軟件管理的單一實體。過去10年,云計算進一步推動了這一進程,使硬件成為一種抽象資源,而且對于客戶來說,這個資源越來越多地由別人來管理。
然而,云計算技術雖然使硬件變得抽象,但實際上,云服務商卻在硬件層面在做這大量的創(chuàng)新工作,開始從最基礎的芯片來構建云。
同樣,在劉裕勛看來,隨著云原生理念的不斷推進,云基礎架構的演進過程中會呈現(xiàn)出三個特點:高復雜度、高性價比、安全性。
當海量業(yè)務承載在云基礎架構設施的時候,業(yè)務的多樣性,對于軟硬件一體化的系統(tǒng)實際上提出了更高的要求。面臨這樣的復雜度,云廠商根據(jù)自身的情況,必然要開始自己進行研究相關芯片,或者是與其他芯片廠商聯(lián)合起來進行深度定制,以此來解決各種復雜場景下的兼容性問題。
自研芯片的背后,則是對于BAT這般體量的云服務商而言,則是性價比最高的一條道路。
而在技術上,以英特爾的CPU為例,CPU的另外一個名字叫通用計算。而這也就代表著,搭載通用CPU的服務器具有很高的通用性,但是實際的應用中,勢必會造成性能的浪費。
對于普通用戶來說,可能十幾上百臺服務器就是應用的極限了,但是互聯(lián)網(wǎng)大廠的服務器動輒就是上萬甚至幾十萬臺,因此每臺性能的略微降低累積起來都是一個不得了的數(shù)字
更重要的是,由于互聯(lián)網(wǎng)應用的特殊性,相當一部分新采購的服務器都要進行針對性的優(yōu)化,或者需要進行部分配件的調整與革新,也就需要投入大量的人力、精力和財力,造成資源的浪費。
因此對于以騰訊云為代表的云廠商來說,勢必要從整機的設計上面,去精簡不需要的功能;優(yōu)化整機的散熱能力,降低能耗。配備一個非常強的供應鏈的管控。去降低計算力的單位成本,并進而將這種成本紅利釋放給數(shù)百萬的云上用戶。
而在安全方面,從芯片層面就進行自研、定制化,勢必能更好的保證整機系統(tǒng)的安全可靠。
就在近日上海閉幕的世界人工智能大會上,華為輪值董事長胡厚崑表示道:“只有基礎打得牢,根技術扎得深,應用創(chuàng)新跑得快,才有人工智能產(chǎn)業(yè)的參天大樹和生態(tài)的持續(xù)繁榮?!?/p>
其中技術要扎到根,根深才能葉茂。值得就是應該大力發(fā)展根技術,如處理器、AI計算框架等,增強人工智能產(chǎn)業(yè)的發(fā)展韌性。
除國內云廠商之外,國外三家規(guī)模較大的云服務商亞馬遜、微軟和谷歌也硬件方面進行重金投入。用于提高自身云平臺的性能或者調優(yōu)服務來滿足特定的用途,例如人工智能開發(fā)等等。
如谷歌把自己的云計算戰(zhàn)略重點放在了處理人工智能工作負載上,為此設計了名為TPU的微處理器家族,號稱相比GPU的成本更低性能更高。
對此,谷歌曾對外表示,2015年的時候在多層神經(jīng)網(wǎng)絡ResNet 50上訓練一個深度學習模型的成本超過20萬美元,而今天,成本比一杯咖啡還便宜。
此外,微軟Project Olympus是一項針對微軟基于OCP構建的云平臺打造一系列服務器結構塊的項目。AWS基于ARM的Graviton處理器從2015年開始開發(fā),到現(xiàn)在已經(jīng)在AWS EC2實例中實現(xiàn)普及。
“硬件專業(yè)化可以將延遲、性價比和功耗/性能比提高10倍,但多年來,大多數(shù)計算工作負載一直停留在通用處理器上,”AWS工程師James Hamilton在一篇博客文章中這樣寫道。亞馬遜每年要安裝一百多萬個專用芯片,專門用于機器學習工作負載。
亞馬遜的Nitro項目則是將硬件和軟件結合,消除虛擬化的開銷。
阿里云的神龍架構則也是通過芯片層面的,通過軟硬件結合的方式,來降低虛擬化損耗,華為云的擎天、京東的京剛則也是通過同樣的方式。
對此,劉裕勛對雷鋒網(wǎng)表示到,云上的客戶是非常的“挑剔”的,同時云計算市場的競爭也很激烈,客戶都希望用低成本,高質量的產(chǎn)品,客戶要求的苛刻會推動我們去做更多的變革和演進。
在此背景下,對于云服務商而言,通過自研服務器、自研數(shù)據(jù)中心技術、再到上層的IaaS、PaaS、SaaS平臺的協(xié)同打造,勢必是一條必須要走的道路。(雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。