0
本文作者: 王德清 | 2021-07-18 12:07 |
近日,騰訊招聘官網(wǎng)出現(xiàn)了多個與芯片有關(guān)的崗位,引發(fā)外界關(guān)注。
騰訊招聘披露的芯片研發(fā)崗位包括:芯片架構(gòu)師、芯片驗證工程師、芯片設(shè)計工程師等多個職位,工作地點可選擇北京、上海、深圳等。
以芯片架構(gòu)師為例,職責包括:負責AI芯片和通用處理器或者細分領(lǐng)域的需求分析,主導AI,處理器芯片架構(gòu)設(shè)計,競爭分析和規(guī)格定義;負責芯片領(lǐng)域的技術(shù)演進路標、關(guān)鍵技術(shù),主導關(guān)鍵技術(shù)和架構(gòu)的研究;負責大型芯片的架構(gòu)設(shè)計,關(guān)鍵模塊的把控和設(shè)計等。
而芯片設(shè)計工程師則要求精通數(shù)字電路設(shè)計流程,精通RTL代碼書寫,具有電路優(yōu)化的經(jīng)驗;4年以上數(shù)字前端設(shè)計經(jīng)驗,有大規(guī)模 SoC 芯片設(shè)計成功量產(chǎn)經(jīng)歷以及CPU/NPU 等設(shè)計經(jīng)驗者優(yōu)先等。
該招聘消息一經(jīng)爆出,業(yè)界開始紛紛猜測:騰訊真的要進軍“卡脖子”芯片領(lǐng)域?
對此疑問,7月16日騰訊相關(guān)人士回應(yīng)稱,這是基于一些業(yè)務(wù)需要騰訊在特定領(lǐng)域有一些芯片研發(fā)的嘗試,主要是AI加速和視頻編解碼等,但這并非外界所認為的通用芯片。
實際上,騰訊幾年前就已經(jīng)開始了芯片領(lǐng)域的布局。
2016年11月,騰訊就與阿里一起領(lǐng)投了可編程芯片公司Barefoot Networks的2300萬美元C輪融資。
隨后在2018年,AI芯片公司——上海燧原科技有限公司獲得了騰訊領(lǐng)投的Pre-A輪3.4億元人民幣投資。
2019年6月,騰訊跟投燧原科技的新一輪融資,在今年,騰訊又繼續(xù)跟投了燧原科技的C輪融資。
據(jù)天眼查數(shù)據(jù)顯示,2020年3月19日深圳寶安灣騰訊云計算有限公司成立。該公司經(jīng)營范圍就包含了集成電路設(shè)計、研發(fā)等。
然而對于造芯這件事,騰訊并非是以BAT為代表的大型互聯(lián)網(wǎng)公司中的唯一一家。
早在2018年7月,百度公司發(fā)布云端全功能AI芯片“昆侖”,其中包含訓練芯片昆侖818-300,推理芯片昆侖818-100。
目前,百度第一代昆侖芯片已于2020年初量產(chǎn),目前已經(jīng)規(guī)?;渴鸪^2萬片,第二代昆侖芯片已經(jīng)流片成功,將于2021年下半年量產(chǎn)。
而阿里巴巴在2018年9月的云棲大會上宣布成立平頭哥半導體有限公司,主要任務(wù)是從事芯片的自研開發(fā)與戰(zhàn)略布局。2019年9月阿里巴巴第一顆自研芯片——AI推理芯片含光800正式問世,阿里巴巴表示該芯片已經(jīng)量產(chǎn),服務(wù)于阿里巴巴內(nèi)部。
“隨著云計算承載的業(yè)務(wù)規(guī)模越來越大,傳統(tǒng)服務(wù)器難以完全滿足云計算數(shù)據(jù)中心場景下對超大規(guī)模、需求多樣、高性價比、安全可靠以及軟硬件一體化等方面的要求?!?/p>
2020 Techo Park開發(fā)者大會上騰訊云服務(wù)器與供應(yīng)鏈管理部總經(jīng)理劉裕勛就曾對雷鋒網(wǎng)表示到。
隨著云計算產(chǎn)業(yè)的發(fā)展,從技術(shù)的角度說,云計算已經(jīng)超過IT基礎(chǔ)設(shè)施的范疇,正向上定義軟件應(yīng)用服務(wù),向下定義芯片、服務(wù)器等IT硬件。
從技術(shù)角度來看,20年前,虛擬化技術(shù)實現(xiàn)了硬件細節(jié)的抽象,讓基礎(chǔ)設(shè)施成為由軟件管理的單一實體。過去10年,云計算進一步推動了這一進程,使硬件成為一種抽象資源,而且對于客戶來說,這個資源越來越多地由別人來管理。
然而,云計算技術(shù)雖然使硬件變得抽象,但實際上,云服務(wù)商卻在硬件層面在做這大量的創(chuàng)新工作,開始從最基礎(chǔ)的芯片來構(gòu)建云。
同樣,在劉裕勛看來,隨著云原生理念的不斷推進,云基礎(chǔ)架構(gòu)的演進過程中會呈現(xiàn)出三個特點:高復(fù)雜度、高性價比、安全性。
當海量業(yè)務(wù)承載在云基礎(chǔ)架構(gòu)設(shè)施的時候,業(yè)務(wù)的多樣性,對于軟硬件一體化的系統(tǒng)實際上提出了更高的要求。面臨這樣的復(fù)雜度,云廠商根據(jù)自身的情況,必然要開始自己進行研究相關(guān)芯片,或者是與其他芯片廠商聯(lián)合起來進行深度定制,以此來解決各種復(fù)雜場景下的兼容性問題。
自研芯片的背后,則是對于BAT這般體量的云服務(wù)商而言,則是性價比最高的一條道路。
而在技術(shù)上,以英特爾的CPU為例,CPU的另外一個名字叫通用計算。而這也就代表著,搭載通用CPU的服務(wù)器具有很高的通用性,但是實際的應(yīng)用中,勢必會造成性能的浪費。
對于普通用戶來說,可能十幾上百臺服務(wù)器就是應(yīng)用的極限了,但是互聯(lián)網(wǎng)大廠的服務(wù)器動輒就是上萬甚至幾十萬臺,因此每臺性能的略微降低累積起來都是一個不得了的數(shù)字
更重要的是,由于互聯(lián)網(wǎng)應(yīng)用的特殊性,相當一部分新采購的服務(wù)器都要進行針對性的優(yōu)化,或者需要進行部分配件的調(diào)整與革新,也就需要投入大量的人力、精力和財力,造成資源的浪費。
因此對于以騰訊云為代表的云廠商來說,勢必要從整機的設(shè)計上面,去精簡不需要的功能;優(yōu)化整機的散熱能力,降低能耗。配備一個非常強的供應(yīng)鏈的管控。去降低計算力的單位成本,并進而將這種成本紅利釋放給數(shù)百萬的云上用戶。
而在安全方面,從芯片層面就進行自研、定制化,勢必能更好的保證整機系統(tǒng)的安全可靠。
就在近日上海閉幕的世界人工智能大會上,華為輪值董事長胡厚崑表示道:“只有基礎(chǔ)打得牢,根技術(shù)扎得深,應(yīng)用創(chuàng)新跑得快,才有人工智能產(chǎn)業(yè)的參天大樹和生態(tài)的持續(xù)繁榮。”
其中技術(shù)要扎到根,根深才能葉茂。值得就是應(yīng)該大力發(fā)展根技術(shù),如處理器、AI計算框架等,增強人工智能產(chǎn)業(yè)的發(fā)展韌性。
除國內(nèi)云廠商之外,國外三家規(guī)模較大的云服務(wù)商亞馬遜、微軟和谷歌也硬件方面進行重金投入。用于提高自身云平臺的性能或者調(diào)優(yōu)服務(wù)來滿足特定的用途,例如人工智能開發(fā)等等。
如谷歌把自己的云計算戰(zhàn)略重點放在了處理人工智能工作負載上,為此設(shè)計了名為TPU的微處理器家族,號稱相比GPU的成本更低性能更高。
對此,谷歌曾對外表示,2015年的時候在多層神經(jīng)網(wǎng)絡(luò)ResNet 50上訓練一個深度學習模型的成本超過20萬美元,而今天,成本比一杯咖啡還便宜。
此外,微軟Project Olympus是一項針對微軟基于OCP構(gòu)建的云平臺打造一系列服務(wù)器結(jié)構(gòu)塊的項目。AWS基于ARM的Graviton處理器從2015年開始開發(fā),到現(xiàn)在已經(jīng)在AWS EC2實例中實現(xiàn)普及。
“硬件專業(yè)化可以將延遲、性價比和功耗/性能比提高10倍,但多年來,大多數(shù)計算工作負載一直停留在通用處理器上,”AWS工程師James Hamilton在一篇博客文章中這樣寫道。亞馬遜每年要安裝一百多萬個專用芯片,專門用于機器學習工作負載。
亞馬遜的Nitro項目則是將硬件和軟件結(jié)合,消除虛擬化的開銷。
阿里云的神龍架構(gòu)則也是通過芯片層面的,通過軟硬件結(jié)合的方式,來降低虛擬化損耗,華為云的擎天、京東的京剛則也是通過同樣的方式。
對此,劉裕勛對雷鋒網(wǎng)表示到,云上的客戶是非常的“挑剔”的,同時云計算市場的競爭也很激烈,客戶都希望用低成本,高質(zhì)量的產(chǎn)品,客戶要求的苛刻會推動我們?nèi)プ龈嗟淖兏锖脱葸M。
在此背景下,對于云服務(wù)商而言,通過自研服務(wù)器、自研數(shù)據(jù)中心技術(shù)、再到上層的IaaS、PaaS、SaaS平臺的協(xié)同打造,勢必是一條必須要走的道路。(雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。