丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給量衡
發(fā)送

0

Google 自研的手機 SoC 翻車了嗎?

本文作者: 量衡 2021-11-05 18:50
導(dǎo)語:Google Tensor 還不行?

因為上一代用驍龍 765G 的騷操作,在大家心目當(dāng)中,Google Pixel 系列算是斷更一代。而 Pixel 6 系列就不同了,有 Google 自研 SoC——Google Tensor(Tensor 是張量的意思,名字就很 AI,很ML)、追上時代的相機硬件,也有相對厚道的價格。

Google 自研的手機 SoC 翻車了嗎?

重回旗艦市場的計算攝影大佬,終于肯用現(xiàn)代的 CMOS 了!機圈立即奔走相告,直到國外用戶拿到真機,Anandtech 放出 Google Tensor 的測試成績和分析……

在不改變 Anandtech 原意的情況下,我們對這顆如此重要和有趣的 SoC 的內(nèi)容進行整理和編譯,原文 https://www.anandtech.com/print/17032/tensor-soc-performance-efficiency


全自研還是魔改(半定制)?

Google 表示 Google Tensor 是邁向新型工作負載探索之旅的起點,現(xiàn)有芯片方案無法實現(xiàn)他們說的目標(biāo)。憑借多年來的機器學(xué)習(xí)研究經(jīng)驗,Google 把 Tensor 做成一款以機器學(xué)習(xí)作為差異化的 SoC,據(jù)說其讓 Pixel 能實現(xiàn)很多獨特的新功能。

關(guān)于 Google Tensor 的第一個爭議是,它是全自研?還是魔改(半定制)?這里主要看你對 “自研” 的定義,Google 和三星看似密切的合作,模糊了傳統(tǒng)的自研和半定制之間的界限。

在 Google 內(nèi)部, Google Tensor 代號是 GS101,可能是 Google SoC 或 Google Silicon 的意思。而之前爆料說的 Whitechapel(白教堂),還沒有任何證據(jù)表明其是真實存在的芯片。

Google 自研的手機 SoC 翻車了嗎?

而 Google Tensor 基本遵循三星 Exynos 的命名規(guī)則,其 ID 是“0x09845000”,拆解后能看到絲印是 S5P9845(編者:原文發(fā)布之初,認為 ID 對應(yīng) S5E9845,但經(jīng) TechInsights 拆解,確認是 S5P9845)。作為參考,三星 Exynos 2100 的 ID 是 S5E9840,Exynos 1080 是 S5E9815。

幾年前就有報道說三星開始提供半定制的芯片服務(wù),當(dāng)時就有三星與思科、Google 的合作消息。ETNews 在 2020 年 8 月的文章中提到,三星會根據(jù)客戶需求提供“定制”技術(shù)和功能,甚至從芯片設(shè)計階段就開始提供。

三星不再是簡單的芯片制造商,而是完全參與芯片設(shè)計,這都可以和 ASIC 設(shè)計服務(wù)相提并論了。但這是個很特殊的情況,畢竟三星不但有臺積電那樣的芯片代工業(yè)務(wù),它也有自己的自研 SoC。

Google Tensor 和三星 Exynos 高度同源,除了大家常說的 CPU、GPU、NPU 等高級結(jié)構(gòu)外,芯片中的基本結(jié)構(gòu)很多都是同源的。雖然紙面上,三星、聯(lián)發(fā)科、海思,甚至高通(只有CPU方面),用的都是 arm 的 Cortex CPU 和 Mali GPU 公版架構(gòu),但它們的底層架構(gòu)還是非常不同的。

Google Tensor 使用的是三星 Exynos 的框架,不但有相同的時鐘和電源管理架構(gòu),它們的存儲控制器、外部接口的 PHY IP 等高級塊,甚至連 ISP 和媒體編解碼器等較大的 IP 功能塊都很相似。有趣的是, Github 上已經(jīng)有 GS101 的公開信息,可以 1:1 地比較它和 Exynos 的結(jié)構(gòu)組成。

不過,雖然用了 Exynos 的基礎(chǔ)模塊和框架,但 SoC 的定義確實由 Google 控制,結(jié)構(gòu)和  IP 塊之間的連接設(shè)計上,Google Tensor 和三星 Exynos 都是不同的。

例如 Exynos 上,CPU 是用總線連起來的,而 Google Tensor 的 CPU 集群是被集成在一個更大的 CCI 里面。從外部看,可能是用了不同的總線設(shè)計,也可能是完全不同的 IP。另外,像內(nèi)存控制器的連接方式,它們也是不太一樣的。

性能規(guī)格分析

單看 CPU 就知道 Google Tensor  的特殊之處,2x X1 + 2x A76 + 4x A55,這個“2+2+4”結(jié)構(gòu)在三星 Exynos 9820 和 Exynos 990 都出現(xiàn)過。但當(dāng)今 Android 旗艦 SoC 中, 1+3+4 才是絕對的主流。而且敢堆 2 顆 X1 的,僅 Google 一家。

Google 自研的手機 SoC 翻車了嗎?

理論上有兩顆 X1 超大核,其 CPU 多核性能會比單顆 X1 的產(chǎn)品更強。而頻率上,Google Tensor  的 X1 都是 2.8GHz,略低于驍龍 888 的 2.84GHz 和 Exynos 2100 的 2.91Hhz。此外,Google 還和驍龍888 一樣給了 1MB L2 緩存,比 Exynos 2100 的 512KB 殘血 X1 更猛。

大核(編者:你喜歡叫中核也行)這邊,Google 選擇了古早的 A76 架構(gòu),這是件很有爭議性的事(2.25GHz,256KB 的 L2 緩存)。畢竟這并不合理,因為 A77 和 A78 的性能和能效比都更高。連 Anandtech 都沒從 Google 那里得到明確的解釋。

他們猜測可能是幾年前設(shè)計芯片的時候,三星手上也沒有更新的 IP 供 Google 選擇。也可能是在超大核換成X1 的時候,沒有時間連大核也一起換了。但 Google 應(yīng)該不是特意選用 A76 的,因為從下面的測試可以發(fā)現(xiàn),A76 真的是跟不上時代了。

小核這邊,4 個 1.8GHz 的 A55。Google 選擇了 128KB 的 L2 緩存,而不是三星 Exynos 自己用的 64KB,這讓這個 CPU 更像驍龍888 了。但比較奇怪的是,Google 把集群的 L3 緩存頻率和 A55 綁定,這會導(dǎo)致延遲和功耗問題。另外,這也和 Exynos 2100 的 L3 頻率是不同的。

Google Tensor  的 GPU 是 Mali- G78 MP20,規(guī)模僅次于麒麟 9000 的 G78 MP24(編者:G78 的極限)。大家最開始以為 Google 會用低點的頻率來提升能效比。但結(jié)果 Google 竟然把著色器頻率推到 845MHz,把 tiler 和 L2 頻率推到 996MHz,簡直癲狂。另外,它也是第一個用上 G78 分離頻率特性的產(chǎn)品。

作為參考,Exynos 2100 的 G78 MP14 也“只是” 854MHz,后者的峰值功耗已經(jīng)很高了。結(jié)果 Google 增加 42% 的核心,卻依然維持高頻。因此它的峰值性能很讓人期待,但峰值功耗也會很猛。而內(nèi)存控制器似乎和 Exynos 2100 相同,支持 4x16bit 的 LPDDR5,理論帶寬 51.2 GB/s。

它也用了 8MB 的系統(tǒng)緩存,但還不清楚是否用了和三星 Exynos 2100 一樣的  IP,因為它們的架構(gòu)和行為方式都不太一樣。Google 大量使用 SLC 來提升 SoC 性能(包括他們自己的定制模塊)。這個 SLC 允許自分區(qū),將 SRAM 專門分給 SoC 上特定的 IP 塊,使它們在不同用例下,能對全部或部分緩存進行獨占訪問。

ISP 與 TPU

大家說 SoC 集成的 ISP 時,經(jīng)常把它們描述為單個 IP。但實際上,ISP 是不同的專業(yè) IP 塊的組合,每個 IP 塊處理成像管線中的不同任務(wù)。而 Google Tensor 非常有趣,因為它將三星用在 Exynos 芯片上的一些片段整合到了一起,同時還將自己開發(fā)的定制模塊整合到了流水線中 —— 正如 Google 在展示 SoC 時所說的那樣。

成像系統(tǒng)部分和 Exynos 是一樣的,如相位檢測處理單元、反差對焦處理單元、圖像縮放器、畸變校正處理塊和紋理遮擋函數(shù)處理塊等。比 Exynos 少的部分,可能是三星的一些圖像后處理模塊。

谷歌在 ISP 中加入自己的 3AA 模塊(自動曝光,自動白平衡,自動對焦) ,以及一對自己的時域降噪 IP 模塊(用于對齊和合并圖像)。這些很可能就是谷歌所說的那些有助于加速圖像處理的模塊,這些是 Pixel 系列計算攝影的一部分,毋容置疑地地代表了圖像處理流水線中非常重要的部分。

Google 自研的手機 SoC 翻車了嗎?

TPU 是讓 Google Tensor 被稱為 Tensor 的地方。Google 已經(jīng)用自研  TPU 好幾年了,在驅(qū)動層面,Google 把 Tensor 的 TPU 稱作 Edge TPU( 端側(cè)邊緣 TPU)。這是相當(dāng)有趣的信號,因為它應(yīng)該和 Google 2018年發(fā)布的 Edge TPU 有關(guān),后者是 Google 為邊緣推理而設(shè)計的 ASIC 芯片(官網(wǎng) cloud.google.com/edge-tpu)。

當(dāng)年的 Edge TPU 宣稱在 2W 功耗下可以提供 4TOPS 的算力,但 Google 并未公布 Tensor 的 TPU 性能指標(biāo),但是在一些測試中可以看到它的最大功率是 5W 左右。因此如果它們確實是有關(guān)聯(lián)的,考慮到這幾年的制程和 IP 上的進步, Google Tensor 的 TPU 性能應(yīng)該有明顯提升了。

這個 TPU 是谷歌芯片團隊的驕傲,它正在使用最新的機器學(xué)習(xí)處理架構(gòu),這個架構(gòu)針對 Google 內(nèi)部運行機器學(xué)習(xí)的方式進行過優(yōu)化,并且表示它可以允許開發(fā)新的、獨特的用例,這是 Google 做定制 SoC 的主要目標(biāo)和出發(fā)點之一。在后面的測試中,這個 TPU 的性能指標(biāo)確實也是令人印象深刻的。因為 TPU 的信息不多,我們只能基于它的驅(qū)動程序做簡單猜測,它可能包含四核心的 Cortex-A32 CPU。

其他模塊

在媒體編碼器方面,Google Tensor 使用了三星的多功能編解碼器(與 Exynos 系列同款),還有一個看起來像是用于 AV1 解碼的自研 IP 塊。這有點奇怪,因為三星的宣傳中, Exynos 2100 是有 AV1 解碼功能的,而且這個功能貌似也在內(nèi)核驅(qū)動程序里面。但在 Galaxy S21 系列中,這個 AV1 解碼功能從未在 Android 的層面實現(xiàn)過。

谷歌加入的這個專用的 AV1 解碼器被他們稱做 “ BigOcean”,它能讓 Android 系統(tǒng)具備 AV1 硬解能力。但非常奇怪的是,它真的就只負責(zé) AV1, 其他格式編解碼還是由三星的 MFC 負責(zé)。

Google Tensor 的音頻子系統(tǒng)也不同,Google 用自己設(shè)計的 IP 塊代替了三星的低功耗音頻解碼子系統(tǒng),它們可以在無需全部喚醒 SoC 的情況下進行低功耗的音頻播放。我們認為這部分也是當(dāng)協(xié)處理器用的,這也是 Google Tensor 和 Exynos 不同的地方。

Google 還用了一種稱為 Emerald Hill 的硬件內(nèi)存壓縮器,對內(nèi)存頁面進行 LZ77 壓縮加速,反過來也可以用來加速交換中的 ZRAM 的卸載過程。現(xiàn)在還不確定 Pixel 系列是否已經(jīng)啟用這個模塊,但能確認在“ /sys/block/zram0/comp_algorithm”目錄中有“l(fā)z77eh”。作為課外資料,三星早在 5 年前,就在 SoC 里集成了類似的硬件壓縮 IP 模塊。但出于某些原因,這些模塊從未被啟用過,也許是能效比并沒有他們預(yù)想中的高。

Google 自研的手機 SoC 翻車了嗎?

圖源PBKreviews

另外,Google 還用三星的 Exynos 基帶,做出了第一臺非高通的毫米波手機。Pixel 6 系列用的是三星的 Exynos 5123 基帶(譯者:為遵循國內(nèi)的習(xí)慣,這里把調(diào)制解調(diào)器稱為基帶)。三星在 2019 年就提到自己的毫米波射頻和天線模塊,說 2020 年會出現(xiàn)在量產(chǎn)機上(不知道當(dāng)時是否計劃讓 Pixel 6 在 2020 年上市)。Pixel 6 系列的峰值速度可以達到 3200Mbps,但很多測試中,它的網(wǎng)速只有高通產(chǎn)品的一半左右。

雖然是同一個基帶,但它不是像 Exynos 2100 那樣集成在 SoC 里,而是外掛的??赡苁且驗?Google Tensor 的 GPU 和 CPU 規(guī)模太大了,而且 TPU 的規(guī)模也是未知數(shù)。畢竟就算是把基帶外掛出去,Google Tensor 的規(guī)模也是相當(dāng)大了,即便是和對比 Exynos 2100 的情況下。

總的來看,Google 確實設(shè)計和定義了 Tensor ,同時有很多 Google 特有的設(shè)計,是整體的芯片上的差異化。但從更底層的角度看,Tensor 和 Exynos 有很多共通之處,用了很多三星特有的基礎(chǔ)模塊,因此叫它“半定制”或許會更合適。

 

實際性能表現(xiàn):不盡如人意

Google 自研的手機 SoC 翻車了嗎?

測試中,Google Tensor 的 DRAM 延遲較高,還不如 Exynos 2100,和驍龍888 比就更差了。Google 改過了內(nèi)存控制器,它會根據(jù)負載和內(nèi)核的內(nèi)存失速百分比來控制 MC 和 DRAM 速度,這部分是和三星不同的,其實際利用率也不如三星的內(nèi)存控制器高。現(xiàn)在不知道是 CPU 的問題,還是整個 SoC 內(nèi)部的問題,但這確切地影響了下面的測試。

它的 L3 延遲也相當(dāng)高,比 Exynos 2100 和驍龍 888 高得多。Google 沒有給 DSU 和 CPU L3 緩存設(shè)定特定的頻率,而是把它和 A55 小核的頻率關(guān)聯(lián)。奇怪的是,即便 X1 或 A76 滿載,A55 和 L3 卻在低頻 “摸魚”。同樣情況下 Exynos 2100 和驍龍 888 都是會提高 L3 頻率的。

在系統(tǒng)緩存測試中,能看到 11-13MB 的延遲情況 (1 MB L2 + 4 MB L3 + 8 MB SLC) ,在正常的內(nèi)存訪問中,Tensor 也是比 Exynos 要慢的,可能和被改過的個別緩存管線有關(guān)。

Google 自研的手機 SoC 翻車了嗎?

因為 L3 和 A55 的頻率捆綁,且頻率高,所以 Google Tensor 的 A55 小核是幾個 SoC 里 L3 延遲最低的,彷如沒有異步時鐘橋一般。

CPU 部分,Google Tensor 更像是驍龍 888,而不是  Exynos 2100。雖然 Google Tensor 的 L2 緩存是 Exynos 2100 的 2 倍,但頻率低了 3.7%(110MhHz)。


Google 自研的手機 SoC 翻車了嗎?

Tensor 的弱點是內(nèi)存延遲,導(dǎo)致 SPEC 測試中很多子項目都比 驍龍888 和  Exynos 2100 慢,但能耗卻更高(CPU 在干等內(nèi)存)。SPEC 總分上,Tensor 的表現(xiàn)比 Exynos 2100 略差,對比驍龍888 的落后幅度達到 12.2% ,由于跑完測試的時間更長,最終耗電還多了 13.8% 。折算回來,相對驍龍888 的差距應(yīng)該是 1.4% 左右。

它也有和  Exynos 2100 一樣的降頻問題,只是相對沒有那么嚴(yán)重。如果冷卻得當(dāng),性能會高 5%-9% 左右(上圖的測試結(jié)果是在 11 度的環(huán)境下得到的)。

可憐的  A76 大核,驍龍 888 的 A78 比它強 46%,還更省電,實際 IPC 差距在 34%,這倒符合兩個構(gòu)架之間的差距。如果真是為了省電,完全可以做個低頻的 A78,但結(jié)果 Google 放了兩顆頻率又高、又耗電、性能還不行的 A76,只能推斷 Google 是沒得選,而不是有意而為之。


Google 自研的手機 SoC 翻車了嗎?

越接近右下角,能效比越低;越接近左上角,能效比越高 ↑

A55 小核這邊也不行,性能只是比同頻的驍龍 888 的 A55 高 11%(感謝 L3 和 SLC),但卻幾乎是 2 倍的功耗,儼然就是繼承了 Exynos 高功耗 A55 的血統(tǒng),能效比甚至比自己的 A76 大核還拉胯??纯绰?lián)發(fā)科天璣 1200 的 A55,再看看 A14 的能效核心,這真是個殘酷的世界。


Google 自研的手機 SoC 翻車了嗎?

Google Tensor 因為拉胯的 A76 性能表現(xiàn),就算有 2 顆 X2 都無力回天,拖低了整體分數(shù)。X1 本身也比對手稍慢一些,大部分時間的能效比都和 Exynos 2100 的 X1 一致。但 A76 實在落后時代太多了(無論是性能還是能效比),而 A55 又繼承三星低能效的傳統(tǒng),一言難盡就是了。


Google 自研的手機 SoC 翻車了嗎?

Google 自研的手機 SoC 翻車了嗎?

GPU 這邊規(guī)模大,頻率高,但 3DMark Wild Life 測試的峰值性能只比  Exynos 2100 高 21%。在 GFX Bench 的 Aztec 場景測試中,領(lǐng)先  Exynos 2100 14%,小幅領(lǐng)先驍龍888。雖然采用了分頻設(shè)計,但貌似瓶頸在 GPU 的其他地方。

Tensor 的 GPU 峰值功率高達 9-10W,手機一跑就降頻(一輪測試都沒跑完啊……),拖低了整體功耗,所以才會有 7.28 W 的平均功耗。Pixel 6 系列沒有熱管,散熱配置和機身結(jié)構(gòu)更像是 iPhone,而不是猛堆散熱的安卓旗艦。它跑起來時,左側(cè)的 SoC 45 度,但右側(cè)只有 30-33 度,散熱確實是弱。

讓人不解的是,今年這批 SoC 都設(shè)定了高得不切實際的 GPU 頻率,一跑就降頻??赡苁菫榱藨?yīng)對突發(fā)的 GPU 負載?或者是其他什么原因?但無論怎么樣,實際能效比是受累了。


TPU:極強的推理性能

這是 Google Tensor 挽回顏面的地方。MLPerf 測試中,Pixel 是在 NNAPI 跑的,其他廠商是各自的庫,高通是 SNPE(最近優(yōu)化了 MLPerf 1.1,提升了成績)、三星是 EDEN,聯(lián)發(fā)科是 Neuron,而蘋果沒有 coreML 加速,所以吃虧。

Google 自研的手機 SoC 翻車了嗎?

在圖像分類、目標(biāo)檢測和圖像分割工作負載中, Tensor 成績低于高通,但強于三星。而在語言處理(MobileBERT 模型),Google Tensor 提供了驍龍 888 3 倍的性能,推理部分強得很。Google 在宣傳里,確實也提到過實時轉(zhuǎn)錄、翻譯等使用場景是其差異化所在。


Google 自研的手機 SoC 翻車了嗎?

Google 自研的手機 SoC 翻車了嗎?

Google 自研的手機 SoC 翻車了嗎?

還沒發(fā)布的 GeekBench ML 測試,用是 TensorFlow 模型,代表的是 GPU 的機器學(xué)習(xí)性能。這時候 Google Tensor 就弱于  Exynos 2100。如果用 NNAPI 模型,此時是 CPU+GPU+NPU 的混合工作,Google Tensor 就可以大幅領(lǐng)先驍龍 888。

除了絕對性能,跑 AI 測試時,Pixel 6 Pro 的整機功耗和 Exynos 2100 的 Galaxy S21 Ultra 接近。單獨進行推理任務(wù)時, Exynos 2100 的爆發(fā)功率達到 14W,驍龍 888 也有 12W。但因為 Google Tensor 的 AI 性能更高,所以最終能效比要更高一些。

不過 Google 還沒有計劃推出相關(guān)的 SDK 讓開發(fā)者去更好地利用這顆強大的 TPU 。但再看看三星,它的 NPU 發(fā)布都 2 年了,現(xiàn)在都沒有 SDK…… 現(xiàn)在 TPU 的強大性能,主要集中體現(xiàn)在官方 app 里,像是給攝像頭加入更多的機器學(xué)習(xí)功能,以及各種翻譯功能。


總結(jié)

Google 自研的手機 SoC 翻車了嗎?

Google 表示,他們搞自研 SoC 的主要原因是現(xiàn)有的 SoC 在機器學(xué)習(xí)上的性能和能效比太低。而 Tensor 的機器學(xué)習(xí)性能和能效,被用來支撐新的用例和體驗,例如我們在 Pixel 6 系列上看到的很多機器學(xué)習(xí)特性。像是實時轉(zhuǎn)錄、實時翻譯和圖像處理等算法,所有這些都是運行在 Tensor 的 TPU 上的。

雖然 Google 可能不想承認或者談?wù)?,?Google Tensor 確實就是和三星合作的產(chǎn)物,大部分都源自 Exynos,并繼承了三星在能效比方面的弱點。CPU 被古老的 A76 拖后腿,規(guī)模龐大的 GPU 被散熱拖后腿,但 TPU 確實表現(xiàn)很好,特別是自然語言處理方面,遠遠拋離所有競品。

但總的來說,我們認為 Google 已經(jīng)通過 Tensor 實現(xiàn)了最初的目標(biāo)。我們不知道 Google 下一代的 SoC 會走什么樣的路線,但我們很有興趣等等看。

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說