為什么最近Wireline SerDes這么火？

本文作者：矽說

2016-12-08 08:17

導語：Wireline技術興起背后的推動力包括異質(zhì)集成興起以及數(shù)據(jù)中心的需求。

雷鋒網(wǎng)按：本文作者李一雷，UCLA博士生，矽說（微信號：silicon_talks）主筆。

近段時間，關注業(yè)界消息的朋友們可能會發(fā)現(xiàn)Wireline SerDes這部分突然就火起來了，動不動就出個大新聞。比如景略推出了56Gb/s的超高速SerDes、做SerDes的初創(chuàng)公司Kandou Bus融到了1500萬美元，甚至于核彈廠Nvidia都要來摻一腳推出自己的NvLink。如此的盛景，不禁讓大家想起了十年前每家公司都在爭相推出自己的射頻芯片產(chǎn)品一樣。本文將分析Wireline產(chǎn)品繁榮背后的推動因素。

| 摩爾定律衰落與異質(zhì)集成興起

摩爾定律發(fā)展至今一直是半導體行業(yè)的綱領性文件，在讓行業(yè)狂飆猛進半個世紀之后，終于遇到了瓶頸。這個瓶頸第一來自于經(jīng)濟學，第二來自于物理定律。

從經(jīng)濟學的角度，本來摩爾定律的目標就是通過工藝制程進步縮小特征尺寸讓相同功能的芯片需要的晶圓面積更小。工藝制程進步所需的研發(fā)成本和mask制作的NRE成本上升，而每塊芯片的制造成本下降。在之前的幾十年里，工藝制程研發(fā)成本和mask制作的NRE成本上升平攤到每塊芯片中不會抵消太多芯片制造成本的下降，從而使用新工藝的芯片的總成本相對于舊工藝會下降。然而，在最新的工藝中，由于新工藝的mask NRE成本非常高，生產(chǎn)的芯片必須出貨量非常大才能保證攤薄NRE成本上升，這對于很多芯片設計公司來說風險很大。因此經(jīng)濟學角度對于摩爾定律的驅(qū)動力大大下降了。

從物理學角度來說，障礙主要來源于量子效應和光刻精度。當特征尺寸縮小到10nm的時候，柵氧化層的厚度僅僅只有十個原子那么厚，在那個時候會產(chǎn)生諸多量子效應，導致晶體管的特性難以控制。

為什么最近Wireline SerDes這么火？

晶體管成本隨特征尺寸縮小而減小的趨勢正在慢慢趨緩

為了延續(xù)摩爾定律，半導體行業(yè)提出了異質(zhì)集成的方法。“異質(zhì)集成”顧名思義就是把使用不同工藝的芯片集成在一起，這種集成可以在封裝而不是在晶圓上完成。在傳統(tǒng)的SoC中，所有模塊必須使用同一種工藝。SoC中的數(shù)字電路模塊會希望使用先進制程以實現(xiàn)更好的集成度以及更高的性能。然而，對于射頻、模擬以及混合信號模塊，先進制程并不能帶來顯著的改善。由于先進制程的電源電壓會偏低，模擬/射頻/模擬信號模塊的性能在先進制程下反而可能更差。使用異質(zhì)集成的話，模擬/射頻/混合信號模塊等不需要最先進工藝的模塊可以用較成熟且廉價的工藝實現(xiàn)，而數(shù)字模塊則可以由先進工藝實現(xiàn)。不同模塊可以用封裝技術集成在同一封裝中，而模塊間的通訊則使用高速接口。

當這種異質(zhì)技術真正成熟后，Marvell創(chuàng)始人Sehat Sutardja在ISSCC 2015演講中提到的MoChi架構(gòu)就能真正實現(xiàn)：不同工藝生產(chǎn)的芯片像樂高積木一樣集成在封裝里并使用通用的高速接口通信；當需要一個新的模塊集成到系統(tǒng)中時只需要設計新的模塊芯片并改一下封裝即可，不再需要重新去設計并生產(chǎn)新的SoC。

為什么最近Wireline SerDes這么火？

異質(zhì)集成的MoChi結(jié)構(gòu)，ISSCC2015

可見異質(zhì)集成如果想要延續(xù)摩爾定律的輝煌，關鍵在于封裝技術和高速接口技術。對于封裝技術，業(yè)界一些廠商在力推TSV(Through Silicon Via)技術，即把多塊芯片用三維堆疊的形式放在一起，然后在不同的芯片間打通孔并制作銅連線，使得芯片間可以經(jīng)由這些連線實現(xiàn)通信。TSMC則在推廣2.5D技術CoWoS (Chip-on-Wafer-on-Substrate) 和InFO (Integrated Fan-Out) ，基本概念是把多塊芯片集成到同一塊載體(Interposer)并在載體上制作芯片間的連線。蘋果iPhone7中的A10處理器就使用了TSMC的InFO技術。

為什么最近Wireline SerDes這么火？

至于高速接口技術，就必須使用Wireline SerDes技術。對于異質(zhì)集成中的Wireline SerDes技術，其應用特點是互聯(lián)長度短（通常在1cm以內(nèi)），但是需要SerDes在提供高帶寬的情況下嚴格控制功耗，而且對于傳輸延遲有一定需求。

從技術角度分析，由于互聯(lián)線長度短，因此在設計SerDes的時候?qū)τ诨ヂ?lián)線的衰減和頻域notch不用太過擔心。但是，由于異質(zhì)集成技術有很大的機會會用到移動設備，因此功耗不能太大。有一個常用的指標來衡量SerDes的性能，即能效（energy efficiency）。能效的單位是bit/pJ，即SerDes傳輸1bit數(shù)據(jù)所需要的能量。從物理上是pJ/bit又可以等效為Gb/s/mW，即SerDes以等效1Gb/s數(shù)據(jù)率傳輸數(shù)據(jù)時需要多少毫瓦。在各類SerDes文獻里常常可以看到這個指標。

另一個技術要求是延遲，這個指標很多論文不是經(jīng)常提到但是其實非常重要，尤其是在使用異質(zhì)集成的內(nèi)存接口（如HBM）中。從計算機架構(gòu)的角度來說，一旦處理器在取數(shù)據(jù)時候發(fā)現(xiàn)數(shù)據(jù)必須到內(nèi)存里才能拿到，就很有可能必須停下來等數(shù)據(jù)，直到數(shù)據(jù)取回到處理器才能繼續(xù)工作。所以內(nèi)存接口的延遲越大，處理器等下來等的時間就會越長，從而嚴重影響處理器運行程序的效率，因此wireline SerDes的延遲必須越小越好。而且重要的一點是SerDes的延遲和帶寬并不是特別相關，完全可能出現(xiàn)帶寬很大但是延遲也很長的情況。這就好比你如果用集裝箱大貨輪去運貨，吞吐量（帶寬）很大，但是前期的準備過程也很長（申請，報批，裝貨等等），因此延遲和帶寬都很大。顯然，用在異質(zhì)集成中的SerDes我們希望帶寬大但是延遲很小，這就意味著SerDes PHY的傳輸協(xié)議需要比較簡潔。

小結(jié)：Wireline SerDes技術是延續(xù)摩爾定律的異質(zhì)集成方案中的關鍵技術，此類SerDes的關鍵指標是能效。

| 大數(shù)據(jù)與萬物智能時代的來臨

在大數(shù)據(jù)與萬物智能時代，我們用大數(shù)據(jù)去訓練機器學習算法模型，從而給各種工業(yè)產(chǎn)品（汽車，家電等等）賦予人工智能。那么，大數(shù)據(jù)和萬物智能又和wireline SerDes有什么關系呢？當然有關！在大數(shù)據(jù)時代，如果說聚集海量服務器的數(shù)據(jù)中心是人工智能的大腦，那么保證數(shù)據(jù)中心中數(shù)據(jù)自由在服務器間流動的數(shù)據(jù)互聯(lián)就是大腦里的血管。而實現(xiàn)這“血管”的技術，就是wireline SerDes。在當代大數(shù)據(jù)時代，為了實現(xiàn)大數(shù)據(jù)的可擴展性存儲，會使用分布式數(shù)據(jù)庫。例如，你在訪問Google之類的網(wǎng)站時，點擊一個“搜索”操作，會需要海量的數(shù)據(jù)才能完成你的搜索請求，而這些數(shù)據(jù)都不可能存儲在一臺服務器里，而是必然存儲在許多臺服務器中。那么，為了完成你的請求，這些數(shù)據(jù)最終都會需要匯聚到一臺或者幾臺服務器中，這就需要wireline。另外，隨著分布式運算的流行，在數(shù)據(jù)中心，計算往往是在不同的服務器完成的，也需要使用wireline實現(xiàn)的數(shù)據(jù)互聯(lián)。

為什么最近Wireline SerDes這么火？

數(shù)據(jù)中心中的數(shù)據(jù)互聯(lián)

目前已經(jīng)有許多廠商在從事數(shù)據(jù)中心級數(shù)據(jù)互聯(lián)wireline的開發(fā)，一個典型的例子就是InPhi，為數(shù)據(jù)中心同時提供基于光互聯(lián)和銅導線互聯(lián)的產(chǎn)品。用于數(shù)據(jù)中心的wireline主要要求是高帶寬，至于功耗之類的不是第一位的考量。數(shù)據(jù)中心的數(shù)據(jù)流往往是持續(xù)不斷的，因此高帶寬意味著高吞吐量。再回到之前提到的貨運的比喻，數(shù)據(jù)中心的貨運是持續(xù)不斷的高貨運量，因此使用集裝箱貨輪是最合適的。雖然之前的準備時間（延遲）很長，但是這點時間（延遲）相對于后面貨運（數(shù)據(jù)）的傳送時間來說可以忽略不計。與芯片間互聯(lián)的數(shù)據(jù)互聯(lián)的關鍵區(qū)別是：芯片間互聯(lián)的數(shù)據(jù)流是突發(fā)的，每一筆請求都需要盡快處理，于是要求低延遲；而數(shù)據(jù)中心中的數(shù)據(jù)流是持續(xù)不斷的，完成每一筆請求的延遲要求不大（對用戶來說Google上點了搜索按鈕后響應時間是1毫秒還是100毫秒在感覺上并沒有區(qū)別），但是需要在單位時間內(nèi)處理盡可能多的請求，于是要求極高帶寬。

小結(jié)：Wireline技術也是大數(shù)據(jù)時代數(shù)據(jù)中心的關鍵技術，此類SerDes的關鍵指標是高帶寬。

| Wireline的技術挑戰(zhàn)

對于芯片間互聯(lián)的wireline來說，技術上主要的挑戰(zhàn)是如何平衡好帶寬，延遲，成本和功耗之間的平衡。為了實現(xiàn)高帶寬，最簡單的做法就是增加芯片間的連線數(shù)量，但是封裝內(nèi)連線數(shù)量上升會導致成本上升。所以，為了降低成本，需要在帶寬不下降的情況下減少連線數(shù)量，也就是說每根線上的數(shù)據(jù)帶寬需要夠大，而每根線上實現(xiàn)高數(shù)據(jù)帶寬往往需要更大的功耗。一種減小功耗的方法是減小互聯(lián)線上的信號擺幅同時使用較復雜的信號處理方法來恢復數(shù)據(jù)，而這往往會增加延遲。另一種減小功耗的方法是減小互聯(lián)線的長度以減小信號衰減，而這就會需要更高級的封裝技術來實現(xiàn)高密度集成，也就是說成本會上升。如何實現(xiàn)這幾個關鍵指標的平衡是非常有挑戰(zhàn)性的。

為什么最近Wireline SerDes這么火？

芯片間Wireline互聯(lián)需要在帶寬，延遲，功耗和成本之間做權(quán)衡

對于數(shù)據(jù)中心的互聯(lián)來說，關鍵的挑戰(zhàn)是如何低成本地實現(xiàn)高帶寬。光互聯(lián)可以實現(xiàn)非常高的帶寬，然而光互聯(lián)的成本很高。傳統(tǒng)的銅線互聯(lián)的成本較低，但是在實現(xiàn)數(shù)據(jù)中心的高帶寬通信時會遇到一些棘手的問題，最關鍵的就是信號完整性問題。數(shù)據(jù)中心的互聯(lián)線長度很長，因此會導致高頻信號的強烈衰減。除此之外，對數(shù)據(jù)中心級別的互聯(lián)線，必須考慮傳輸線效應，在數(shù)據(jù)率很高的情況下必須考慮信號反射。這兩點都會導致信號完整性的問題，在傳輸端完美的波形到了接收端就幾乎無法分辨。為了解決這個問題，必須使用信道均衡技術（equalization），把數(shù)據(jù)重新變回原來的樣子。

為什么最近Wireline SerDes這么火？