0
| 本文作者: 包永剛 | 2025-10-11 18:39 |
9月底在美國亞利桑那州舉辦的Intel Tech Tour(ITT)上,英特爾預覽了即將在明年正式推向市場的兩款拳頭產品,代號Panther Lake的英特爾酷睿 Ultra處理器(第三代)PC級處理器,以及代號Clearwater Forest的英特爾至強6+服務器處理器。
這兩款全新的處理器的共同特點是基于領先的intel18A制造工藝,以及背部供電技術PowerVia。
“兩者結合,強上加強。”英特爾公司客戶端計算事業部副總裁兼中國區總經理高嵩說,“Intel 18A制程技術的引入,至少為我們接下來三代產品的推出奠定了堅實基礎。”
對于服務器處理器至強6+而言,3D封裝技術Foveros Direct 3D也至關重要,先進制程+背部供電+先進封裝是至強6+能夠實現創紀錄的288核服務器CPU的關鍵。
“Intel18A實現了更高的單元(cell)密度,結合3D堆疊封裝技術,可將三級緩存與CPU Compute Die解耦。”英特爾技術專家對雷峰網表示,“解耦之后就可以擺脫原來核心密度受到單個芯片尺寸的限制,可以將處理器核心數量從144個翻倍到288個。”
對于英特爾來說,這應該是一種久違的自豪感。芯片產業最重要的環節莫過于設計和制造,設計一直是英特爾的強項,但制造技術英特爾在過去幾年間面臨挑戰,如今重回世界領先水平的Intel 18A的量產,讓英特爾的拳頭產品的產品力擁有了大幅領先競爭對手的機會。
創造了整個CPU行業核心數量紀錄的至強6+ CPU,正是英特爾技術和產品力再次引領行業的積極信號。

RibbonFET+背部供電技術,英特爾未來三代產品的基石
過去幾年間,AMD產品的成功離不開臺積電全球領先的制造工藝,與此同時英特爾面臨的巨大壓力也來自其制造工藝遭遇問題。特別是,無論是在PC級處理器市場還是服務器處理器市場,Arm架構處理器都獲得了不小的成績,也給英特爾增加了不少壓力。
這也更能體現出Intel 18A對于英特爾的重要性,只有擁有了全球領先的制造工藝,才能讓英特爾的產品具備顯著的競爭優勢,畢竟在芯片這個高度競爭的行業里,只有設計和制造能力頂尖才能擁有頂級的芯片產品。
Intel 18A非常關鍵的是柵極環繞技術。過去數十年間,晶體管從二維的MOSFET,到了三維的FinFET,Intel 18A采用了最新的三維堆疊RibbonFET。

簡單來說,柵極環繞RibbonFET可以進一步增強晶體管開關控制、響應速度,還能夠顯著抑制漏電。其優勢在于同等頻率下能夠降低工作電壓,或者在同等工作電壓下提升驅動能力,每瓦性能的顯著提升。同時,通過調節納米片的寬度和層數,搭配上工作電壓的不同閾值,可以在同一工藝平臺上衍生出高性能或者低功耗等多種晶體管規格,擁有更高自由度。
“RibbonFET技術不僅是物理尺寸上的微縮,還是對整個晶體管控制理念的重大創新,重新定義了控制邏輯,為下一步尺寸縮減預留了空間,可以讓摩爾定律在Intel 18A及后續的節點上繼續延展。”英特爾技術專家表示。
RibbonFET的創新想要發揮出全部價值,還需要PowerVia背部供電技術。

傳統晶體管頂部堆疊多層金屬互連層,用于供電和信號傳輸。然而隨著晶體管的密度接近物理極限,正面的布線已經非常擁擠。PowerVia改變了原有的思路,將供電網絡下沉到晶圓背部,晶圓正面只保留了信號連接,這樣被供電線占據的正面走線空間被釋放,布局堵塞問題馬上就被緩解。
但要將供電網絡下沉到晶圓背面,背部供電需要采用納米級的TSV(硅通孔),這種TSV是常用TSV的1/10,通過納米級TSV可以直接通過更短的路徑將電源從封裝傳遞到晶體管內部,從而實現更高的電源布線效率。
根據測算,結合RibbonFET和PowerVia,可以將單元利用率提高10%,在相同功耗下性能提高4%。
英特爾技術專家指出,“RibbonFET技術可以釋放晶體管的潛能,PowerVia又為掃清了供電障礙,這兩個技術共同支撐起了Intel 18A制程在密度和能效上的同步提升。”

通過RibbonFET和PowerVia的結合,英特爾給出的數據是,相較于上一代工藝,Intel 18A的芯片密度提升到了前一代的1.3倍,有30%巨大提升,這意味著可以用更小的芯片尺寸,更低能耗實現更高性能。
另外,相比上一代工藝,在相同功耗下,每瓦性能提升超過15%,如果達到相同的性能,功耗降低超過25%。
實際上,除了英特爾,業界其他領先的芯片制造工廠也都在研究能給芯片帶來顯著收益的柵極環繞和背部供電技術,誰能率先量產就更有機會占領先機。
“Intel 18A制程工藝已經開始量產,這個量產是在亞利桑那州Fab-52工廠開始,今年年底之前會有一個產量爬坡的過程。”高嵩表示。
英特爾技術專家透露,“對比當前Intel 18A的生產數據以及過往15年里英特爾各個核心技術節點的數據,Intel 18A當前的良率大于等于之前每一代節點。我們預計Intel 18A 在2025年四季度能夠達成大規模量產的良率目標。”

有了領先的先進制程作為基石,設計的提升將變得更加容易。
288核服務器CPU成功的關鍵——3D封裝
開篇已經解釋過了3D封裝對于至強6+(Clearwater Forest)實現288核的重要作用,通過Clearwater Forest的架構能夠更深刻地理解3D封裝的重要價值。
Clearwater Forest的最上層是計算模塊(藍色),支持12個計算單元,每個計算單元包含24個Darkment能效核。這12個計算模塊通過Foveros Direct 3D技術焊接在3個有源基板上。

這里有兩個關鍵,第一個是Foveros Direct 3D可以支持9微米量級的凸點間距,支持銅對銅的鍵合。Foveros技術原理并不復雜,難點在于多個Die堆疊的時候,連接的精密度、以及整個拼接的完整度、信號的穩定性,以及全面封裝之后的良率。

“Foveros Direct 3D可以實現高密度、低電阻的晶片間互聯,可以達到0.05pJ/bit的功耗/比特性能,0.05pJ大概是2.5D技術所能達到的功耗的1/10。”英特爾技術專家說,“利用Intel 18A和Foveros Direct 3D技術,可以將Clearwater Forest的能效比達到前所未有的新高度。”
第二個關鍵是計算模塊通過3D封裝連接的是有源基板。
“Clearwater Forest有源硅基板并不是傳統的簡單工藝,而是采用Intel 3工藝來支持更高的互聯以及三級緩存。”英特爾技術專家強調,“有源硅基板除了能夠完成Die和Die之間的互聯,還可以引入一些先進的邏輯和存儲單元,從而實現更高的跨die間的互聯以及更大的三級緩存。”

回到Clearwater Forest的架構,三個有源硅基板和分布在左右的兩個I/O單元,通過EMIB形成2.5D的互聯。最終,Clearwater Forest在一個非常小的尺寸里堆疊了29個芯片。
堆疊帶來的性能和能效收益很高,但也會面臨更嚴峻的散熱挑戰。
英特爾技術專家對雷峰網(公眾號:雷峰網)表示,“3D封裝在橫向散熱過程當中帶來了更大的熱阻,確實在散熱上會有更高的要求。PowerVia 的金屬供電層分布在晶圓背部,也在一定程度上有助于導熱。”
“另外,至強6+的設計目標是希望無縫兼容當前的至強6平臺,因此已經考慮到了功耗的要求以及散熱的系統邊界條件,所以我們針對至強6+散熱上做了比較大幅度的優化,能夠在核數增加、算力堆疊技術之后,依然可以維持CPU 500W的TDP的目標。”英特爾技術專家同時表示。
至強6+上使用的I/O單元和至強6的性能核處理器一致,可以實現無縫升級,這也是即將發布的Clearwater Forest即便實現了巨大的性能飛躍,名稱是至強6+而非至強7的關鍵原因所在。

但需要指出的是,288核的Clearwater Forest基于Birch Stream AP服務器主板平臺。這意味著,如果客戶當前使用Granite Rapids AP服務器系統,可將Granite Rapids CPU平滑替換為Clearwater Forest CPU,無需任何硬件改動,僅需軟件更新即可直接使用。如果是使用至強6E能效核的系統,無法直接替換Clearwater Forest AP CPU。
微架構升級,至強6+計算性能翻倍
制程以及封裝技術讓至強6+實現了更好的性能和能耗,Clearwater Forest的CPU內核微架構上也實現了非常大幅度的提升。

對比Sierra Forest(至強6E)所用的Crestmont的內核,Clearwater Forest使用的Darkmont內核在指令解碼、分配、微操作隊列、緩存窗口以及指令派發等方面都帶來了30%-50%不等的性能提升。

算力單元的提升更加顯著,包括標量算術邏輯單元、向量算術邏輯單元、地址生成單元、二級緩存帶寬上都實現了翻倍的提升,從4個算術單元提升到8個,從2×128bit的向量計算,提升到4×128bit向量計算。
基于大量的提升,Darkmont相比Crestmont,在相同功耗情況下,可以帶來每核IPC 17%的性能提升。
如果把整個功耗和性能的影響算在一起,相比Crestmont,至強6+處理器的Darkmont可以帶來1.9倍以上的性能提升,同時在整體負載范圍之內帶來高達23%的能效提升,可以達到8:1服務器整合的效果。
這就意味著如果將至強6+和第二代的至強處理器進行橫向對比,使用20臺機架180臺至強6+服務器就可以替代70個機架1400臺第二代英特爾至強服務器,也就是8:1的服務器整合比例。

同時由于服務器和機架功率降低,可以降低整機功耗750KW,降低71%的數據中心占用空間,同時提升3.5倍的性能/功耗比,每臺機架上也可以增加2.3倍的虛擬機部署數量。
除此之外,Clearwater Forest還有內存、安全性等方面的升級,支持多達12條8000MT/s DDR5,整個Clearwater Forest支持576MB的末級緩存以及96條PCIe Gen 5的I/O通道,其中有64條支持最新的CXL技術。
Clearwater Forest還引入了英特爾最新的應用能耗監測功能以及內置了完備的安全防護功能,即TDX和SGX。

從設計、制造到封裝,Clearwater Forest每一個環節都實現了飛躍,將三項提升疊加,Clearwater Forest能夠帶來的性能和能效的提升將會遠超普通的產品代際升級,這是一次跨越式的升級,至于具體的產品以及最終的產品力表現,期待2026年至強6+的正式發布。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。