來源:唯芯派
在 3 月 9 日的蘋果春季發(fā)布會上蘋果發(fā)布了諸多新品,其中最亮眼的當(dāng)屬蘋果頂級旗艦芯片 M1 ULTRA。那么作為 M1 系列最后一款芯片,M1 ULTRA 到底怎么樣呢?
1 個 M1 ULTRA=2 個 M1 Max
如果用一句話簡單概括一下 M1 ULTRA 那就是:將 2 枚 M1 Max 通過封裝融合成一體,成為一枚芯片。
M1 Max 實現(xiàn)了突破性的 Die-to-Die(裸片到裸片)技術(shù),因此可以基于兩個 M1 Max 的裸片擴(kuò)展為 M1 ULTRA,通過創(chuàng)新性的定制架構(gòu) UltraFusion 連接在一起,帶來兩倍的性能表現(xiàn)。UltraFusion 架構(gòu)采用硅中介層連接一萬余個信號點,在兩個裸片之間實現(xiàn)了 2.5TB/s 的低延遲處理器互聯(lián)帶寬。
從目前公布的信息看,蘋果早在開發(fā) M1 Max 時就考慮到了這種 " 雙芯融合 " 的方案,在芯片版圖的上為將來的 Die-to-Die 連接預(yù)留了位置。那么這樣做有什么好處呢?
性能提升
對于目前的蘋果來說,目前所使用的臺積電 5nm 工藝已經(jīng)算是業(yè)界最頂尖的工藝了,臺積電的 3nm 還在路上。那么這種情況下,蘋果想推出一款性能更強的芯片該怎么辦呢?這時有兩種辦法:
第一,是再設(shè)計一款面積更大的芯片。
第二,是將原來的芯片組合在一起使用,也就是說一次用兩顆。
對于熟悉半導(dǎo)體行業(yè)的朋友來說應(yīng)該都對 5nm 芯片高昂的造價有所耳聞,再設(shè)計一款面積更大的芯片,即使是蘋果成本上也很難抗住。那么就剩下第二條了,將兩個芯片或者更多數(shù)量的已有芯片合在一起使用。
如果想把兩枚芯片連在一起用,目前業(yè)界的主流做法是通過主板 PCB 連接。
比如像這款華碩的 WS C621E SAGE 主板就屬于雙路 CPU 主板,在設(shè)計之初就支持兩塊 CPU 同時工作。
但這樣做缺點也很明顯,比如兩個 CPU 的插槽以及相應(yīng)連接所需的布線明顯會占用很大的 PCB 面積,這樣做出來的產(chǎn)品尺寸會很大。而且由于兩個 CPU 之間是通過 PCB 走線連接,延遲會變得很大。
在這里我們不難發(fā)現(xiàn),通過主板 PCB 連接兩塊 CPU 所帶來的缺點基本都是連線過長導(dǎo)致的,那么縮短兩個芯片之間的連線距離不就可以解決了嗎?" 膠水雙核 " 由此出現(xiàn)了。
" 膠水雙核 " 是指使用特殊方法將兩個或更多芯片封裝在一起制造的處理器。由于這種特殊方法像是將兩個或更多核心用膠水粘在一起,由此而得名 " 膠水雙核 "。
" 膠水雙核 " 技術(shù)最早可以追溯到 1995 年的英特爾的 Pentium Pro,但這并不是一項落后的技術(shù)。
比如 AMD 一代 EPYC(霄龍)處理器就采用了這種所謂的 " 膠水雙核 " 技術(shù)。在圖上可以清晰地看出,它將 4 顆 Die(裸片)封裝到了一顆 CPU 中。這樣 4 顆裸片的產(chǎn)品在性能上無疑是要強于 1 顆裸片(裸片型號相同)的產(chǎn)品。
在 AMD 一代 EPYC 處理器的開蓋視頻中我們可以發(fā)現(xiàn),每顆裸片之間都有著毫米級肉眼可見的間距。蘋果所做的則是在此基礎(chǔ)上更近了一步,將兩顆裸片 " 貼臉 " 封裝,使得兩顆裸片之間的連線變得更短。并且由于之前設(shè)計 M1 Max 時預(yù)留的接口,兩顆裸片之間可以用更快的速度進(jìn)行通訊,最終實現(xiàn)了兩顆裸片之間 2.5TB/s 的連接帶寬。
節(jié)約成本
雖然大家都知道芯片的流片成本很高,但其實只是流片的門檻成本高。當(dāng)一款芯片開始大批量生產(chǎn)之后,邊際成本是比較低的。舉個例子來說,造芯片就像是造塑料洗臉盆。洗臉盆的生產(chǎn)線搭建起來很貴,但你把洗臉盆的生產(chǎn)線搭建起來之后,后面所需的材料成本就很低了。
如果這時候你想生產(chǎn)另一種尺寸的塑料洗臉盆,那你就需要修改生產(chǎn)線甚至重新搭建一條新生產(chǎn)線,這樣就貴了。
所以對于此時的蘋果來說,如果單獨設(shè)計另一個更大尺寸的芯片,而且還是 5nm 的芯片,成本是非常高的。所以蘋果最終的選擇是將兩顆 M1 Max 封裝到一起,這樣新產(chǎn)品可以繼續(xù)利用原有 M1 Max 的生產(chǎn)線,只需要最后將裸片進(jìn)行特殊封裝就可以了。
這就像是一個生產(chǎn)塑料洗臉盆的廠商,原來是一個洗臉盆裝一個紙箱,現(xiàn)在變成了兩個洗臉盆裝一個紙箱,此時只需要重新訂購更大尺寸的紙箱就可以了。
另一方面,就是裸片的良率問題了。當(dāng)裸片的面積越大時,良率就會越低。
假設(shè)一塊小晶圓上面最多可以生產(chǎn) 4 塊 M1 Max,如圖所示當(dāng)晶圓上出現(xiàn)一個 " 壞點 " 時,最終就只能生產(chǎn)出 3 塊 M1 Max,這時良率是 75%。而當(dāng)出現(xiàn)兩個 " 壞點 " 時,最終就只能生產(chǎn)出 2 塊 M1 Max,這時良率是 50%。但如果直接生產(chǎn) M1 ULTRA 這樣大面積的裸片會發(fā)生什么呢?
這時同樣的一個晶圓上最多可以生產(chǎn) 2 塊 M1 ULTRA。如圖所示當(dāng)晶圓上出現(xiàn)一個 " 壞點 " 時,最終就只能生產(chǎn)出 1 塊 M1 ULTRA,這時良率是 50%。而當(dāng)出現(xiàn)兩個 " 壞點 " 時,最終就只能生產(chǎn)出 0 塊 M1 ULTRA,這時良率是 0%。
由此可以看出當(dāng)裸片的面積越大,其它條件相同時,良率就會越低。反之如果把一個大芯片分成兩個小芯片做,良率就會提高。良率提高了,相應(yīng)成本也就省下來了。
結(jié)語
在文章的最后,我有一些想法和補充的信息,在此分享給大家。
1. 蘋果作為一家 Fabless(無晶圓廠模式)公司,對于半導(dǎo)體工藝發(fā)展進(jìn)入瓶頸這件事是無能為力的。只能等待臺積電、三星等晶圓廠研發(fā)出更先進(jìn)的工藝。
2. 在工藝進(jìn)入瓶頸之后,芯片性能如果再想提升,蘋果這種做法是簡單粗暴而且有效的。
3.Die-to-Die 技術(shù)的本質(zhì)是將一個大的 Die(裸片)分成幾個小的 Die(裸片)來做,這樣成本更低。
4. 現(xiàn)在業(yè)界也有這種設(shè)計的趨勢,將原來一個大芯片拆成幾個小芯片進(jìn)行設(shè)計制造。
5. 這種技術(shù)并不是完美的,比如會引入額外的散熱負(fù)擔(dān)。而通過主板 PCB 連接兩顆 CPU 這種方式,散熱問題會小很多。畢竟間距夠大,可以通過多個散熱器解決。
6. 基于此種情況進(jìn)行一個預(yù)測,M1 ULTRA 的實際性能不會是 M1 Max 的 2 倍,但應(yīng)該能超過 1.5 倍。畢竟蘋果有 " 單管壓 i9" 的前例在,散熱問題處理得怎么樣還是要等真機發(fā)售之后看。