2020年秋季開始在全球爆發(fā)的芯片短缺在2021年持續(xù)了整整一年,但這一趨勢并未緩解。半導(dǎo)體行業(yè)正在擴大產(chǎn)能,同時積極升級工藝以提高生產(chǎn)率。另一方面,新冠病毒繼續(xù)變異,疫情的持續(xù)繼續(xù)對整個半導(dǎo)體行業(yè)產(chǎn)生影響。遠程辦公、在線會議和在線教育習(xí)慣的形成加速了幾個行業(yè)的數(shù)字化轉(zhuǎn)型,也從側(cè)面推動了網(wǎng)絡(luò)通信、人工智能、存儲和云服務(wù)的技術(shù)更新。
1 3nm工藝批量生產(chǎn)
在半導(dǎo)體尖端制造工藝方面,三星代工在2020年暫時將4LPE調(diào)整為完整工藝節(jié)點。也就是說,4nm工藝將成為三星在下一段時間內(nèi)推廣的重點。2021年10月,臺積電發(fā)布消息稱,N3工藝基本明朗略有延遲,2022年或?qū)⒊蔀?nm工藝年。iPhone 14要趕上3nm工藝幾乎是沒有希望的。
但基本上,很明顯,盡管使用臺積電N3工藝的最快芯片可能需要等到2023年第一季度,但N3工藝量產(chǎn)顯然要到2022年第四季度。
我們認(rèn)為三星3nm GAA可能比臺積電N3晚一點。三星開始在3nm節(jié)點使用GAA結(jié)構(gòu)晶體管作為重點,但事實上,三星也未能如期推進。而且根據(jù)三星目前的公開數(shù)據(jù),其最早的3nm工藝可能在技術(shù)層面受到更大的不確定性。
至于英特爾3,它完全無法趕上2022年的班車。臺積電N3將繼續(xù)保持其市場主導(dǎo)地位,暫時領(lǐng)先其他兩個競爭對手。但踩下N3的剎車實際上為2nm時代的到來埋下了隱患。
一方面,英特爾20A工藝預(yù)計將于2024年上半年問世。英特爾18A可能會出現(xiàn)在2025年下半年——英特爾在這兩個節(jié)點重返技術(shù)領(lǐng)先地位的決心相當(dāng)堅定。另一方面,三星預(yù)計將在2025年下半年大規(guī)模生產(chǎn)2nm工藝。這將是其第三代GAA結(jié)構(gòu)晶體管,即其3nm工藝盡管很難獲得市場主導(dǎo)地位,但該技術(shù)將為其2nm工藝提供強有力的支持。這些都增加了后續(xù)2nm工藝市場競爭的不確定性。
2 DDR5標(biāo)準(zhǔn)內(nèi)存進入量產(chǎn)和商用
2020年7月15日,為了應(yīng)對從客戶端系統(tǒng)到高性能服務(wù)器等廣泛應(yīng)用面臨的性能和功耗挑戰(zhàn),固態(tài)技術(shù)委員會(JEDEC)正式發(fā)布了下一代主流內(nèi)存標(biāo)準(zhǔn)DDR5 SDRAM(JESD79-5)的最終規(guī)范,開啟了全球計算機內(nèi)存技術(shù)的新時代。JEDEC將DDR5描述為一種“革命性”的內(nèi)存架構(gòu),并認(rèn)為其出現(xiàn)標(biāo)志著該行業(yè)即將向DDR5服務(wù)器雙列直插內(nèi)存模塊(DIMM)過渡。
DDR5型
根據(jù)市場研究公司Omdia的數(shù)據(jù),DDR5的市場需求從2020年開始出現(xiàn),到2022年,DDR5將占整個DRAM市場的10%,到2024年將擴大到43%。2023年,DDR5將在手機、筆記本電腦和個人電腦等主流市場廣泛采用,出貨量將大幅超過DDR4,完成兩種技術(shù)之間的快速過渡。
內(nèi)存帶寬的增長速度遠遠快于處理器性能,這是DDR5推出的基本驅(qū)動力。但與之前的產(chǎn)品迭代不同的是,該產(chǎn)品主要關(guān)注如何降低功耗,并將PC作為應(yīng)用程序進行優(yōu)先考慮,業(yè)界普遍認(rèn)為DDR5將效仿DDR4,在數(shù)據(jù)中心占據(jù)領(lǐng)先地位。
DDR5最引人注目的地方是速度比已經(jīng)“超高速”的DDR4更快。與DDR4內(nèi)存在1.6GHz時鐘頻率下的最大3.2Gbps傳輸速度相比,新的DDR5內(nèi)存達到了6.4Gbps的最大傳輸速度,并將電源電壓從DDR4的1.2V同步到1.1V,進一步提高了內(nèi)存的能效性能。
目前,三星、SK海力士和美光等全球存儲巨頭已經(jīng)宣布了各自DDR5產(chǎn)品的量產(chǎn)和商業(yè)時間表。然而,DDR5不會在一夜之間上市,需要生態(tài)系統(tǒng)的大力支持,包括系統(tǒng)和芯片服務(wù)提供商、渠道供應(yīng)商、云服務(wù)提供商和原始設(shè)備制造商。
3 DPU市場蛋糕繼續(xù)增長并爆炸
民主黨的綽號在2020年底開始流行起來。我們認(rèn)為,使DPU一詞流行起來的市場行為是:首先,NVIDIA收購了以色列公司Mellanox,該公司在第二年創(chuàng)造了“DPU”一詞;其次,初創(chuàng)公司Fungible在同年大力推廣DPU一名稱。
DPU中的D表示DATA數(shù)據(jù)。智能網(wǎng)卡迅速發(fā)展成為DPU數(shù)據(jù)處理器。以閃電般的速度,在短時間內(nèi)涌現(xiàn)出數(shù)十家DPU初創(chuàng)公司。
DPU本質(zhì)上是智能網(wǎng)卡的進化,但從DPU的熱情不難看出,數(shù)據(jù)中心對數(shù)據(jù)方向的專用處理器以及形式上的進一步固定和標(biāo)準(zhǔn)化有著強烈的渴望。
數(shù)據(jù)處理單元
在數(shù)據(jù)中心的早期,有一個術(shù)語叫做“數(shù)據(jù)中心稅”,即服務(wù)器購買了許多核心CPU。但對于最后的業(yè)務(wù),這些核心中的一些在默認(rèn)情況下被“蠶食”了。因為這些處理器資源需要用來做數(shù)據(jù)虛擬聯(lián)網(wǎng)、安全、存儲、虛擬化等工作。當(dāng)這些任務(wù)變得越來越復(fù)雜時,DPU就出現(xiàn)了。正如圖形計算有GPU,人工智能計算有NPU一樣,DPU是這個時代專用計算興起的產(chǎn)物。
一般來說,DPU的工作包括:首先,卸載原始CPU OVS、存儲、安全服務(wù)和其他活動;其次,管理系統(tǒng)管理程序做隔離、虛擬化實現(xiàn);第三,通過多種方式,進一步加快跨節(jié)點數(shù)據(jù)處理。
不難理解,DPU已經(jīng)成為數(shù)據(jù)中心的標(biāo)準(zhǔn)。然而,在具體實施方面,不同的DPU不應(yīng)該在同一個舞臺上,這是由于它們所扮演的角色不同造成的。例如,盡管英特爾的IPU也是一個DPU,但在責(zé)任和工作偏見方面,它仍然與NVIDIA DPU不同。因此,DPU市場可能會被細(xì)分。以及數(shù)據(jù)中心系統(tǒng)公司正在研究他們自己的更具適應(yīng)性的DPU,這給DPU市場帶來了不確定性。
4跨越“存儲墻”和“電源墻”的存儲和計算集成
存儲器中處理(PIM)概念的形成可以追溯到20世紀(jì)70年代,但由于芯片設(shè)計和制造成本的復(fù)雜性以及缺乏殺手級的大數(shù)據(jù)應(yīng)用程序來驅(qū)動,這一概念受到了限制。
近年來,隨著芯片制造工藝的進步和人工智能應(yīng)用的發(fā)展,處理器的功能越來越強大,速度越來越快,存儲容量也越來越大。面對海量數(shù)據(jù),數(shù)據(jù)處理速度慢、處理能耗高等問題已成為計算瓶頸。從處理單元外的存儲器中提取數(shù)據(jù)時,處理時間往往比計算時間長數(shù)百或數(shù)千倍,整個過程的能耗大致在60%至90%之間,效率非常低。
另一方面,接近極限的摩爾定律和受存儲墻限制的馮·諾依曼架構(gòu)在計算能力增強方面已經(jīng)無法滿足這個時代的需求。當(dāng)前試圖解決“存儲墻”和“電源墻”問題的非馮·諾依曼體系結(jié)構(gòu)包括低電壓亞閾值數(shù)字邏輯ASIC、神經(jīng)形態(tài)和模擬計算。非馮-諾依曼體系結(jié)構(gòu)包括低電壓亞閾值數(shù)字邏輯ASIC、神經(jīng)形態(tài)計算和模擬計算,其中存儲器計算集成是最直接、最有效的。
這是一種新型的計算架構(gòu),可以進行二維和三維矩陣乘法運算,而不是在傳統(tǒng)的邏輯計算單元上進行優(yōu)化。這在理論上可以消除數(shù)據(jù)傳輸?shù)难舆t和功耗,使人工智能計算的效率提高數(shù)百倍并降低成本,因此特別適合神經(jīng)網(wǎng)絡(luò)。
5 5G建設(shè)聚焦自主組網(wǎng)和毫米波
憑借光纖般的速度、超低延遲和網(wǎng)絡(luò)容量,5G的影響力與電力一樣大,徹底改變了所有行業(yè)。
作為對Sub-6GHz頻段的有力補充,5G毫米波具有高頻寬帶容量、易于與波束逸度結(jié)合、超低延遲等突出優(yōu)勢,有利于推動工業(yè)互聯(lián)網(wǎng)、AR/VR、云游戲、實時計算等行業(yè)的發(fā)展。同時,毫米波可以支持高精度定位和高設(shè)備集成的密集區(qū)域部署,這將有助于促進基站和終端的小型化。
根據(jù)GSMA的“毫米波應(yīng)用價值”報告,到2035年,5G毫米波預(yù)計將創(chuàng)造5650億美元的全球GDP,并產(chǎn)生1520億美元稅收,占5G創(chuàng)造的總價值的25%。
目前,48個國家的186家運營商正計劃開發(fā)26-28 GHz、37-40 GHz和47-48 GHz毫米波頻譜的5G;23個國家的134家運營商持有毫米波部署許可證,其中北美、歐洲和亞洲占所有頻譜部署的75%。其中,26-28 GHz是部署和許可最多的毫米波段,37-40 GHz緊隨其后。
但并不是所有的應(yīng)用場景都需要毫米波覆蓋。201年7月,中國工業(yè)網(wǎng)、工業(yè)和信息化部對港口、電力、農(nóng)業(yè)9個場景進行了5G業(yè)務(wù)深化。上述場景要求非常高,延遲非常高,這對毫米波來說是有利的。
6款EDA工具開始使用AI設(shè)計芯片
當(dāng)前的智能手機、車聯(lián)網(wǎng)、物聯(lián)網(wǎng)等終端對SOC PPA(功耗、性能、面積)提出了更高的要求。面對數(shù)億晶體管的芯片設(shè)計規(guī)模,以及異構(gòu)集成、系統(tǒng)級封裝、芯片等新的封裝方向,如果沒有機器學(xué)習(xí)(ml)和人工智能助手,工程師將面臨更嚴(yán)峻的挑戰(zhàn)。
將人工智能設(shè)計從概念升級到現(xiàn)實世界階段,無論是將人工智能算法應(yīng)用于EDA工具,使芯片設(shè)計“AI Inside”,還是專注于如何設(shè)計EDA工具,幫助人工智能芯片高效設(shè)計“AI Outside”,EDA行業(yè)和學(xué)界都已開始行動起來。在國家戰(zhàn)略層面,美國國防高級研究計劃局(DARPA)甚至開始將電子資產(chǎn)智能設(shè)計(IEDA)作為代表性項目,重點突破優(yōu)化算法、亞7納米芯片設(shè)計支持、布線和設(shè)備自動化等關(guān)鍵技術(shù)挑戰(zhàn)。
事實上,人工智能用于芯片設(shè)計并不是什么新鮮事。谷歌當(dāng)時在TPU芯片的設(shè)計中使用了人工智能技術(shù);三星在芯片設(shè)計中融入了人工智能技術(shù),據(jù)稱超出了此前可實現(xiàn)的芯片PPA效果;英偉達也在使用人工智能算法來優(yōu)化5納米和3納米芯片的設(shè)計。
總的來說,芯片設(shè)計(或物理實現(xiàn))的后端,尤其是在占人力巨大比例的布局和布線領(lǐng)域,是人工智能的關(guān)鍵??焖俳?、電路仿真、提高VLSI QoR等也是EDA使用人工智能的方向??梢钥闯?,人工智能目前的優(yōu)勢是進行大規(guī)模計算、比較提取,或?qū)δ承┕δ艿脑鰪?,而在?到1”的創(chuàng)建階段和決策階段,仍然需要與人類工程師合作。但不管怎么說,人工智能將是EDA未來發(fā)展的終極形式,也是未來幾年提高芯片設(shè)計效率的關(guān)鍵。
7 Matter將推動物聯(lián)網(wǎng)和智能家居連接標(biāo)準(zhǔn)的統(tǒng)一
連接標(biāo)準(zhǔn)聯(lián)盟(前身為Zigbee聯(lián)盟)和亞馬遜、蘋果和谷歌等智能家居制造商開發(fā)了Matter,這是一種基于原始IP連接家庭項目(CHIP)的標(biāo)準(zhǔn)化互連。Matter是一種標(biāo)準(zhǔn)化的互連協(xié)議,旨在實現(xiàn)不同制造商的物聯(lián)網(wǎng)設(shè)備的互操作性和兼容性,并使用各種無線連接標(biāo)準(zhǔn),從而為消費者帶來更好的設(shè)備安裝和操作體驗,簡化制造商和開發(fā)商的物聯(lián)網(wǎng)設(shè)備開發(fā)流程。
Matter作為應(yīng)用層,將使用各種IP協(xié)議和互連標(biāo)準(zhǔn)操作的設(shè)備統(tǒng)一起來,支持它們跨平臺通信。Matter協(xié)議目前支持三種底層通信協(xié)議——以太網(wǎng)、Wi-Fi和線程——還統(tǒng)一了低功耗藍牙(BLE)作為配對方法的使用。它是一種在現(xiàn)有協(xié)議之上運行的架構(gòu),未來將支持更多協(xié)議,包括Zigbee和Z-Wave。
Matter標(biāo)準(zhǔn)已經(jīng)得到互聯(lián)網(wǎng)巨頭(亞馬遜、蘋果和谷歌)、芯片供應(yīng)商(硅實驗室、恩智浦和樂芯科技)、物聯(lián)網(wǎng)和智能家居設(shè)備制造商(宜家、華為和OPPO)以及智能家居平臺(涂鴉和五聯(lián))的支持,預(yù)計從2022年起將在全球范圍內(nèi)迅速增長和傳播。預(yù)計從2022年起,它將成為物聯(lián)網(wǎng)和智能家居的統(tǒng)一互聯(lián)標(biāo)準(zhǔn)。
8 RISC-V體系結(jié)構(gòu)處理器進入高性能計算應(yīng)用
10年前,起源于加州大學(xué)伯克利分校的RISC-V已經(jīng)成為主流的微處理器架構(gòu)指令集(ISA),但其主要應(yīng)用也僅限于嵌入式系統(tǒng)和微控制器(MCU)領(lǐng)域,尤其是物聯(lián)網(wǎng)市場。這種開源、免費、免費的微處理器體系結(jié)構(gòu)能否作為X86和ARM的高性能計算(HPC)?從芯片巨頭、Fabless初創(chuàng)公司到微處理器內(nèi)核IP開發(fā)商,都試圖將RISC-V引入AI、5G和服務(wù)器等高性能計算應(yīng)用。
RISC-V病毒
SIIVE的性能系列是其性能最高的RISC-V內(nèi)核,專為網(wǎng)絡(luò)、邊緣計算、自主機器、5G基站、虛擬/增強現(xiàn)實而設(shè)計。最新的P550微處理器采用RISC-V RV64GBC ISA,13級流水線/三次啟動/圖表,四核集群具有4MB的三級緩存,主頻2.4 GHz。P550內(nèi)核SPECINT 2006測試性能為8.65/GHz。與ARM Cortex-A75相比,SPECINT2006和SPECFP2006整數(shù)/浮點參考測試的性能更高,占用面積更小。四核P550集群的占用空間大致相當(dāng)于一個Cortex-A75。
Intel將在其7nm Horse Creek平臺中使用P550內(nèi)核,通過將DDR和PCIe等Intel接口IP與SiFive的最高性能處理器相結(jié)合,Horse Creeks將為高端RISC-V應(yīng)用程序提供有價值且可擴展的開發(fā)工具。
硅谷IC設(shè)計初創(chuàng)公司Esperanto推出了ET-SoC-1,這是一種人工智能油門芯片,具有1000多個集成RISC-V核心,專為數(shù)據(jù)中心的人工智能推理而設(shè)計。ET-SoC-1采用臺積電的7nm工藝,集成240億個晶體管,包括1088個高性能ET-Minion 64位RISC-V有序內(nèi)核(每個內(nèi)核都配有矢量/張量單元);四個高性能ET Maxion 64位RISC-V無序內(nèi)核;以及超過160MB的片上SRAM。用于LPDDR4x DRAM和eMMC FLASH的外部大容量存儲器接口;PCIe x8 Gen4和其他通用I/O接口。該芯片的峰值計算性能為100-200 TOPS,用于ML推理,操作功耗小于20W。
9先進的封裝技術(shù)成為“新摩爾定律”
在過去的幾十年里,摩爾定律就像是引領(lǐng)半導(dǎo)體行業(yè)發(fā)展的燈塔。然而,由于物理限制和制造成本的原因,當(dāng)先進的工藝技術(shù)達到5納米、3納米甚至2納米時,通過晶體管小型化工藝實現(xiàn)更高經(jīng)濟價值的邏輯正逐漸變得不那么有效。
從市場趨勢來看,過去十年數(shù)據(jù)計算的發(fā)展已經(jīng)超過了過去四十年的總和。云計算、大數(shù)據(jù)分析、人工智能、人工智能推斷、移動計算,甚至自動駕駛汽車都需要大量計算。為了解決力增長問題,除了通過CMOS微型化繼續(xù)提高密度外,將不同的工藝/架構(gòu)、不同的指令和硬件的不同功能結(jié)合起來是很重要的。
因此,一條不再是直線的IC技術(shù)發(fā)展道路,以及市場對創(chuàng)新解決方案的需求,將封裝,特別是先進的封裝技術(shù),推向了創(chuàng)新的前沿。
最新研究數(shù)據(jù)顯示,從2020年到2026年,先進包裝市場的復(fù)合年增長率將約為7.9%。到2025年,僅收入一項,該市場就將超過420億美元,幾乎是傳統(tǒng)封裝市場預(yù)期增長率(2.2%)的三倍。其中,2.5D/3D堆疊IC、嵌入式芯片(嵌入式芯片,ED)和扇出封裝(扇出,F(xiàn)O)是增長最快的技術(shù)平臺,復(fù)合年增長率分別為21%、18%和16%。
目前,OSAT公司、鑄造廠、IDM、Fabless公司、EDA工具供應(yīng)商等都在加入先進封裝市場的競爭,并投入了巨額資金。但總的來說,在可預(yù)見的未來,2.5D/3D封裝技術(shù)將成為“先進封裝”的核心,而提高互連密度和采用Chiplet設(shè)計將是驅(qū)動“先進包裝”發(fā)展的兩條技術(shù)路徑。為了展示先進包裝的最大價值,需要全產(chǎn)業(yè)鏈的協(xié)同作用。
10汽車領(lǐng)域控制器和汽車大腦
整個汽車電氣電子架構(gòu)正在經(jīng)歷從傳統(tǒng)的分布式架構(gòu)向基于DCU的集中式架構(gòu)和基于DCU融合的區(qū)域架構(gòu)的轉(zhuǎn)變。
目前,汽車電子電氣架構(gòu)主要呈現(xiàn)智能座艙、智能計算、智能駕駛?cè)蚩刂萍軜?gòu)的現(xiàn)狀。預(yù)計2030年后,隨著自動駕駛技術(shù)路線的逐步成熟,自動駕駛高性能芯片將與駕駛艙主控芯片進一步集成到中央計算芯片,從而通過集成進一步提高計算效率、降低成本。
這意味著,汽車現(xiàn)在需要一個非常強大的“大腦”——既要發(fā)揮硬件中樞的作用,又要有非常強大的計算能力來滿足上述轉(zhuǎn)型過程中產(chǎn)生的硬件和軟件的新需求。
事實上,對于自動駕駛系統(tǒng)的發(fā)展,業(yè)界普遍認(rèn)為,從L2+輔助駕駛到L4/L5級自動駕駛的漸進路線是最可行的路徑。這就要求相應(yīng)的中央計算平臺具有高超的可擴展性,支持系統(tǒng)開發(fā)的順利演進,滿足各級自動駕駛對運算能力和功耗的差異化要求,提高主機廠等合作伙伴的開發(fā)效率。
當(dāng)然,汽車大腦芯片不能只關(guān)心峰值功率而是要綜合平衡。應(yīng)考慮信息安全、功能安全、異構(gòu)架構(gòu)、不同數(shù)據(jù)類型處理、熱管理等。同時,考慮到“軟件定義汽車”已經(jīng)成為行業(yè)共識,在設(shè)計中,也需要預(yù)留足夠的冗余空間來應(yīng)對不斷變化的汽車架構(gòu)和人工智能算法。
在未來,汽車將毫無疑問,它是一個機電智能。現(xiàn)有的子系統(tǒng)是集成的,因為大量集成將成為一種趨勢。這也使得硬件開發(fā)瓶頸在突破后,優(yōu)秀的用戶體驗導(dǎo)致軟件開始成為汽車的重要賣點。