自動駕駛系統(tǒng)前裝量產(chǎn)的開發(fā)周期大約 2 到 3 年,因此計算平臺廠家都是提前 2 到 3 年提供芯片樣片。
整個系統(tǒng)開發(fā)完成后,芯片才開始量產(chǎn)。
這樣一來,實際上 2023 年后的自動駕駛芯片格局,今天就已經(jīng)基本確定了。
自動駕駛芯片開發(fā)成本高昂,且出于對高性能、低功耗的要求,其制造至少需要 7 納米和 5 納米的制程工藝。
這個級別的工藝對出貨量要求比較高:
一方面因為臺積電幾乎壟斷 7 納米以下的高性能芯片代工,產(chǎn)能緊缺。
訂單量太低的話,芯片廠商將在臺積電的序列中等待排期。
這個排期長達 1 年半到 3 年。
在這個時間內(nèi),芯片廠商肯定會失去客戶。
另一方面,7 納米以下芯片的開發(fā)成本高昂,動輒 10 億美元起。
如果沒有足夠多的出貨量攤銷,芯片單價會很高,反過來也會影響銷售。
在現(xiàn)在市場的主要玩家中,特斯拉和蘋果的系統(tǒng)封閉軟硬一體化,不對外單獨出售芯片。
華為提供 MDC 計算平臺,但其芯片也不對外單獨出售。
當前,能夠提供高性能自動駕駛芯片,并在市場中擁有一席之地的全球獨立芯片廠商主要還有:Mobileye、英偉達、瑞薩、高通。
其對應(yīng)的芯片產(chǎn)品如下:
因為這些芯片涉及到多個版本,這里對比的都是頂配產(chǎn)品。
1、Mobileye EyeQ6,擁抱英特爾,追逐高性能
2019 年底,Mobileye EyeQ 芯片全球累計出貨超過 5400 萬片。
2020 年 9 月,Mobileye 透露,EyeQ 芯片全球出貨量超過 6000 萬片。
這 6000 萬片是 EyeQ2、EyeQ3 和 EyeQ4 之和,其中 2020 年新增的部分主要是 EyeQ4。
目前 EyeQ5 還未批量出貨。
EyeQ5 提供的算力水平是最高 24 TOPS,跟其他幾家相比,這個算力水平要遜色不少。
EyeQ6 才是 Mobileye 真正發(fā)力高性能的高端。
EyeQ6 預計于 2024/2025 年量產(chǎn),分為高中低三個版本。
Mobileye 在 2016 年開始設(shè)計 EyeQ5,選定了 MIPS 的 I6500 做架構(gòu)。
MIPS 在 I6500 架構(gòu)之上,推出了特別針對車規(guī)的 I6500-F,而后續(xù)的 I7200 是針對無線市場的。
因此,Mobileye 在之后的一代芯片上,放棄了 MIPS 架構(gòu),而決定采用英特爾的 Atom 內(nèi)核[1]。
Atom 是英特爾處理器系列的常青樹,典型車載平臺是 Apollo Lake。
2016 年 6 月,英特爾從 Apolllo Lake 切換到 Goldmont 架構(gòu),并先后在特斯拉、寶馬、卡迪拉克、紅旗、現(xiàn)代、沃爾沃、奇瑞的車機上大量使用。
其中寶馬采用的最多,幾乎全系列都是。
特斯拉 Model 3 也是用的 Apolllo Lake。
最新的 Atom 系列,是 2020 年 9 月推出的 Elkhart Lake 系列即 x6000E,使用 Tremont 架構(gòu)。
相比上代架構(gòu),Tremont 架構(gòu)主要增加了 L2 cache,工藝從 14 納米提升到 10 納米,運行頻率略微提高約 200MHz,最高睿頻可達 3.0GHz。
和上一代一樣,Tremont 架構(gòu)最多也是4核。
整體上,Mobileye 的芯片更新速度較慢。
加上最近英特爾的 CPU 核心業(yè)務(wù)受到來自蘋果、微軟和 AMD 的打擊,公司市值下滑明顯。
EyeQ6 要到 2024 年才量產(chǎn),在各家的競爭中也顯得有些落后了。
2、瑞薩 R-CAR V3U,強勢日系廠商,靈活高性價比
瑞薩是全球第二大汽車半導體廠家,全球第一大汽車 MCU 廠家,也是日本除索尼(索尼的主營業(yè)務(wù)主要是圖像傳感器)外最大的半導體廠家。
在高性能車載計算方面,瑞薩目前最頂級的產(chǎn)品是R-CAR H3,主要用在座艙領(lǐng)域。
最初 R-CAR H3 也考慮了自動駕駛應(yīng)用,但 R-CAR H3 設(shè)計時間是 2013 年。
很難預料到今天客戶對AI算力和 CPU 算力的需求這么強。
R-CAR H3 沒有內(nèi)置 AI 加速器,CPU 算力也只有 40K,顯然達不到自動駕駛系統(tǒng)開發(fā)的要求。
目前主要被用在座艙量產(chǎn)中,比如 2021 款長城 H6。還有 R-CAR M3 被用于大眾中國車型的座艙上。
瑞薩在 2017 年開始加強高算力芯片的設(shè)計。
2019年推出第一個視覺 SoC,即R-CAR V3H。
這顆芯片的 AI 算力有 4 TOPS,博世的下一代視覺系統(tǒng)內(nèi)嵌 V3H,也包括一些日系的全自動泊車系統(tǒng)。
2018 年,瑞薩開始設(shè)計 V3H 的加強版 V3U,到 2020 年基本完成設(shè)計。
目前外部已經(jīng)可以申請 V3U 的樣片,這個速度比其他三家都要快一些。
V3U 的量產(chǎn)預計在2023 年初,豐田和本田也參與了這款芯片的設(shè)計工作。
日本車企和供應(yīng)商之間的抱團非常緊密,我認為豐田和本田自動駕駛系統(tǒng)大概率會采用 V3U。
V3U 內(nèi)部框架如上圖:采用 8 核 A76 設(shè)計。
瑞薩沒有像特斯拉一樣,堆了 12 個 A72,而是使用了 ARM 的 Corelink CCI-500,即 Cache 一致性互聯(lián)。
V3U 的視頻處理管線如上圖,可以看到 V3U 有很多硬核的計算機視覺模塊,包括立體雙目視差,稠密光流、CNN、DOF、STV、ACF 等。
在計算機視覺功能方面,支持包括圖像格式化、目標追蹤、車道檢測、自由空間深度、場景標注、語義分割、檢測分類等模塊。
為了節(jié)約成本,降低功耗,同時也聚焦于車載應(yīng)用需求,瑞薩沒有使用太昂貴的 GPU,只是增加了一個低功耗 GPU,即:
Imagination Technologies 的 PowerVR GE7400,1 個著色器集群+ 32 個 ALU核心,算力只有38.4 GFLOPS@600MHz。
考慮到成本因素,瑞薩沒有使用時髦的 7 納米,而是12 納米工藝,并且是從原瑞薩 R-CAR H3 的 16 納米 FinFET 工藝升級到 12 納米 FFC 工藝,一次性支出很少。
但是論到 AI 性能,絲毫不次于那些 5 納米芯片,瑞薩聲稱 V3U 達到了驚人的 13.8 TOPS/W 的能效比,是頂配 EyeQ6 的 6 倍之多[2]。
V3U 也是一個系列產(chǎn)品,針對不同層級自動駕駛的需求可以提供多個版本,這樣做是為了進一步提高出貨量,降低成本。
V3U 的產(chǎn)品系列采用的是模塊化設(shè)計,A76 可以是 2、4、8 核。
GPU 也可以不要,外設(shè)也可以輕松增減,靈活性很強。
在 Mobileye、瑞薩、英偉達、高通四大自動駕駛芯片廠家中,只有瑞薩的主業(yè)是汽車半導體,因此對車規(guī)安全重視程度最高,V3U 的規(guī)劃目標是ASIL-D。
3、英偉達 Orin:極致性能,新造車青睞
英偉達于 2019 年底發(fā)布了 Orin 芯片:
預計在 2022 年或 2023 年量產(chǎn),2021 年初有樣片提供。
關(guān)于 Orin 的公開資料一直還停留在 2019 年底發(fā)布時。
據(jù)說圍繞 Orin 的軟件工作異常復雜,硬件已經(jīng)完全就緒,可能要到 2023 年底才能量產(chǎn)。
Orin 性能一流,但價格可能非常昂貴。
L4 級自動駕駛,自然也是非常昂貴的。主芯片上降低幾百美元,對上萬美元的系統(tǒng)來說也是杯水車薪。
大部分廠家在 L4 的投入上,都是為了樹立旗幟,制造高科技形象。
大規(guī)模量產(chǎn)難度很高,配套的 V2X、高精度地圖和高精度定位都很不成熟,法規(guī)也需要修改。
因此,開發(fā)初期廠商對成本不敏感。換句話說,車廠沒指望在主芯片上降低成本。
與 R-CAR V3U 一樣,英偉達 Orin 也是一個系列產(chǎn)品。
后者的低端產(chǎn)品可能只有 2 到 4 個 A78 內(nèi)核,20 到 40 TOPS 的 AI 算力,可能沒有 Ampere GPU 或少數(shù)核心。
4、高通 Snapdragon Ride,進擊的移動芯片霸主
關(guān)于高通 Snapdragon Ride的公開信息很少。
高通的核心業(yè)務(wù)還是在移動端,因此高通的策略是最大程度地利用手機領(lǐng)域的研發(fā)成果。
按照這個策略,高通最新的Snapdragon 888(即 SM 8350)芯片會最接近 Snapdragon Ride SoC。
高通的 Ride 平臺和英偉達類似,也是基于 SoC+AI 加速器的分離方式。
高通聲稱 888 芯片會采用三星 5 納米 5LPE 工藝制造,并且是兩年半前就決定的。
但目前三星的 5 納米還沒有一個廠家使用,而臺積電的 5 納米已經(jīng)經(jīng)過蘋果 A14 驗證過。
論關(guān)鍵指標晶體管密度,三星的 8 納米與臺積電的 12 納米差不多。
三星的 5 納米跟臺積電的 10 納米差不多,明顯低于臺積電的加強版 7 納米。
但臺積電 5 納米產(chǎn)能被蘋果包了,高通只能找三星。
在 888 芯片上:
Arm 的 Cortex-A78 和 Cortex-X1 都是基于上一代 Cortex-A77。
但這兩款 Arm 處理器的設(shè)計目標不同:
Cortex-A78 側(cè)重于提供更高的每瓦性能,同時體積更小,而 Cortex-X1 則是追求最大性能。
Cortex-X1 是 Arm「CXC 項目」的第一款商用產(chǎn)品。
性能方面,Cortex-X1 將比 Cortex-A77 提高 30%。
與 Cortex-A78 相比,Cortex-X1 的整數(shù)運算性能提升了 23%。
Cortex-X1 還擁有兩倍于 Cortex-A78 的機器學習能力。
Cortex-X1 就相當于「超大核」,它在架構(gòu)設(shè)計上與 Cortex-A78 如出一轍,但幾乎在每個地方都進行了擴展。
ARM 對 Cortex-X1 的定義是「可定制」移動平臺,芯片商可以根據(jù)預算和需求向 ARM 提出要。
然后 ARM 再根據(jù)不同的應(yīng)用場景,調(diào)整 Cortex-X1 各個模塊的規(guī)格設(shè)計。
即便 S888 非常強大,但因為三星的 5 納米工藝,晶體管密度遠不如臺積電 5 納米,也不如臺積電 7 納米。
因此,S888 的單核性能仍然落后蘋果上一代的 A13,跟臺積電 5 納米的 A14 比差距更是非常明顯,A14 比 S888 單核跑分高 41%。
GPU 方面更能凸顯三星工藝的落后。
根據(jù) GFXBench Aztec 測試:
A14 峰值達到每秒 102.24 幀
A13 達到 91.62 幀
S888 只有 86.00 幀
華為的麒麟 9000 是 82.74 幀。
AI 性能方面,S888 得分很高,用 UL Procyon 測試 AI 推理為 32228。
華為的麒麟 9000 是 12596,S888 幾乎是麒麟的三倍。
S888 理論值 26 TOPS,也比蘋果 A14 的 21 TOPS 高。
Ride 平臺應(yīng)用于自動駕駛領(lǐng)域,因此高通可以砍掉 S888 上的 X60 5G Modem,留出更多地方放 NPU,AI 算力估計可以達到 30-40 TOPS。
考慮到成本和車規(guī),高通不會增加太多 AI 算力,因為高通還留了加速器,也就是類似英偉達 A100。
5、華為 MDC,國貨之光,封鎖之下何去何從
華為的自動駕駛計算平臺由車 BU 下的 MDC 產(chǎn)品部負責。
MDC 上采用的 AI 協(xié)處理器是昇騰系列芯片,而 CPU 來自華為的泰山服務(wù)器事業(yè)部,即鯤鵬系列芯片。
MDC 全稱是Mobile Data Center,移動數(shù)據(jù)中心。
MDC 的成員部分來自華為的中央硬件部,后者以開發(fā) ARM 服務(wù)器為主要業(yè)務(wù),之后轉(zhuǎn)到自動駕駛領(lǐng)域。
MDC 的芯片部分仍由海思提供。
MDC 目前主打兩款產(chǎn)品:
一款是用在 L2+ 上的 MDC 210
另一款 MDC 610,主要用在 L4 上
MDC 210 的 CPU 部分未知,AI 處理器是昇騰 310。
MDC 610 的 CPU 很可能是鯤鵬 916,AI 處理器是昇騰 610。
鯤鵬 916,在海思內(nèi)部代號是 Hi1616,是 2017 年的產(chǎn)品。
其采用 32 核 ARM A72 并聯(lián)設(shè)計,最低功耗 75 瓦,標準 TDP 功耗 85 瓦,對標英特爾至強系列服務(wù)器 CPU。
華為鯤鵬 916 參數(shù)與內(nèi)部框架圖如上:
采用了16 納米工藝,也就是說中芯國際能夠代工。
鯤鵬系列更高級的產(chǎn)品是 920,海思內(nèi)部代號 Hi1620,采用了 16 - 96 核設(shè)計,華為自研的架構(gòu),ARM v8.2 指令集,7 納米工藝。
鯤鵬 930 計劃采用 5 納米工藝。
上面說到,華為 MDC 的 AI 處理器主要是昇騰 310 和 610。
按照華為的路線圖,官方原計劃在 2020 年推出昇騰 320、610 和 920,但一直到目前都沒有消息。
昇騰 310 是采用臺積電 12 納米 FFC 工藝制造,于 2018 年推出,因此性能一般,只有 16TOPS 算力。
從華為的官方介紹看,昇騰 920 和 610 都是定位于服務(wù)器深度學習訓練用的,不是用于車載應(yīng)用。
這兩款處理器有明顯的 Cowos 多存儲芯片封裝設(shè)計,這種封裝成本也很高,不適用于成本敏感的領(lǐng)域。
6、誰是最強芯片?
整體回顧:五大廠商中,瑞薩主打超高性價比,并且設(shè)計之初就有整車廠支持。
在日系車企中,除了國際化程度比較高的日產(chǎn),其他廠商毫無疑問都會傾向于瑞薩的 V3U。
瑞薩在車規(guī)安全方面積累較多,這也是德系廠商非常關(guān)心的。
因此出身車載半導體領(lǐng)域的瑞薩比較受日系和德系廠商青睞。
Mobileye有超過 6000 萬片出貨,有龐大用戶基礎(chǔ),美系、韓系還有國內(nèi)自主品牌都傾向于 Mobileye,但目前 EyeQ 系列產(chǎn)品推出速度太慢。
這也是理想、蔚來等多家新晉廠商放棄 EyeQ 平臺的原因。
英偉達性能一流,至于價格,用黃教主的話說,「買得越多,省得越多」。
新興造車企業(yè)追求高性能,蔚來、理想、小鵬幾家手上也有幾百億元的現(xiàn)金儲備,英偉達在其中頗受青睞。
高通Snapdragon Ride 平臺與瑞薩類似,主打性價比,并且高通的原廠支持力度比較大。
目前,長城以及一家眾所周知的造車新勢力頭部公司已經(jīng)選擇了 Ride 平臺。
華為最大的掣肘因素在于芯片的產(chǎn)能。
目前中芯國際的 14 納米工藝不算成熟,從財務(wù)數(shù)據(jù)看,中芯 14 納米業(yè)務(wù)僅占其收入的 1%。
眼下中芯國際也被美國制裁,工藝和產(chǎn)能提升都十分困難。
即便解除封鎖,華為也不會對外單獨銷售芯片。
無論車企選擇使用哪個平臺,都需要芯片原廠提供充足的支持。
在這方面,瑞薩高階的原廠工程師都在日本,支持力度較差。
英偉達人力資源有限,據(jù)說其支持力度也不太友好。
高通在經(jīng)歷移動端的多年磨礪,非常適應(yīng)于為幾十個廠家做支持。
結(jié)合 Mobileye 的推新節(jié)奏,我認為,最終高通和瑞薩有希望勝出。
參考信息:
[1]https://www.eenewsautomotive.com/news/we-need-standardized-criteria-autonomous-driving/page/0/4。
[2]https://eetimes.jp/ee/articles/2012/21/news067.html,CNN-IPも自社で開発したものだ。理論上の最高性能は60TOPSで、1W當たりの性能は最高で13.8TOPS。
來源:第一電動網(wǎng)
作者:汽車之心
本文地址:http://www.medic-health.cn/kol/135567
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。