2020年,離開地平線的吳強(qiáng)選擇自主創(chuàng)業(yè),他認(rèn)為,存算一體技術(shù)是AI芯片的新方向,對(duì)于長(zhǎng)期被“卡脖子”的國產(chǎn)芯片廠商來說,存算一體芯片可能是國產(chǎn)芯片算力彎道超車的絕佳機(jī)會(huì)。
同年11月,后摩智能成立,吳強(qiáng)組建了自己的團(tuán)隊(duì),誓要親身參與這場(chǎng)屬于國產(chǎn)陣營(yíng)與海外陣營(yíng)的算力大戰(zhàn)。
創(chuàng)業(yè),吳強(qiáng)盯準(zhǔn)了一個(gè)趨勢(shì)——
國產(chǎn)替代。
在芯片短缺越演越烈的那幾年,國產(chǎn)化替代的訴求越來越高,特別是車規(guī)級(jí)芯片,成了整個(gè)產(chǎn)業(yè)供應(yīng)鏈的剛需,這無疑給國內(nèi)創(chuàng)業(yè)者提供了千載難逢的超車時(shí)機(jī)。
剛過去的5月10日,后摩智能發(fā)布了第一款大算力存算一體智駕芯片鴻途H30,并將智能駕駛作為落地場(chǎng)景。吳強(qiáng)的團(tuán)隊(duì),終于在大算力存算一體芯片領(lǐng)域迎來產(chǎn)品級(jí)的發(fā)布,當(dāng)然,這也是國內(nèi)首款存算一體的智駕芯片。
第二成長(zhǎng)曲線
經(jīng)濟(jì)學(xué)里的第一曲線,指的是企業(yè)在熟悉環(huán)境里開展傳統(tǒng)業(yè)務(wù)所經(jīng)歷的生命周期,第二曲線則是面對(duì)新市場(chǎng)、新變革所經(jīng)歷的生命周期。
英國管理學(xué)大師查爾斯·漢迪(Charles Handy)用“第二理論”給轉(zhuǎn)型升級(jí)傳遞了相似的思路:為了向前發(fā)展,必須在改革中開辟一條完全不同的新道路,對(duì)熟悉的問題要有新視角,也就是托馬斯·庫恩(Thomas Kuhn)所說的“范式轉(zhuǎn)移”。
實(shí)際上,每一個(gè)行業(yè)都將面臨經(jīng)濟(jì)學(xué)里的第二曲線,特別是身處算力軍備賽的芯片領(lǐng)域,更是在海量算力需求里經(jīng)歷著第二曲線的突圍與探路。
顛覆芯片的底層架構(gòu)設(shè)計(jì),存算一體,正是突破算力瓶頸、擺脫存儲(chǔ)寬帶限制的一條路徑。
關(guān)鍵詞之一,是順勢(shì)。
大部分讀者都知道,算法、算力和數(shù)據(jù)是大模型時(shí)代的三大基礎(chǔ)要素,ChatGPT引爆了算力要求的“核聚變”。當(dāng)摩爾定律已經(jīng)被逼近物理極限,如何突破算力瓶頸已成為業(yè)界重點(diǎn)突圍的方向之一,因?yàn)槟P陀?jì)算量的增長(zhǎng)速度,已經(jīng)遠(yuǎn)超AI硬件算力增長(zhǎng)速度。
延伸到智駕領(lǐng)域,當(dāng)汽車迎來智能化新時(shí)代,高級(jí)別的自動(dòng)駕駛對(duì)算力有非常嚴(yán)格的需求,特別是到了L4,算力要求已達(dá)到1000T以上,且伴隨著Corner Case的增加,算法模型增大,更具復(fù)雜性,算力的需求也隨之攀升。
關(guān)鍵詞之二,是破局。
經(jīng)典的馮諾依曼架構(gòu)里,數(shù)據(jù)從處理單元外的存儲(chǔ)器提取,處理完之后,再返回存儲(chǔ)器。因此,基于馮諾依曼體系結(jié)構(gòu)的算力相對(duì)簡(jiǎn)單,且CPU和存儲(chǔ)器之間存在巨大的速度差,抵達(dá)一定的極限后,存儲(chǔ)器就很難跟上運(yùn)算部件消耗的數(shù)據(jù)了。
量產(chǎn)階段的困局體現(xiàn)在:
(參考:《量子位·存算一體芯片報(bào)告》)
-即使芯片制程更加先進(jìn)了,但對(duì)于制造商來說還是投入產(chǎn)出比極低,研發(fā)與生產(chǎn)成本上去了,性能提升卻往往不如人意。
-集成電路尺寸進(jìn)一步縮小,芯片的可靠性也受到挑戰(zhàn),諸如由“短溝道效應(yīng)”和“量子隧穿效應(yīng)”等引發(fā)的芯片漏電。
-先進(jìn)工藝下盡管芯片擁有大算力,但同時(shí)也產(chǎn)生了高能耗,對(duì)于功耗敏感的應(yīng)用場(chǎng)景,先進(jìn)制程不占優(yōu)勢(shì)。
因此,芯片行業(yè)一直有這樣一種說法,馮諾依曼的架構(gòu)思路既是一切現(xiàn)代計(jì)算機(jī)的基礎(chǔ),又是現(xiàn)代計(jì)算機(jī)難以繞開的桎梏。如何解開這層與生俱來的桎梏,突破計(jì)算單元與存儲(chǔ)單元分離的缺點(diǎn),成為很多芯片玩家努力的方向。
何為存算一體?
字面上來說,作為一種全新的計(jì)算架構(gòu),存算一體是在存儲(chǔ)器中嵌入計(jì)算能力,將存儲(chǔ)單元和計(jì)算單元合為一體,省去了計(jì)算過程中數(shù)據(jù)搬運(yùn)環(huán)節(jié),消除了由于數(shù)據(jù)搬運(yùn)帶來的功耗和延遲,提升計(jì)算能效。
在吳強(qiáng)看來,將公司首款存算一體芯片應(yīng)用于智駕,是一個(gè)非常漂亮的決定。
因?yàn)樵诩夹g(shù)和產(chǎn)品匹配的角度,這顆芯片帶來的優(yōu)勢(shì),和自動(dòng)駕駛的關(guān)鍵需求是天然吻合的,可實(shí)現(xiàn)極致能效比和超低延時(shí),讓底層的芯片更好地扮演著人類大腦的角色。
一個(gè),是打破存儲(chǔ)墻。
面對(duì)存儲(chǔ)墻、帶寬墻和功耗墻等挑戰(zhàn),存算一體芯片能成百上千倍地提高計(jì)算效率,從而降低成本,消除不必要的數(shù)據(jù)搬移延遲和功耗,這也是較多核并行加速技術(shù)更為顛覆的地方。
另一個(gè),是算力與能效。
計(jì)算直接在存儲(chǔ)器內(nèi)完成,可提供大于1000TOPS以上的算力和超10-100TOPS/W的能效。通俗一點(diǎn)講,就是在面積不變的基礎(chǔ)上,翻倍增加計(jì)算核心數(shù),數(shù)據(jù)層面,成幾何式提升。
256TOPS & 35W
昨日,后摩智能正式發(fā)布了旗下首款存算一體智駕芯片——鴻途?H30,最高物理算力達(dá)到256TOPS,典型功耗35W,這也意味著,國內(nèi)科技公司自研資產(chǎn)的存算一體大算力AI芯片,終于在智駕領(lǐng)域落地了。
“是物理算力,不是稀疏虛擬算力?!?/span>
吳強(qiáng)手里拿著一顆H30,向大家介紹該芯片的核心指標(biāo)。他特意強(qiáng)調(diào),256TOPS是物理算力,并不是大家平日里提及的稀疏虛擬算力,這也意味著,H30目前創(chuàng)造了國內(nèi)之“最”,即國產(chǎn)智駕芯片里物理算力最大的產(chǎn)品。
有種“一覽眾山小”的俯視感,且值得一提的是,弄出這樣一顆芯片,后摩智能只用了短短兩年的時(shí)間。
優(yōu)勢(shì)不止于此。
256TOPS的算力,功耗只需要35W,這也意味著,其能效的數(shù)據(jù)更是“吊打”一眾國內(nèi)的智駕芯片產(chǎn)品。
地平線CEO余凱曾感慨,尤其是在智駕芯片領(lǐng)域,屬于寡頭性非常強(qiáng)的領(lǐng)域,到后來,大部分玩家都會(huì)陪跑,最終能跑出來的公司屈指可數(shù)。雖然我們看不清賽道的終局,但從目前來看,作為只有兩歲的創(chuàng)業(yè)公司,后摩時(shí)代的成績(jī)是可圈可點(diǎn)的。
還有一些數(shù)據(jù)參數(shù):
性能指標(biāo)——
后摩智能用H30與英偉達(dá)的產(chǎn)品相比,在Resnet50下,前者Batch=8達(dá)到10300幀/秒的性能,是后者的2.3倍;而在Batch =1時(shí),前者性能達(dá)到8700幀/秒,后者僅為1520幀/秒,是英偉達(dá)的5.7倍。
計(jì)算效率——
H30在上述相同的比較維度,Batch = 8的情況下,計(jì)算效率達(dá)到294FPS/Watt,是英偉達(dá)的4.6倍,Batch=1時(shí),這一數(shù)字更是高達(dá)11.3 倍。
這里還有一個(gè)細(xì)節(jié)。
吳強(qiáng)曾在一次交流中表示,存算一體是架構(gòu)的創(chuàng)新,而工藝則是另一個(gè)維度的事情。好工藝肯定是好事,后摩智能也在用先進(jìn)工藝,但是對(duì)存算一體來說,對(duì)先進(jìn)工藝依賴度其實(shí)是比較低的。
事實(shí)確實(shí)如此。
而且,這正是后摩智能的優(yōu)勢(shì)所在。H30是基于12nm工藝制作的,但是英偉達(dá)的卻是8nm,這也可以看出,如若兩家公司的產(chǎn)品工藝處于同樣的節(jié)點(diǎn),來自后摩智能的產(chǎn)品勢(shì)必效率更高。
后摩強(qiáng)調(diào)的,是架構(gòu)。
決定H30擁有上述優(yōu)秀數(shù)據(jù)的核心,是后摩智能面向智能駕駛場(chǎng)景自主研發(fā)的第一代IPU(Intelligence Processing Unit)——天樞架構(gòu)。
它是新產(chǎn)品擁有超越同級(jí)性能的“幕后功臣”在它的指導(dǎo)下,H30提升了兩倍性能,功耗降低了約50%。
演講臺(tái)上的吳強(qiáng)用了這樣的比喻:
特斯拉的FSD,是堆積計(jì)算,就像一個(gè)四合院子,房子的主人最大限度地利用了面積,堆放了日常用品,且房屋構(gòu)造利用率極高,但盡管如此,這里的面積還是有限,想無限擴(kuò)大社交范圍,非常困難。
后摩智能則不同,它是中式庭院和西式高樓的組合,同樣是四合院大小的面積,通過西式高樓,不同樓層有自己的公布布局,且高樓內(nèi)部協(xié)調(diào)性極佳,就像一個(gè)綜合辦公樓,大家可以在最小的用地面積上實(shí)現(xiàn)最大范圍的社交功能。
落地元年
吳強(qiáng)曾在此前的中國電動(dòng)汽車百人會(huì)論壇上預(yù)測(cè),2023年將是國內(nèi)存算一體智駕芯片商業(yè)落地的元年,如今,他用自己率先落地的H30,打響了細(xì)分賽道鳴槍開賽的第一聲。
《NE時(shí)代》翻看了吳強(qiáng)此前在公開場(chǎng)合提及的產(chǎn)品研發(fā)心路,在存算一體高算力芯片落地的過程中,他和團(tuán)隊(duì)也經(jīng)歷了諸多困難。
一如,散熱。
存算一體,除了大算力的需求,汽車智能化和電動(dòng)化又帶來了功耗、散熱、成本和自主可控等難題。
他的團(tuán)隊(duì)確實(shí)在其中克服了很多障礙,比如說,如何在大算力的同時(shí)又能做到低功耗,保證自然散熱。他希望用存算一體的架構(gòu)在做到自然散熱的情況下,可以做到算力2-3倍的提升,這是存算一體賦予的能力。
二如,存儲(chǔ)介質(zhì)。
從產(chǎn)業(yè)鏈的角度來說,存算一體依賴于存儲(chǔ)介質(zhì)工藝,后摩智能目前的產(chǎn)品是基于SRAM,下一代產(chǎn)品則計(jì)劃基于其它一些存儲(chǔ)機(jī)制,例如MRAM和RRAM。
其中,存儲(chǔ)工藝又依賴于上游廠商,如臺(tái)積電這樣的公司,但目前RRAM在臺(tái)積電的成熟度屬于風(fēng)險(xiǎn)等級(jí),距離完全量產(chǎn)大約有1-2年時(shí)間。這是產(chǎn)業(yè)鏈的依賴,雖然有風(fēng)險(xiǎn),但不得不經(jīng)歷。
三如,技術(shù)轉(zhuǎn)移。
存算一體,之前很長(zhǎng)一段時(shí)間,業(yè)界幾乎是以學(xué)術(shù)研究的方式在做,但從學(xué)術(shù)到商業(yè)量產(chǎn)還有一定距離。
后摩智能和其他一些創(chuàng)業(yè)企業(yè),更多是按照商業(yè)量產(chǎn)的標(biāo)準(zhǔn)去做,過去兩年都在不斷探索中試錯(cuò)。比如,具體怎么做量產(chǎn),怎么做DFT(Design for Test,即可靠性設(shè)計(jì)),怎么做冗余,怎么做自修復(fù),這些都是公司要解決的問題。
四如,驗(yàn)證與磨合。
CPU、GPU和AI芯片等“大芯片”賽道,從創(chuàng)業(yè)的角度看,這類芯片燒錢多、周期長(zhǎng),很難快速上量,但是技術(shù)壁壘更高、增長(zhǎng)空間更大,且客戶黏性強(qiáng)。
做出原型驗(yàn)證芯片之后,公司還有很多工作,就智能駕駛芯片來看,進(jìn)入汽車產(chǎn)業(yè)的配套環(huán)節(jié),也需要較長(zhǎng)的驗(yàn)證與磨合周期。
他曾在接受媒體交流時(shí)表示,創(chuàng)業(yè)初期,他自己曾經(jīng)也迷惑過。因?yàn)榭吹揭恍﹦?chuàng)業(yè)企業(yè)還沒量產(chǎn),就開始有資本運(yùn)作籌備上市,這樣的信號(hào),他會(huì)懷疑自己,這種從底層技術(shù)產(chǎn)品開始的創(chuàng)業(yè)方式是不是太保守了——
半導(dǎo)體是一個(gè)需要技術(shù)沉淀和積累的行業(yè),跳來跳去,怎么能有真正的技術(shù)積累和能力提升?
事實(shí)說明,他的懷疑和自省都是對(duì)的,而對(duì)于兩歲的后摩智能來說,率先落地第一顆存算一體智駕芯片,也只是萬里長(zhǎng)征的第一步。畢竟,大家都看到了趨勢(shì),被時(shí)代裹挾著向前,對(duì)手們也沒有閑著。
來源:第一電動(dòng)網(wǎng)
作者:NE時(shí)代
本文地址:http://www.medic-health.cn/kol/202635
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。