国产成人av一区二区三区在线,国产欧美性成人精品午夜,а√最新版在线天堂,欧洲成人一区二区三区,亚洲国产精品成人久久蜜臀

  1. 首頁
  2. 大牛說
  3. 特斯拉AI Day全記錄+解讀:不僅有算力怪獸,還有特斯拉機器人!

特斯拉AI Day全記錄+解讀:不僅有算力怪獸,還有特斯拉機器人!

大概兩個小時前,可能是特斯拉本年度最重要,也可能是汽車領(lǐng)域——甚至科技行業(yè)本年度非常重要的一次發(fā)布會,剛剛結(jié)束。

2019 年的 Autonomous Day 上,特斯拉帶來了首款車企自研的自動駕駛計算方案;2020 年的 Battery Day,馬斯克又發(fā)布了號稱續(xù)航提升 54% 的 4680 電池+一體式底盤。

而今天的 AI Day,特斯拉正式兌現(xiàn)了馬斯克承諾的「一家人工智能公司」,發(fā)布了第一款汽車企業(yè)自研的人工智能訓(xùn)練芯片 D1,以及目前性能最強的人工智能計算機柜 DOJO Pod——它會為特斯拉的純視覺 FSD 深度學(xué)習(xí)服務(wù)。

圖片

除此以外,特斯拉還公開了純視覺 FSD 的工作原理、遇到的挑戰(zhàn),以及 Autopilot 軟件團隊的解決方案。

最出乎意料的,是馬斯克帶來了 one more thing——特斯拉研發(fā)的機器人 Tesla Bot!

圖片

我們用盡可能易懂的表達(dá),盡量摘錄了大部分內(nèi)容,但時間關(guān)系,具體的原理今天很難展開討論,請大家見諒。

今天的文章不短,而且很多圖,但我們還是強烈建議您看完全文,因為這場發(fā)布會實在太炸裂。

前言:特斯拉的 AI 原命題

如果你制定了超越一個行業(yè)的計劃,要不你是個瘋子,要不你就會滾起認(rèn)知和實踐的雪球,做到無數(shù)個「第一次」。

特斯拉就是典例。

DOJO 的誕生并不是為了稱霸超算界而稱霸超算界,它更像是普羅米修斯手里的火種,目的是為特斯拉,以及后面的一眾車企/技術(shù)公司,照亮人工智能的前路。

圖片

所以進入正文前,請大家牢記一個問題:當(dāng)前地球量產(chǎn)科技基礎(chǔ)上,如何打造最極致的人工智能?

因為這是 DOJO、FSD、Tesla Bot 的靈魂,也是特斯拉本次 AI Day 的原命題。

一、「用眼睛開車」

很多朋友已經(jīng)對這句話倒背如流,不過今天還是得重復(fù)一次,作為本章節(jié)的綱領(lǐng)——「你會開車,是因為你用眼睛看路,而不是眼睛發(fā)射激光」。

這句話將一個深刻的道理極限地淺顯化,以至于引來了可能是自動駕駛領(lǐng)域最激烈(起碼之一)的爭論。

這個道理是:人類經(jīng)過漫長歲月的進化,已經(jīng)形成了一套從眼睛開始,以大腦為中樞,肢體為具現(xiàn)的「地球 OL 啟動器」。

所以,特斯拉的純視覺方法論,并不像是繞開雷達(dá)信號融合的「捷徑」,反而可能是最形而上學(xué)的蜀道難——因為特斯拉希望造一個輪子上的人。

前不久的 2021 CVPR 計算機視覺會議上,特斯拉 AI 部門高級主管 Andrej Karpathy 已經(jīng)分享了很多 Autopilot 軟件細(xì)節(jié),大家可以點擊這里回看我們的報道,今天我們只聊特斯拉做到了什么。

想要實現(xiàn) Andrej 說過的,讓汽車用眼睛開車,有攝像頭是不夠的,關(guān)鍵是如何分解攝像頭信號,又如何讓汽車思考這些信號。

圖片

但事實上,先不說更深層次的「思考」,光是讓純視覺「認(rèn)清」一樣?xùn)|西,就已經(jīng)需要耗費大量努力。

圖片

和我們開眼看世界不太一樣,攝像頭看到的是像素集合,因此神經(jīng)網(wǎng)絡(luò)要做的,是分析每個像素之間的聯(lián)系,并判斷哪些像素集合成哪些物體。

點線面體,我們現(xiàn)在來到了「體」,也就是由無數(shù)同一時間發(fā)生的、存在的事物組成的真實世界。以駕駛為例子,「障礙物」、「交通燈」、「車道線」等等,都是需要神經(jīng)網(wǎng)絡(luò)認(rèn)清的元素。

圖片

于是我們需要多任務(wù)深度學(xué)習(xí),特斯拉則將自己的多任務(wù)網(wǎng)絡(luò)稱為「HydraNets」。

純視覺 Autopilot 數(shù)據(jù),由 8 個攝像頭,每個攝像頭每秒拍攝的 36 幀畫面組成,所以每一幀的最終效果如下圖所示——每秒一共有 36 組這樣的畫面。

圖片

圖片

挑戰(zhàn)隨即而至:多攝像頭融合的界限很難劃分、圖像內(nèi)的空間也并不是最終映射的實際空間(類似于畸變)。

圖片

圖片

一個明顯的例子是長長的半掛,同時出現(xiàn)在 5 個攝像頭的視野內(nèi):

圖片

除了看清物體,看路也是至關(guān)重要的一環(huán),特別是正確識別道路的邊界。在這張范例里,道路邊緣的特征點被車輛阻擋,這時候就需要從畫面其他部分「尋找線索」。

圖片

事實上,讓車子搞清楚「需要看哪里」,同樣不是容易的事情,特斯拉把算法的簡單結(jié)構(gòu) po 了出來:

圖片

接下來要搞定的,是如何「看得完整」。也就是正確識別某個物體跨越多個攝像頭的全部運動軌跡,比如前面有車經(jīng)過:

圖片

最后是「記得你看過的東西」。

我們在開車的時候,以往的經(jīng)驗會告訴我們,路邊停著的車隊中間可能會竄出一個人、單行道上沒有打雙閃的車,停下來也許短時間也不會走...

以至于速度、方向、標(biāo)識等等紛繁的細(xì)節(jié),它們都組成了我們對路況即時的記憶,然后決定了我們什么時候應(yīng)該做什么。

圖片

二、FSD 老司機成長記

在特斯拉的理解里,自動駕駛的目標(biāo),就是同時最大化安全 safety、舒適 comfort,以及效率 efficiency。是的,同時,缺一不可。

圖片

第一段說「看路」,本質(zhì)上是自動駕駛的感知。而本段討論的則是規(guī)劃,以及控制。事實上特斯拉用了海量篇幅討論「規(guī)劃」,控制相對少很多。

圖片

我們直接看療效:

圖片

圖片

比如上圖,我們經(jīng)過一個十字路口之后,前方還要左轉(zhuǎn)。這時候有多種操作方式:減速提早變線、加速推遲變線,等等。但每個選擇都可能有缺點,依據(jù)的路況也不一樣,這就是 coarse search 粗搜索。

圖片

特斯拉表示僅僅 1.5 毫秒內(nèi),系統(tǒng)就可以做出 2500 個粗搜索。靈光一現(xiàn)也許都不太夠用,這得靈光 2500 現(xiàn)。

圖片

即使是靈光 2500 萬現(xiàn),最終也得往前開。經(jīng)歷眾多備選項之后,系統(tǒng)就可以做出相對合理的抉擇,在兼顧舒適與安全的基礎(chǔ)上,盡量簡單地把彎給轉(zhuǎn)了,這就是 smooth trajectory 平滑軌跡。

自動駕駛的科目二和科目三幾乎是一起上的,而且課程極其繁重——因為路況瞬息萬變。

圖片

這時候依然需要粗搜索大法,以停車場為例,在走過一個彎的路程內(nèi),Autopilot 已經(jīng)進行了接近 40 萬次的粗搜索:

圖片

對于特斯拉來說,規(guī)劃的最終目的,就是為了 Corridor 行駛通道內(nèi)的安全、順滑和速度不斷優(yōu)化。

圖片

三、一切為了數(shù)據(jù),為了數(shù)據(jù)的一切

2021 CVPR 會議上,Andrej 表示特斯拉轉(zhuǎn)向純視覺深度學(xué)習(xí)之后,已經(jīng)積累了超過 60 億個物體標(biāo)簽,超過 1.5PB 的數(shù)據(jù)量——那還只是 6 月底。

圖片

為了應(yīng)對如此龐大的數(shù)據(jù),特斯拉表示他們目前擁有一支 1000 人的數(shù)據(jù)標(biāo)簽隊伍,與工程師一起工作,打造了完全定制化的數(shù)據(jù)標(biāo)簽&分析架構(gòu)。

在傳統(tǒng)的 2D 圖像標(biāo)注基礎(chǔ)上,特斯拉現(xiàn)在可以實現(xiàn) 4D,也就是立體空間+時間戳的四維標(biāo)注,效果如圖:

圖片

另外,銷量屢創(chuàng)新高,路上跑的車越來越多之后,特斯拉如今可以對同一條路做多次數(shù)據(jù)收集:

圖片

加上墻壁、路障,和其他所有物體,再加上周邊行人、車輛的閉環(huán)整合,一輛特斯拉眼中的數(shù)據(jù)世界,是這樣的:

圖片

四、Dojo,地表最強!

終于來到本次發(fā)布會的重中之重了。

圖片

目前特斯拉唯一一款自研芯片,是 FSD Chip。單芯算力 72TOPS,雙芯組成的 Autopilot 硬件 3.0 算力 144TOPS。

圖片

除了裝在 SEXY 家族車型上,特斯拉還在用硬件 3.0 做 AI 評估,超過 3000 塊 HW3.0 主板組成的 3 個數(shù)據(jù)中心,每周可以運行 100 萬次循環(huán)。

圖片

而前不久 Andrej「爆料」的,目前用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的超級計算機,則使用了英偉達(dá) A100 GPU 方案,合計 5760 個 GPU 以及 12PB(1PB=1024TB)的 NVME 高速存儲器。

圖片

但在 Dojo 面前,它倆都像是上一個時代的產(chǎn)物——或者說本來就是。

正式進入 Dojo 參數(shù)之前,我們先來強調(diào)一下:特斯拉對于 AI 訓(xùn)練計算機的核心訴求,并不是算力,而是帶寬和延遲。

圖片

這一點,2019 年的 Pete Bannon 已經(jīng)提到過:「自動駕駛運算需要極高的帶寬,起碼要達(dá)到 1TB 每秒,F(xiàn)SD 芯片(內(nèi)部)可以達(dá)到 2TB 每秒」。

多芯片之間數(shù)據(jù)交換的帶寬(類似于車道數(shù))和延遲(類似于道路限速),是特斯拉在 AI 訓(xùn)練路上狂奔得足夠久之后的深刻總結(jié)。

圖片

Dojo 的設(shè)計原命題,就是帶寬和延遲,這兩個要素,是決定特斯拉能否達(dá)到「最佳 AI 訓(xùn)練性能、更大更復(fù)雜神經(jīng)網(wǎng)絡(luò)、能耗成本優(yōu)化」目標(biāo)的關(guān)鍵。

圖片圖片

再賣個關(guān)子,來看看英偉達(dá)的 A100 多芯片方案,多個芯片位于不同的 PCB 基板,用橋接器連接。這已經(jīng)是目前最快的橋接器,速度達(dá)到了 600GB 每秒。

但對于特斯拉來說,這還遠(yuǎn)遠(yuǎn)不夠。

圖片

多芯片之間最理想的數(shù)據(jù)交換方式,就是「放在一起」,也就是位于同一塊基板上,左鄰右里排布。

而特斯拉更進一步,不是將芯片們「放」在一起,而是「封裝」在一起。

封裝多個芯片有很多種方法,比如這顆英特爾處理器一樣,兩塊芯片放在一個基板上:

而特斯拉又進了一步,使用了臺積電首次量產(chǎn)的 InFO-SoW 扇上晶圓直出封裝技術(shù),也就是直接從晶圓上刻出一個個芯片,然后整塊晶圓摁在基板上。

圖片

全部裝起來之后,一個 Dojo 計算模組長這樣:

圖片

如果只刻一塊芯片,那它叫 D1 Chip,長這樣,基于臺積電 7 納米工藝打造,核心面積 645 平方毫米,內(nèi)置了 500 億個晶體管,內(nèi)部線束長度高達(dá) 11+ 英里(約 18 公里):

圖片

內(nèi)部線束如此驚人,是因為 D1 芯片內(nèi)和芯片間的通信帶寬簡直駭人聽聞。這同時得益于臺積電的封裝技術(shù)(芯片之間的距離極短),以及特斯拉的芯片設(shè)計。

一塊 D1 芯片由 354 個訓(xùn)練節(jié)點組成,每個訓(xùn)練節(jié)點內(nèi)部都起碼有以下部分:

64 位 4 路集相的多線程 CPU;

1.25MB SRAM 緩存;

低延遲數(shù)據(jù)交換結(jié)構(gòu);

SIMD 單指令多數(shù)據(jù)流的浮點/整數(shù)單元

D1 訓(xùn)練節(jié)點的一大特點,就在于這個「低延遲數(shù)據(jù)交換結(jié)構(gòu)」。

圖片

上圖右上角有一個叫做「 NOC Router」的結(jié)構(gòu),這是訓(xùn)練節(jié)點之間交換數(shù)據(jù)的工具——特斯拉喪心病狂地給每一個小節(jié)點,都設(shè)計了上下左右各 64bit 的通道。

這是什么意思?我們還是直接看療效:D1 的芯片內(nèi)部帶寬高達(dá)10TB每秒,芯片外帶寬也高達(dá) 4TB每秒!

圖片

算力方面,每一個訓(xùn)練節(jié)點都擁有 1024GFLOPS的 BF16/CF8 精度計算能力(這兩個是較新的精度標(biāo)準(zhǔn)),或者 32GFLOPS的 FP32 精度計算能力。

354 個訓(xùn)練節(jié)點構(gòu)成的 D1 芯片,則可以實現(xiàn)高達(dá) 362TFLOPS 的 BF16/CF8 精度算力(FP32 精度 22.6T)——而 25 個 D1 芯片組成的 Dojo 計算模塊,則將這塊人手輕松舉起來的「電腦」算力,推到了驚人的:

9PFLOPS!

圖片

這是什么概念?

最終成品的單個 DOJO 計算機柜,叫做 DOJO Pod,總算力超過 1.1EFLOPS(BF16 精度),內(nèi)含 3000 個 D1 芯片,也就是只需要 120 片上圖這樣小巧的模組——就達(dá)到了超越全球超算排行榜第 5 名的 FP32 精度算力。

圖片

而目前的第 5 名,隸屬于美國國家能源研究科學(xué)計算中心(NERSC)的 Perlmutter,一共有 40 個機柜。

當(dāng)然,馬斯克說過的可是「1 exa flops at de facto FP32(貨真價實的 1E FP32 精度算力)」。目前一個 Dojo Pod 可實現(xiàn)不了——但這次跳票也許真不怪馬斯克,臺積電目前有多緊俏,相信大家都有所耳聞。

哦對了,下一代 Dojo 和相關(guān)軟件工具已經(jīng)在研發(fā)了,目標(biāo)又是 10 倍級別的系統(tǒng)級性能提升。

圖片

五、One More Thing

年滿 50 歲的馬斯克,終于知道人前起舞是有點幼稚的事情,于是今天他請來了一位衣著前衛(wèi)的舞者,替他發(fā)泄情緒:

圖片

不好意思歪樓了,這是今天的 One More Thing,也是全場發(fā)布會最大的驚喜——特斯拉機器人  Tesla Bot。不是跳舞這位,而是它:

圖片

馬斯克對 Tesla Bot 的定義是「由人類世界制造,為人類世界制造」、「友好」、「無威脅,從事重復(fù)性/無聊的工作」。

Tesla Bot 的身高是 5'8"(約一米八),體重 56.7 公斤,可以硬拉 150 磅(68 公斤),或者搬運 45 磅(20.4 公斤)的物體,伸開手的狀態(tài)下可以拿 10 磅(4.5公斤)的物體,最高時速 8 公里。

這個數(shù)據(jù)就是一個竹竿型人類的標(biāo)配,但作為即將發(fā)售的機器人,這也許更應(yīng)該是一串歷史素材。

圖片

Tesla Bot 全身具有 40 個電動促動器,臉上是顯示屏,全身由輕量化材料打造,手掌質(zhì)感接近真人。

哦對了,Tesla Bot 的腳板有傳感器,別亂踩人家。

圖片

至于「大腦」,Tesla Bot 將由 Autopilot 硬件驅(qū)動(什么叫垂直整合?。秆劬Α挂矔?Autopilot 攝像頭,深度學(xué)習(xí)、DOJO 訓(xùn)練什么的一應(yīng)俱全。

馬斯克說明年 Tesla Bot 的原型就將公布,「大家看我們只是在造車,但其實我們也是全球最大的機器人公司——因為特斯拉的車就像是輪子上的機器人,所以我們就造了真正的機器人?!?/span>

六、軟硬合一,進度 50%?

寫到最后一段,我的亢奮更甚了。

前天我在文章里提了一嘴:

「軟硬結(jié)合,是科技公司心目中的殿堂、王座、圣杯。但能實現(xiàn)這一點,而且軟硬皆優(yōu)的科技企業(yè),只有蘋果算一個,AI Day 之后的特斯拉算半個——FSD 全球推送之后能補上另一半?!?/span>

今天的 AI Day 實在是太過于驚艷,以至于我真的很希望寫下「軟硬合一」四個字,竭盡全力吹一把特斯拉。

但再想一下,我覺得現(xiàn)在下這個定論,似乎不太準(zhǔn)確。

特斯拉還沒有最終實現(xiàn)人工智能的軟硬合一,無論是汽車的自動駕駛,還是機器人。FSD 還在 Beta、DOJO 也是上周才正常上機運行、Tesla Bot 更是明年才有「原型」。

但光從硬件的角度看,今天的特斯拉,將人工智能的想象力拓寬了整整一大步,或者說狠狠拉了一把進度條。

如果說前兩次年度發(fā)布會,特斯拉車企的味道還很濃,那么今天的特斯拉,已經(jīng)開始若有若無地,有一種游戲《賽博朋克 2077》里荒坂集團的味道了——不是說他大反派,而是類似的創(chuàng)造力,以及每個細(xì)分領(lǐng)域的統(tǒng)治力。

真想快進到萬物 AI 的終局。

(完)

來源:第一電動網(wǎng)

作者:電動星球News蟹老板

本文地址:http://www.medic-health.cn/kol/154195

返回第一電動網(wǎng)首頁 >

收藏
32
  • 分享到:
發(fā)表評論
新聞推薦
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
-->