国产成人av一区二区三区在线,国产欧美性成人精品午夜,а√最新版在线天堂,欧洲成人一区二区三区,亚洲国产精品成人久久蜜臀

  1. 首頁(yè)
  2. 資訊
  3. 企業(yè)
  4. 特斯拉 Autopilot 如何單挑全世界?

特斯拉 Autopilot 如何單挑全世界?

公路新勢(shì)力

特斯拉是一家很開(kāi)放的車企。

所謂開(kāi)放,指的是馬斯克年初那一句「特斯拉愿意開(kāi)放并共享自己的所有專利」,還有在 GitHub 上公開(kāi)了自家車機(jī)操作系統(tǒng)的底層代碼,以及在全球最大的軟件 BUG 討論社區(qū) Bugcrowd 里面發(fā)下英雄帖,廣邀全球黑客黑自家系統(tǒng)。

近日,特斯拉再一次將自家 Autopilot 的秘密向世界公開(kāi)。特斯拉 AI 部門高級(jí)主管 Andrej Karpathy 近日出席了一個(gè)有關(guān)深度學(xué)習(xí)的會(huì)議—— PyTorch Developer Conference 2019,并且進(jìn)行了一段時(shí)長(zhǎng) 11 分鐘的演講,主題就是 Autopilot 如何在計(jì)算機(jī)視覺(jué)深度學(xué)習(xí)中應(yīng)用 PyTorch。

眾所周知,特斯拉堅(jiān)決不支持汽車界普遍力撐的激光雷達(dá)方案,而是堅(jiān)持走純視覺(jué)識(shí)別路線,Andrej Karpathy 這次演講,等于用一種硬核的方式,再一次向世界宣戰(zhàn)。

我們將這次演講的精華部分摘錄下來(lái),并以盡量簡(jiǎn)練的語(yǔ)言解釋,于是就有了今天的文章。

什么是 PyTorch?

要討論 Andrej Karpathy 在這個(gè)視頻里面說(shuō)了什么,我們先來(lái)搞清楚一個(gè)概念—— PyTorch。

PyTorch 的「祖先」叫做 Torch(意思為火炬),Torch 是一個(gè)基于 BSD License 的開(kāi)源機(jī)器學(xué)習(xí)框架,最早的 Torch 版本于 2002 年發(fā)布,主要應(yīng)用于圖像和視頻類的深度學(xué)習(xí),目前谷歌、Facebook、Twitter 都應(yīng)用了 Torch 的分支版本。

電動(dòng)星球注:BSD License 最早在 1988 年由加州大學(xué)伯克利分校起草,是目前給予使用者最高自由的開(kāi)源協(xié)議,使用者基本上可以「為所欲為」地修改源代碼,并且將代碼打包成專有軟件。

至于 PyTorch,則是 Torch 使用 Python 語(yǔ)言編寫的版本。

Torch 的底層是由 C 語(yǔ)言和 Lua 語(yǔ)言編寫的,C 語(yǔ)言作為底層,而 Lua 語(yǔ)言作為深度學(xué)習(xí)庫(kù),兩種語(yǔ)言都非常優(yōu)秀,實(shí)際上目前仍然有很多大型企業(yè)采用 Torch 進(jìn)行深度學(xué)習(xí),比如上文提到的幾家。

2017 年 1 月, PyTorch 正式在 GitHub 上發(fā)布,號(hào)稱擁有更高的編譯和運(yùn)行效率,而實(shí)際上它也做到了——靠的就是 Python 語(yǔ)言。

一句話總結(jié)一下 1989 年出生的 Python:常被戲稱為「膠水語(yǔ)言」,因?yàn)?Python 能夠基于其他語(yǔ)言的各種模塊結(jié)合到一起。根據(jù)權(quán)威數(shù)據(jù)挖掘網(wǎng)站 KDnuggets 的調(diào)查,Python 已經(jīng)成為最受 AI 從業(yè)者歡迎的語(yǔ)言。

基于 Python 語(yǔ)言的 PyTorch 框架,也同樣獲得了眾多企業(yè)和研究者的青睞。單說(shuō)自動(dòng)駕駛方面,除了特斯拉,Uber 也和斯坦福大學(xué)基于 PyTorch 研發(fā)出開(kāi)源概率編程語(yǔ)言 Pyro。除此以外,F(xiàn)acebook、英偉達(dá)、美國(guó)艾倫人工智能研究所也都走在了 PyTorch 應(yīng)用的前頭。

特斯拉如何利用 PyTorch?

Andrej Karpathy 在演講的開(kāi)場(chǎng)這樣說(shuō):「由于我們沒(méi)有采用激光雷達(dá),也沒(méi)有采用高精度地圖,所以 Autopilot 的一切功能,都依賴于來(lái)自車身四周 8 個(gè)攝像頭提供原始圖像之后,再進(jìn)行的計(jì)算機(jī)視覺(jué)運(yùn)算。」

他隨后給出了一張流程圖,里面是 Autopilot 工作的所有流程,有趣的是,Andrej Karpathy 將這一套流程稱為「Operation Vacation(操作假期)」,他說(shuō)「因?yàn)楝F(xiàn)階段我的團(tuán)隊(duì)已經(jīng)可以在椅子上葛優(yōu)癱,然后數(shù)據(jù)就會(huì)從特斯拉的車子上傳過(guò)來(lái),在神經(jīng)網(wǎng)絡(luò)模型上自己不斷循環(huán)運(yùn)行」:

特斯拉 AI 部門令人艷羨的「假期」里面,「PyTorch Distributed Training」占了單獨(dú)的一個(gè)部分——但憑什么呢?

先上結(jié)論:特斯拉利用 PyTorch 框架效率更高的特點(diǎn),不斷將 Autopilot 軟件的并行學(xué)習(xí)性能進(jìn)一步提升。

以上圖為例,在以上的典型場(chǎng)景內(nèi),Autopilot 需要同時(shí)處理 10 個(gè)不同類別的任務(wù)——而道路場(chǎng)景是極其復(fù)雜的,也就是說(shuō),Autopilot 時(shí)刻面臨著數(shù)十個(gè)任務(wù)并行處理的挑戰(zhàn)。Andrej Karpathy 的原話是「almost 100 tasks(幾乎同時(shí)處理 100 個(gè)任務(wù))」。

為了有效處理將近 100 個(gè)并行任務(wù),特斯拉采用了「類 ResNet-50」的骨干網(wǎng)絡(luò)。那什么是 ResNet-50?

隨著深度學(xué)習(xí)研究的不斷發(fā)展,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)也在不斷加深,而隨著網(wǎng)絡(luò)深度的上升,訓(xùn)練準(zhǔn)確度也會(huì)隨之下降,ResNet 就是因此而生,它的中文名叫做深度殘差網(wǎng)絡(luò)。ResNet 有多個(gè)不同版本,包括 ResNet30/50/101 等,主要區(qū)分度在于 Layer 卷積層和 Block 區(qū)塊數(shù)量上,這里就不展開(kāi)了(畢竟是個(gè)汽車公眾號(hào) …)。

然而,即使采用了更高效的網(wǎng)絡(luò),Andrej Karpathy 依然表示「我們無(wú)法讓每一個(gè)任務(wù)都享有單獨(dú)的神經(jīng)網(wǎng)絡(luò)運(yùn)算,因?yàn)橥瑫r(shí)處理的任務(wù)數(shù)實(shí)在太多,我們只能把一些運(yùn)算分?jǐn)偟焦蚕砉歉删W(wǎng)絡(luò)上」。

Andrej Karpathy 將分?jǐn)偟焦蚕砉歉删W(wǎng)絡(luò)上的任務(wù)稱作「Hydra Nets(Hydra 意為九頭蛇)」,中二之余又不失準(zhǔn)確。比如說(shuō)下圖高速公路上行駛時(shí)的物體識(shí)別:

還有 Smart Summon 模式下道路邊緣的識(shí)別與確定:

Andrej Karpathy 將這種類型的計(jì)算稱為「在圖像中進(jìn)行預(yù)測(cè),以空間和時(shí)間為維度將這些圖像有選擇性地部分刪除,同時(shí)通過(guò)圖像拼接和變換,以此讓車輛明白現(xiàn)在所處的位置」:

另一個(gè)依賴 PyTorch 提升運(yùn)行效率的,叫做 Recurrent Tasks。

Recurrent Tasks 是來(lái)自于 RNN 的運(yùn)算任務(wù),中文名有兩個(gè),有的翻譯成循環(huán)神經(jīng)網(wǎng)絡(luò),更主流的譯法是遞歸神經(jīng)網(wǎng)絡(luò),因?yàn)?RNN 有兩個(gè)算法變體——一種是時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network),另一種是結(jié)構(gòu)遞歸神經(jīng)網(wǎng)絡(luò)(recursive neural network),兩者的縮寫都是 RNN。

RNN 聽(tīng)起來(lái)雖然很陽(yáng)春白雪,但它已經(jīng)在實(shí)際應(yīng)用中為我們默默服務(wù)了很久——機(jī)器翻譯、語(yǔ)音識(shí)別、生物研究中的 DNA 序列分析,都應(yīng)用了 RNN 運(yùn)算。而在自動(dòng)駕駛中,RNN 通常被應(yīng)用在前方道路預(yù)測(cè)中。

Andrej Karpathy 舉了以上的場(chǎng)景做例子,解釋 Recurrent Tasks 提升效率之后,對(duì) Road Layout Prediction(道路層預(yù)測(cè))的重要性:

「我們給每臺(tái)攝像頭都配備了相應(yīng)的 Hydra Nets,但很多時(shí)候你需要同時(shí)采集多個(gè)攝像頭的數(shù)據(jù),然后再進(jìn)行運(yùn)算。比如說(shuō)在過(guò)一個(gè)三岔路口的時(shí)候,我們有三個(gè)攝像頭同時(shí)為這個(gè)場(chǎng)景的深度學(xué)習(xí)運(yùn)算輸入圖像數(shù)據(jù)。此時(shí)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)就不再只是單純的圖像識(shí)別,而是基于總 - 分結(jié)構(gòu)的復(fù)合運(yùn)算?!?/p>

談到這個(gè)場(chǎng)景的時(shí)候,Andrej Karpathy 順便以此為例子,對(duì) Hydra Nets 給出了進(jìn)一步的解釋:

「我們?yōu)樗械挠?jì)算任務(wù)準(zhǔn)備了 8 個(gè) HydraNets,當(dāng)然所有 Hydra Nets 的運(yùn)算任務(wù)都可以進(jìn)一步進(jìn)入 RNN 做遞歸運(yùn)算。然后我們可以按照這樣的總 - 分結(jié)構(gòu)做輸出。也就是說(shuō),Autopilot 軟件里面有一個(gè)大型的單一計(jì)算網(wǎng)絡(luò),然后每一個(gè)任務(wù)都可以分采樣這個(gè)計(jì)算網(wǎng)絡(luò)(接收到的圖像)的一小部分,然后訓(xùn)練那一小部分的神經(jīng)網(wǎng)絡(luò)?!?/p>

「比如說(shuō),我們可以單獨(dú)訓(xùn)練攝像頭的障礙物探測(cè)功能,或者是色彩深度網(wǎng)絡(luò),又或者是道路布局網(wǎng)絡(luò)。所有單一任務(wù)都分采樣了圖像數(shù)據(jù)的一小部分,然后單獨(dú)訓(xùn)練那一部分(的神經(jīng)網(wǎng)絡(luò))」。

接下來(lái),Andrej Karpathy 用了一張圖展示了 Autopilot 軟件需要處理的圖像數(shù)據(jù)量:

乍眼一看,這張圖里面只有兩個(gè)數(shù)字是可以望文生義的:代表原因的 8 個(gè)攝像頭和代表結(jié)果的 4096 幅圖像。而其中的過(guò)程則相當(dāng)復(fù)雜。

Time steps 和 Batch size 需要一起講,沒(méi)有寫中文是因?yàn)楝F(xiàn)在的深度學(xué)習(xí)界依然沒(méi)有給它們一個(gè)比較信達(dá)雅的官方翻譯。其中 Batch size 代表了在深度學(xué)習(xí)網(wǎng)絡(luò)中單一批次的數(shù)據(jù)數(shù)量,比如我們往一個(gè) RNN 里面輸入 100 條數(shù)據(jù),分成 10 個(gè) Batch,那 Batch size 就是 10。

至于 Time steps 則是預(yù)測(cè)最終值需要的最大「步數(shù)」,比如說(shuō) Autopilot 軟件的 Time steps 是 16,也就是說(shuō)每次會(huì)生成 x0-x15,一共 16 組數(shù)據(jù),最終預(yù)測(cè)結(jié)果——每次,指的就是圖中每一個(gè)「Forward pass」。

目前深度學(xué)習(xí)最熱門的硬件是 GPU,Andrej Karpathy 則用了一張圖來(lái)描述 Autopilot 神經(jīng)網(wǎng)絡(luò)對(duì)于 GPU 運(yùn)算的要求有多高:

在圖中顯示的 70000 GPU Hours,表示 Autopilot 深度計(jì)算網(wǎng)絡(luò)如果用單一 GPU 運(yùn)算需要用到 7 萬(wàn)小時(shí)—— Andrej Karpathy 的原話是「如果你用一組 8 個(gè) GPU 去訓(xùn)練 Autopilot 的深度運(yùn)算網(wǎng)絡(luò),你得花一年」——當(dāng)然他沒(méi)說(shuō)用作對(duì)比的是什么 GPU。

最后,Andrej Karpathy 例牌吹了一波自家的 FSD 芯片,特斯拉的 11 分鐘炫技至此全部結(jié)束——但這一次的 PPT 和 4 月份發(fā)布時(shí)有所不同,硬件 3.0 的工作功耗不再用 250W/ 英里這樣的單位定義,而是換算過(guò)來(lái)更低的「Sub 100W(低于 100W)」——至于是不是特斯拉式神優(yōu)化,我們只能等 FSD 芯片大規(guī)模裝機(jī)之后才能知道了。

結(jié)語(yǔ)

今天 Andrej Karpathy 的演講,雖然不太準(zhǔn)確,但我們可以嘗試用一句話概括——特斯拉很希望把你的車變成一個(gè)人。

今年 4 月份 FSD 芯片發(fā)布的時(shí)候,Andrej Karpathy 說(shuō)過(guò)一句話,宣布了特斯拉與激光雷達(dá)徹底絕緣:「你會(huì)開(kāi)車是因?yàn)槟愕难劬吹搅寺窙r,而不是你的眼睛發(fā)射出激光」。今天,Andrej Karpathy 也說(shuō)了「我們不用高精度地圖」。

于是,一輛逐步走向自動(dòng)駕駛的特斯拉,在行為模式上會(huì)變得越來(lái)越像人——用眼睛收集圖像數(shù)據(jù),然后用大腦判斷自身所處環(huán)境,指揮四肢做出行動(dòng)。

特斯拉的邏輯似乎更接近人類本能,但卻是汽車界實(shí)打?qū)嵉纳贁?shù)派。傳統(tǒng)汽車界,包括造車新勢(shì)力,都對(duì)激光雷達(dá)和高精度地圖抱有更高的信心。

來(lái)源:公路新勢(shì)力

本文地址:http://www.medic-health.cn/news/qiye/103278

返回第一電動(dòng)網(wǎng)首頁(yè) >

收藏
65
  • 分享到:
發(fā)表評(píng)論
新聞推薦
熱文榜
日排行
周排行
第一電動(dòng)網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價(jià)信息
已經(jīng)成功提交我們稍后會(huì)聯(lián)系您進(jìn)行報(bào)價(jià)!

第一電動(dòng)網(wǎng)
Hello world!
-->