關(guān)注并標星電動星球News
每天打卡閱讀
更深刻理解汽車產(chǎn)業(yè)變革
————————
出品:電動星球 News
作者:毓肥
今天下午,長城汽車旗下自動駕駛公司毫末智行,舉辦了他們第 6 屆 AI Day——也是今年毫末智行信息量最大、定調(diào)最激進的一次發(fā)布會。
有多激進?毫末 CEO 顧維灝直接在發(fā)布會上說「目前已經(jīng)是中國量產(chǎn)自動駕駛公司的第一名」;董事長張凱說「穩(wěn)穩(wěn)占據(jù)中國量產(chǎn)自動駕駛第一名」。
我們可以對比一下,4 個月前的第五屆 AI Day,毫末的表態(tài)還是「夯實中國量產(chǎn)輔助駕駛第一名」,4 個月后,毫末的語氣起碼往上邁了一個大臺階。
從 2019 年 11 月 29 日毫末智行成立算起,今天也才 1020 天,不到三年。
作為長城系車型的智能駕駛支柱,同時涉獵商用物流的自動駕駛公司,今天一眾高管的表態(tài),是否也在強調(diào),毫末以不到三年的時間,已經(jīng)幫助長城成為自動駕駛的頭牌玩家?
帶著好奇和疑惑,我們來看看毫末第六次 AI Day,報告了哪些自動駕駛的技術(shù)進展,其自動駕駛的量產(chǎn)走到了哪一步,又是怎么理解自動駕駛未來的。
一、MANA 數(shù)據(jù)閉環(huán)
顧維灝認為,自動駕駛最近十年來的技術(shù)發(fā)展,可以分為三個階段:
1.0 時代:100 萬公里規(guī)模,硬件驅(qū)動;
2.0 時代:百萬-億公里規(guī)模,軟件驅(qū)動;
3.0 時代:1 億公里以上規(guī)模,數(shù)據(jù)驅(qū)動。
而毫末智行的目標,則是「沖刺進入自動駕駛3.0時代」。而想要徹底達成這一目標,顧維灝認為所需的數(shù)據(jù)量、算力、模型優(yōu)化等等,都將比 2.0 時代高出幾個數(shù)量級。
也是在今天的發(fā)布會上,張凱宣布毫末智行人工智能數(shù)據(jù)體系 MANA,已經(jīng)基本完成了數(shù)據(jù)閉環(huán)。MANA,似乎也成為了毫末智行喊出「中國第一」的底氣。
那么,MANA 到底做到了什么?和前面幾次亮相相比,它又有什么進化?
1. 更大的模型
Transformer,這是目前深度學習發(fā)展最強勢的神經(jīng)網(wǎng)絡(luò)。而基于 Attention 自注意力機制的 Transformer,又成為了深度學習,以及如今自動駕駛的核心名詞。
什么是 Attention 機制?它的本質(zhì)是模擬人類的注意力(attention),因為我們通過聚焦物體的主要特征,從而高效識別出這是什么,我該怎么做。
換句話說,簡潔、焦點,就是 Attention 機制的核心。
Attention 機制可以無限堆疊基本單元,如今最大的 Attention 模型參數(shù)已經(jīng)達到了萬億級,訓練效果非常驚人——同時對算力的要求也非常驚人,起碼達到了傳統(tǒng) CNN 網(wǎng)絡(luò)的 100 倍。
顧維灝也表示,Attention 機制 Transformer 的應用實踐,意味著自動駕駛數(shù)據(jù)規(guī)模要足夠大,而且需要更充分地多樣性——「起碼要 1 億公里」。
毫末智行和業(yè)界主流一樣沿用了 Attention 機制,而其 MANA 閉環(huán)的獨特優(yōu)化,關(guān)鍵則在于數(shù)據(jù)規(guī)模擴大的前提下,不斷提高訓練效率。
2. 4 萬年與 1700 萬公里
4 萬年,是目前 MANA 數(shù)據(jù)體系的仿真系統(tǒng)內(nèi),已經(jīng)積累的「虛擬駕齡」,模型累計訓練時長則超過了 31 萬小時。另外毫末目前累積的真實道路數(shù)據(jù),已經(jīng)超過 1700 萬公里。
不斷滾雪球的訓練數(shù)據(jù)和模型,需要持續(xù)優(yōu)化的訓練效率。其中一個方法,是通過 backbone 統(tǒng)一,直接利用大量無標注數(shù)據(jù)。
聽起來很復雜,其實深度學習里面的 backbone 顧名思義,指的是神經(jīng)網(wǎng)絡(luò)的「脊梁骨」,學名主干網(wǎng)絡(luò),作用類似于提取「最大公約數(shù)」,也就是找到不同數(shù)據(jù)之間的基本共同特征。
毫末智行的做法,則是將所有感知任務(wù)的 backbone 統(tǒng)一,然后利用無標注數(shù)據(jù)先訓練好某個 backbone 并鎖定,模型剩余部分再用已標注樣本來訓練。
顧維灝表示,這樣操作可使訓練效率提升 3 倍以上,同時精度有顯著提升。
統(tǒng)一 backbone 應對的是更大的模型,另一個挑戰(zhàn)是更多的數(shù)據(jù)。怎么理解?比如積累到第 10 億公里的時候,前面 100 萬公里可能會被「遺忘」,大概相當于被后面的數(shù)據(jù)「沖掉」了某些特征。
顧維灝指出,最簡單的方法是用所有數(shù)據(jù)再「提純」一次,但這樣「太貴太慢」。
毫末的方法是類似于「面多加水,水多加面」:抽取已有的數(shù)據(jù),與新數(shù)據(jù)在同一個模型下輸出。最終號稱在同樣精度下可以節(jié)省 80% 以上的算力,收斂時間也可以提升 6 倍以上。
3. 感知全世界
4 月份,我們在北京體驗了毫末智行城市 NOH 的長城摩卡試驗車。當時毫末對這套城市領(lǐng)航方案的定義是「重感知、輕地圖」,也就是高精地圖的「濃度」相對更低。
為什么毫末將天平傾向感知?顧維灝的解釋是「高精地圖的置信度有問題」。
他表示,城市道路環(huán)境的變化頻率遠高于高速場景——比如修路?!溉绻训貓D看作傳感器的話,它的置信度是有些問題的,不知道什么時候、什么地方,它就會失效。」
這樣的邏輯下,毫末決定用 Transformer 建立強感知的時空理解能力。比如用綜合長時間多幀信息來消除抖動、用時序的 transformer 模型在 BEV 空間上做虛擬實時建圖等等。
我們直接來看療效吧,顧維灝表示,目前毫末已經(jīng)可以解決部分道路模糊、復雜路口、環(huán)島等問題,而且在感知過程中只需要普通地圖信息,「就像我們自己開車一樣」。
有關(guān)「重感知」路線,一周前我們在詢問毫末智行技術(shù)副總裁艾銳的時候,得到了這樣的回答:
「在純技術(shù)研發(fā)的角度,高精地圖是好事,可以降低難度。但毫末作為競爭者的角度,一定要有特色路線。另外國內(nèi)存在各種限制,高精地圖不會開放得特別快?!?/span>
另外,在重感知賽道上,艾銳表示沒有必要放棄激光雷達。
首先,他認為 2022 這個時間點,視覺并沒有「碾壓」激光雷達。而且激光雷達廠商也不會坐以待斃,CMOS 化、降成本等等都在做。「如果價格合適,多配一個激光雷達有什么關(guān)系呢?」
當然,純視覺感知走得最堅定的特斯拉,艾銳表示依然「比我所知道的都領(lǐng)先一大截,屬于獨一檔的,其他人都差不太多」。
回到今天發(fā)布會,毫末提到的另一個關(guān)于感知的進步,在于利用人類世界進行交互。
說得簡單點就是識別真實世界中的通用交通行為,比如車燈。目前毫末正在升級感知系統(tǒng),目的是識別剎車燈、轉(zhuǎn)向燈等信息。
艾銳當時則展開了更多:比如很多車外后視鏡都有的黃色警報燈,也在考慮做進感知里面,「讓系統(tǒng)知道對方司機已經(jīng)發(fā)現(xiàn)你了,可以有更多的博弈邏輯」。
4. 超算中心
去年 12 月 23 日,毫末 MANA 數(shù)據(jù)體系正式亮相。當時 MANA 號稱是「中國第一個自動駕駛數(shù)據(jù)智能體系」,毫末同時還宣布了自研超算中心的計劃。
今天下午,毫末的超算中心披露了更多信息。
首先是建設(shè)目標:滿足千億參數(shù)的大模型、數(shù)據(jù)規(guī)模百萬 clips(片段),同時整體訓練成本可以降低 200 倍。
降低成本,指的其實不是單純「少花錢」,更關(guān)鍵的是「少花時間」——目前同樣一個千億參數(shù)的模型,顧維灝表示需要「上千卡 GPU 訓練幾個月時間?!?/span>
提到訓練,最近中美訓練芯片禁運事件不得不提。艾銳的回應是「訓練其實不一定全得用英偉達方案」。
5. 城市 NOH 的五大功能
最終,MANA 數(shù)據(jù)體系會在產(chǎn)品上,以高級智能駕駛的形態(tài)出現(xiàn)。今天的發(fā)布會上,毫末公布了城市 NOH 的 5 個主要領(lǐng)航功能:
智能識別交通燈:可以識別包括紅綠燈、黃閃燈、左右轉(zhuǎn)箭頭燈等,但與我們體驗的版本不一樣,量產(chǎn)版紅轉(zhuǎn)綠燈時需要輕點油門,官方表示這是出于「用戶磨合」考慮。
智能左右轉(zhuǎn):根據(jù)人類駕駛經(jīng)驗設(shè)定左右轉(zhuǎn)向,轉(zhuǎn)向過程中遇到行人和非機動車時會主動避讓,遇到機動車才會觸發(fā)博弈。
智能變道:這是城市領(lǐng)航最主要的功能之一。毫末NOH的變道邏輯包括:保障行駛在正確的車道、為了通行效率主動變道、變道時判斷后方交通參與者運動情況、會主動用加減速創(chuàng)造變道空間。
智能躲避障礙物(動/靜態(tài)):靜態(tài)的典例是錐桶,躲避的邏輯是「能繞就繞,不能繞就減速」;動態(tài)的典例則是前車壓線行駛,此時首選是減速,然后再判斷是否可以繞行。
以上 5 個(動/靜態(tài)分成了兩個)功能都會在即將發(fā)布的正式版城市 NOH 上線。而隨后毫末將 OTA 的新功能,是「智慧交通流處理」,基礎(chǔ)是加入了識別轉(zhuǎn)向/剎車燈,然后去做相應的決策適配。
最后,顧維灝表示目前毫末的北京、保定、上海、深圳研發(fā)中心都在持續(xù)招聘。
二、1000 天之后,挑戰(zhàn)第一?
前面一段很技術(shù)向,可以概括為「毫末在做什么」。
除了技術(shù)細節(jié),這屆 AI Day 還是毫末「喊話」最大聲的一次,態(tài)度鮮明、表述高調(diào)。用毫末智行董事長張凱的原話概括,這次發(fā)布會,毫末在講「中國自動駕駛的新故事、新標桿」。
一家成軍不到三年的公司,說話這么狠?
我們總結(jié)了張凱今天的幾個關(guān)鍵表態(tài),以及更多核心數(shù)據(jù)。這里面有很多個「國內(nèi)第一」,有些甚至號稱是「業(yè)內(nèi)第一」。
1.「國內(nèi)智能駕駛技術(shù)落地經(jīng)驗最豐富的公司」
張凱表示,毫末智行用 2 年時間開發(fā)了三代智能駕駛系統(tǒng),落地了 10 余款不同平臺的車型。目前可以做到全新車型復用開發(fā) 4 個月達到量產(chǎn)狀態(tài)、全新車型匹配標定 2 個月內(nèi)完成,號稱標定效率「全行業(yè)第一」。
另外,毫末目前可以同時異步并行開發(fā)超過 30 個智能駕駛項目(約等于 30 臺車),同樣號稱「國內(nèi)唯一」的開發(fā)能力。
2.「國內(nèi)最早且唯一的進入產(chǎn)品快速迭代階段的自動駕駛公司」
除了我們體驗過的,首發(fā) HPilot 3.0 的摩卡激光雷達版,今年搭載毫末智行智能駕駛的上市車型,還包括歐拉閃電/芭蕾/好貓、長城炮等等。
量產(chǎn)乘用車以外,今年毫末還發(fā)布了第二代自動駕駛末端物流車「小摩駝 2.0」,這款十萬級的物流小車已經(jīng)開始交付。
3.「中國首個大規(guī)模量產(chǎn)的城市 NOH 輔助駕駛系統(tǒng)」
上面這句話定語很長,但早在 4 月份的時候,我們得到的準確表態(tài),是「毫末智行城市領(lǐng)航的落地速度,會比更依賴高精地圖的華為、小鵬等企業(yè)更快」。
今天發(fā)布會上,張凱表示今年 HPilot 3.0 可以落地 10 個城市,明年計劃是落地超過 100 個城市。最先落地的城市,會是北京/保定。
三、毫末會是長城的「長城」嗎?
我們一直在觀察毫末智行。
原因其實有好幾個:毫末展示出來的體系化思考、長城「全村的希望」、民企做技術(shù)的「豁出去」,等等。
到了 2022 年 9 月,我們看到毫末用3年不到的時間,追上了華為、小鵬等等城市領(lǐng)航的先發(fā)者,已經(jīng)要同臺競技了。
速度可嘉,但最后依然要看療效。最快下個月,我們就能看到來自長城體系的量產(chǎn)版城市領(lǐng)航了,毫末今天立的 flag、喊的口號,今年真的會兌現(xiàn)嗎?
你們怎么看?評論區(qū)見。
(完)
來源:第一電動網(wǎng)
作者:電動星球News蟹老板
本文地址:http://www.medic-health.cn/kol/184792
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。
相關(guān)話題