元戎首曝VLA四大功能，「理小元」下一代智駕模型為什么都選了它？

第一電動大牛作者 HiEV 2025-06-16 18:14

盡管在2025年上半年輔助駕駛行業(yè)經(jīng)歷了一番風(fēng)波，但到了下半年，在技術(shù)上頭部公司的輔助駕駛系統(tǒng)明顯地要開始邁入下一階段。

理想、小鵬、元戎這些玩家們都霍霍欲試，以VLA為代表基于新一代模型的輔助駕駛系統(tǒng)呼之欲出。

理想已經(jīng)在一季度的財報會上預(yù)告：7月理想將發(fā)布純電SUV i8，并同步推出基于VLA模型的輔助駕駛系統(tǒng)。i8將是理想繼MEGA之后在純電上的關(guān)鍵一戰(zhàn)，理想的前期宣傳將不少的賣點都寄托在了新的輔助駕駛上。

小鵬也在6月11日剛剛揭幕了全新的G7，G7首發(fā)了自研的圖靈芯片，并且一次就搭載3顆，擁有超過2200 Tops的算力?；谶@個級別的算力，小鵬正在云端訓(xùn)練超大規(guī)模的VLA模型，稱之為VLA-OL（Online Reenforcement Learning）；接下來，小鵬將通過蒸餾的方式將VLA部署到車端。

除了新勢力自研的陣營，傳統(tǒng)廠商一側(cè)其對VLA技術(shù)也有強烈的興趣。供應(yīng)商中，元戎啟行可能是對VLA推進得最早、最快的一家公司，其在去年6月份第一次對外公開談到在開發(fā)VLA，其預(yù)計今年將有至少5款車搭載元戎啟行提供的VLA模型上市，其中最早的車型預(yù)計在三季度量產(chǎn)并上線功能。

智能輔助駕駛已經(jīng)成為新車銷售中的關(guān)鍵配置，今年伴隨著英偉達DRIVE Thor等新一代芯片上車，整個行業(yè)正經(jīng)歷技術(shù)換代。

以VLA為代表的新模型能帶來什么樣的變化，這不僅是當下時下汽車行業(yè)的開發(fā)者們翹首以待的，甚至有準備購車的車主都在密切關(guān)注——畢竟動輒30萬元級的購車決策，誰也不想剛買的新車在關(guān)鍵配置上很快落后。

一、下一代模型VLA，將帶來哪些新功能？

關(guān)于新一代的VLA模型有什么功能，理想在今年3月份的GTC上已經(jīng)給了一些小小的劇透；而最近一周內(nèi)，元戎啟行的CEO周光在火山引擎Force大會上披露了更多細節(jié)。元戎重點展示了基于VLA 4個主要的能力：

空間語義理解，尤其是由于遮擋造成的盲區(qū)，這是一大類常見的問題，比如橋洞通行時或者因為公交車等大車造成的動靜態(tài)視野遮擋，VLA能夠理解這個語義，并且執(zhí)行更安全、有防御性的駕駛決策。

異形障礙物識別，典型的比如施工、異形車或者因為超載而變形的車輛。
文字引導(dǎo)牌理解，比如轉(zhuǎn)彎待行區(qū)的文字指引、可變車道、潮汐車道等等。

語音控車，通過VLA模型，系統(tǒng)可以根據(jù)語音指令做出對應(yīng)的駕駛決策，并且當用戶意愿與導(dǎo)航信息相沖突時，VLA模型會優(yōu)先采納用戶意愿。

這些功能目前都已經(jīng)有demo展示，元戎還預(yù)告了接下來還會有新的功能陸續(xù)會上線，包括豪車識別功能以及在園區(qū)里找充電樁等。

其實在過去幾個月里，我們已經(jīng)初步體驗了一些新一代的系統(tǒng)，包括蔚來基于世界模型NWM的新版本，以及理想在新版AD Max（基于NVIDIA Drive Thor U平臺）上部署的初代Agent能力。

其中最大的感受是新的模型對場景的認知大幅提升，系統(tǒng)不再是執(zhí)行一個簡單的「A點移動到B點」的指令，而是會根據(jù)語音下達的需求，認識、思考、執(zhí)行，從而提高增加輔助駕駛功能的便利性。比如在停車場，能根據(jù)需要找到地庫的電梯口；能主動理解掉頭的需求，并且找到合適的點位掉頭。

不過目前我們已經(jīng)體驗過的demo都限于封閉地庫或者園區(qū)場景，元戎給出的新功能則更多針對開放場景，看起來組合更加豐富。

基于更大算力和先進架構(gòu)的模型，顯然還會有更多的功能推出。在G7上懟了3顆圖靈芯片的小鵬也給了這個預(yù)期，「G7出來的時候，后面每個月都會增加新的有趣的功能，會有很多新的行業(yè)沒有的功能出來，這是算力帶來的想象空間。」

二、行業(yè)為什么在這個時候，紛紛了選擇VLA？

在過去一年，幾乎所有主流的車企在輔助駕駛上都更新成了端到端大模型驅(qū)動的系統(tǒng)，在短時間內(nèi)性能和體驗提升都比較明顯。但端到端黑盒的研發(fā)模式，導(dǎo)致了部分Corner Case無法追溯產(chǎn)生的原因，這也導(dǎo)致一部分車企很快地從「熱戀期」進入到了「瓶頸期」。

即使是當前TOP級別的端到端系統(tǒng)，在面臨復(fù)雜道路結(jié)構(gòu)疊加復(fù)雜車流博弈時大多數(shù)情況也會崩潰。行業(yè)普遍面臨瓶頸，所以很自然地有公司開始探尋上限更高的新架構(gòu)。

而VLA通過語言模型的引入，很好地解決了研發(fā)和用戶兩端黑盒的問題。

不過，這并不意味著端到端不值得投入開發(fā)。李想本人在最近的AI Talk中就提到，他們內(nèi)部認為：如果規(guī)則算法都做不好，根本不知道怎么去做端到端；如果端到端沒有做到一個非常極致的水平，那連VLA（視覺語言行動模型）怎么去訓(xùn)練都不知道。換句話說，在端到端上取得大規(guī)模成功量產(chǎn)經(jīng)驗，是探索VLA的一個門檻。

小鵬是在國內(nèi)智能輔助駕駛最早的推動者，而理想在2024年通過清晰的AI戰(zhàn)略大幅加速了其輔助駕駛的研發(fā)，「E2E+VLM」的范式在去年掀起了一波不小的風(fēng)潮。元戎本身是一家有很強AI基因的公司，去年它在魏牌藍山和Smat精靈5上實現(xiàn)了端到端輔助駕駛方案的量產(chǎn)，先進性和工程能力受到頭部自主品牌的認可。

接下來，小鵬將在后續(xù)車型的Ultra版本（搭載3x圖靈芯片）上部署VLA；理想已經(jīng)預(yù)告了除了Thor U版本，VLA也將在雙OrinX版上能跑起來。

元戎對今年累計量產(chǎn)規(guī)模的預(yù)計是超過20萬輛車，其VLA模型可以支持激光雷達和純視覺方案，并且正尋求通過蒸餾的方式適配更多的芯片平臺。

在開發(fā)車端VLA模型的同時，元戎正在通過與火山引擎在算力上合作，催化云端模型的迭代。

這些信息意味著，從規(guī)模上來講，VLA將成為一代非常主流的輔助駕駛大模型。

并且，由于今年絕大部分廠商的旗艦車型在硬件上將會上馬Thor U，但部分廠商去年在端到端的開發(fā)上并不理想，這倒是提供了更大的機會，加強車企與供應(yīng)商在先進模型上的合作。