2025年2月25日夜間,一起因語音系統誤判引發的交通事故,將智能汽車行業在語音控制領域的激進擴張推至風口浪尖。一輛領克Z10在高速公路行駛時,車主發出“關掉閱讀燈”的語音指令,但系統錯誤地將其識別為關閉車輛大燈。大燈熄滅後,車主試圖通過語音重新開啟,但系統未響應,車輛最終在黑暗中撞上護欄。

事故發生後,領克官方迅速致歉,並在當夜通過OTA(空中下載技術)推送了修復補丁。然而,這起單一事件迅速發酵,其影響遠超一輛車的軟件缺陷。事後,大量車主自發進行的測試發現,市面上相當一部分車型都允許在行車過程中通過語音直接關閉大燈,這揭示了一個普遍存在的功能設計隱患。

這起事故恰好發生在一個行業變革的關鍵節點。就在幾乎同一時間,特斯拉CEO 馬斯克在社交平臺X上宣佈,其FSD(完全自動駕駛能力)即將支持自然語言交互,讓車輛能夠理解“停在那邊那棵樹下”這類模糊指令。與此同時,國內的小鵬汽車提出了“艙駕一體”的AI架構,理想汽車也早已通過多模態大模型將語音控制直接接入行駛決策系統。中外車企幾乎同步地將自然語言推向了智能駕駛的核心。

這場技術競賽背後,隱藏著三個尚未解決的深層問題:語言如何安全地跨越“座艙娛樂”與“行駛安全”之間的物理鴻溝?模糊的日常指令如何與要求高度確定性的硬實時安全系統兼容?在L4級自動駕駛尚未大規模落地的當下,語音控制駕駛的邊界究竟應該劃在哪裡?

要理解這場變革,需先看清過去的侷限。傳統智能汽車架構中,負責“聽”的智能座艙芯片與負責“開”的智能駕駛芯片是兩套相對獨立的系統,中間隔著厚厚的網關。語音信號難以實時轉化為駕駛指令,導致早期語音功能僅限於“打開空調”等單一操作。隨著電子電氣架構演進,車企為彰顯科技感,不斷拓寬語音控制邊界,從車窗、空調延伸至熄火、大燈等極具爭議的領域。領克Z10事故正是技術膨脹速度甩開安全驗證步調的直接後果。

破局的關鍵在於大模型技術的演進。馬斯克推動FSD引入自然語言交互的初衷,源於真實用戶痛點:在FSD V14版本測試中,約85% 的人工干預發生在尋找停車位階段,用戶希望直接告訴車輛“在靠近入口處停車”。外界推測,此次升級將深度聯動特斯拉的Grok語音助手,利用其自然語言理解能力識別模糊指令。

國內車企的動作更為迅速。理想汽車的“理想同學”已能在導航輔助駕駛激活狀態下,通過語音執行“變道”“超越前車”甚至“進入服務區停在這個充電樁旁”等指令。在專業評測中,搭載視覺語言動作模型的車輛已能響應“通過前方路口後,尋找那排白色臨停車停下”這類複雜指令,並自主完成變道、尋找、交互確認和靠邊停車等一系列動作。

然而,消費者最大的擔憂也隨之而來:機器能否真正理解語境下的安全邊界?如果後排兒童開玩笑喊出危險指令,車輛能否識別並拒絕?有技術人員透露,目前的解決方案通常是“雙重確認”,即在執行關鍵動作前由語音再次詢問。但這又引入了新的槽點:既然需要確認,直接打轉向燈是否更快捷?地平線副總裁呂鵬在接受《汽車商業評論》採訪時指出,好的智駕系統應像專職司機,無需頻繁語音干預,頻繁的語音指令恰恰說明系統本身還不夠成熟。

從產業趨勢看,從“艙駕分立”走向“艙駕一體”是這場變革的主線。理想、小鵬等車企已相繼將自動駕駛與智能座艙研發團隊合併,旨在打破部門牆,讓視覺感知數據與自然語言交互數據在同一算力網絡中實時流動。這不僅是技術架構的升級,更是為即將到來的L4時代預埋商業接口——當車內沒有方向盤時,語音將成為人類控制車輛的唯一媒介和全能的商業服務代理人。

但技術落地的現實遠比願景複雜。特斯拉AI負責人阿肖克·埃盧斯瓦米在2026年2月的公開演講中流露出審慎態度,他表示,儘管車輛已接入Grok,但距離“完全集成的語音控制”尚有距離,因為這開啟了一個全新的測試領域,需要大量安全工作來防止對抗性攻擊。呂鵬也強調,在L4級自動駕駛成熟前,過度強調語音控車可能是本末倒置,核心難點不在於“聽懂”,而在於安全執行。一個概率性的語音模型去控制一個強安全要求的駕駛系統,其風險不言而喻。

監管層面也在做出反應。2025年底發佈的GB 7258修訂徵求意見稿明確規定,行駛中涉及運行安全的燈光、制動等操縱件必須裝備實體操縱件。但這主要解決了軟件死機後的逃生手段問題,並未對“語音亂令”的主動風險形成系統性約束。截至目前,對於語音信號如何進入智駕域、需要經過何種安全校驗,行業仍缺乏統一的強制性規範。

《汽車商業評論》的判斷是,真正完全依賴語音駕駛,需要L4以上自動駕駛成熟、法規認可與事故責任清晰。在那之前,語音更多是一種增強體驗,而非完全替代。這場由事故撕開的行業遮羞布,正迫使整個產業在狂飆突進中重新審視安全的底線。