0
作者:王瑞昊
編輯:林覺民、李雨晨
“如果不往端到端轉,你們就別干了。”
在2024年3月的春季戰略會上,李想當著公司自動駕駛團隊的面,毫不客氣地扔下這一句話。他對當時智駕的表現極度不滿,直言理想智駕已經到了必須“破釜沉舟”的關口。
四個月后的2024年7月5日,理想汽車正式發布“端到端+VLM”系統。這不僅是一套技術的亮相,更是理想智駕發展道路上的分水嶺。
在此之前,理想的智駕研發像是一場持久的追趕戰,短短四年間先后迭代了五套技術方案,從有圖到輕圖,再到無圖,每一步都在追趕卻始終達不到行業頭部。
直到第六套方案“端到端+VLM”登場,才讓理想終于從長期的追隨中,第一次體會到真正的領先。
一位深度參與該項目的內部員工告訴雷峰網,輕圖與無圖方案只是讓理想得以坐上自動駕駛的牌桌,而端到端方案,則讓理想在這張牌桌上打出了自己的勝局。
2024年7月,“端到端+VLM”先在1000名早鳥用戶中試水,反饋好得出奇。一個月后,這一功能出現在門店試駕車上,隨即點燃了市場熱情。到了10月,智能駕駛試駕占比已經達到65%,到年底幾乎成為用戶進店體驗的“標配”。
用戶對端到端方案的熱情,也迅速轉化為銷量表現。
2024年全年,在30萬元以上車型中,AD Max(搭載“端到端+VLM”的車型)交付占比高達75.4%;在40萬元以上車型中,這一比例更是達到84.6%。而在同年2月,這一數字還只有20%。
時間撥回到2024年初,彼時的理想智駕團隊仍被焦慮和不安籠罩。那時他們剛剛轉向無圖NOA,卻發現自己依舊落后于華為和小鵬一步,前途充滿不確定。誰能想到,僅僅數月之后,端到端的落地,會讓理想迎來反轉時刻。
在此之前的2023年,理想汽車開始全面向華為學習,包括自動駕駛戰略也在參考華為模式。
華為在自動駕駛領域的整體戰略可以概括為“人海戰術”,擁有約5000名智駕工程師,行業最多。受此啟發,理想汽車自2023年起大力擴充自動駕駛團隊,從年初的五六百人迅速增長到年底的超過1000人。
但團隊規模的迅速擴張,并未帶來理想預期中的效果,距離智駕追趕華為的目標仍有較大差距。
華為的城市NOA在2023年底實現“全國都能開,有路就能開”。理想的城市NOA雖然在同期也開通了110個城市,但支持區域受限,僅能在城市主干道開通該功能。
更讓智駕團隊焦慮的是,城市NOA全面推送給用戶后,收獲了一片差評,不僅遭到車主吐槽,甚至還受到內部員工的批評。
城市NOA剛一推送完,郎咸朋便帶領智駕團隊全力投入無圖NOA的研發。他們將全部希望押在這一方案上,期盼無圖NOA的用戶體驗能夠真正追平華為,為團隊贏回信心。
在2024年春季戰略會上,當討論如何學習華為研發無圖NOA時,內部有人建議:既然華為組建了超過5000人的研發團隊,那理想至少應組建一支超3000人的團隊來推進這項工作。
該提議立刻招來李想的強烈反對。
李想對團隊坦言,他已厭倦了每天“卷”那些corner case(危險場景)的補丁工作:“你永遠也打不完,即便堆再多人也沒用。”他頓了頓,目光掃過每一位團隊成員:“我們必須升維競爭,要有光腳不怕穿鞋的心態,反正我們也不是行業頭部。”
這場戰略會之前,郎咸朋心里一直忐忑:如果端到端方案做不成,該怎么辦?李想卻沉著地告訴他:“理想沒有歷史包袱,現在端到端正是我們的機遇,我們就應該抓住它,并為此孤注一擲。”
在決定轉端到端之前,李想已具備一定的AI認知,他敏銳地察覺到,以AI技術為核心的端到端方案,正是理想實現彎道超車的機會。
2022年底ChatGPT的發布對李想產生了巨大影響,他認為理想是時候下場做AI了。(為什么ChatGPT發布后,李想對AI的認知發生了變化,其中細節,歡迎添加作者微信Hugh-wangruihao交流)
一位接近李想的人士告訴雷峰網,ChatGPT發布后,李想對AI的認知發生了很大變化。
自2023年起,李想便開始積極提升自己在AI領域的認知。最初,他拉了十幾二十個人,每周定期聊AI。團隊會向他分享正在做的實踐案例、最新的論文研究,李想的學習速度令人驚訝。
隔了一段時間后,李想干脆取消了其它例會,只保留了AI周會。隨著周會次數的增多,團隊發現李想的AI認知迭代速度驚人,幾乎是一周一個迭代。
他異于常人的地方在于,不僅能快速理解復雜概念,還能把晦澀難懂的技術轉化為任何人都能理解的類比。
例如,當團隊討論如何將大模型能力引入現有系統時,他形象地把現有能力比作“猴子”:猴子可以模仿人,但永遠不可能變成人。他指出,僅做“猴子”的模仿學習毫無意義,關鍵在于理解整個邏輯鏈條——從模仿學習到大模型——就像區分猴子和人的本質差異一樣。
為了讓全公司認識到AI的重要性,在2023年初,李想將公司愿景從 “成為全球第一的智能電動車企業” 變更為 “成為全球領先的人工智能企業” 。
在李想的影響下,理想高管團隊也在快速迭代自己的AI認知,其中就包括自動駕駛業務負責人郎咸朋。
2023年5月,理想高管團隊——包括智能座艙負責人勾曉菲、產品負責人范皓宇,以及郎咸朋等人,一行人組團前往美國硅谷,進行AI考察與交流。
雷峰網(公眾號:雷峰網)獲悉,當時郎咸朋不僅親自試駕了特斯拉的FSD,還專程拜訪了特斯拉自動駕駛團隊,進行深入交流與學習。
當時正值特斯拉即將推出具有革命性意義的FSD v12版本之際。
特斯拉于2024年1月正式向用戶推送FSD v12,這一更新被視為自動駕駛行業的重要里程碑。與傳統依賴人工編寫規則和標注的方式不同,FSD v12首次引入端到端技術:通過向大模型輸入數百萬段視頻片段進行訓練,取代了原有的30多萬行C++代碼。
就在FSD v12被廣泛討論但還未有車企跟進之際,2023年底,理想汽車悄悄啟動了端到端方案的預研。
理想汽車的研發模式遵循“交付一代、研發一代、預研一代”。當時,無圖NOA剛進入研發階段,僅有少數研發人員負責端到端的預研工作。由于團隊的工作重心全部放在無圖NOA的研發與交付上,郎咸朋尚未為端到端的研發和交付設定具體周期。
在理想汽車,研發與交付都有嚴格的時間周期,到了節點必須交付成果,否則將直接影響考核。
事實上,上一代方案“輕圖”的研發和交付已經讓郎咸朋意識到,如果一直按照華為模式推進,理想的智駕恐怕難以突破。
華為在自動駕駛領域的兩大優勢——龐大的工程師團隊和完整的制圖資質,是理想不可能具備的。
2024年3月的春季戰略會上,李想的一番發飆徹底點醒了郎咸朋。他終于意識到:照目前的做法,理想永遠追不上華為,即便做到和別人一樣好,外界仍會覺得小鵬和華為更強。唯一的出路,就是硬著頭皮把端到端方案做出來。
那次戰略會上,郎咸朋第二次在李想面前立下軍令狀,語氣堅定而帶著一絲緊繃:“想哥,你也別罵了,這話我先放這里。今年6月份,我一定把端到端做出來,效果要超過現在的無圖方案。如果做不出來,到時候你開我,或者我自己走。”
郎咸朋第一次在李想面前立下軍令狀,還是在2021年的“衛城計劃”期間。那場戰役讓理想在自動駕駛領域具備了自研能力。如今,再次立下軍令狀,他也意識到,這一次的挑戰比以往任何一次都更加艱巨。
2024年3月春季戰略會一結束,郎咸朋便著手啟動端到端項目組的組建工作。彼時,無圖NOA的交付仍在緊張推進中,他沒有動交付團隊的人手,而是選擇從其他部門招募志愿者,組建起專門攻堅端到端項目的隊伍。
就像當年衛城計劃初立時被普遍質疑一樣,這一次,端到端項目在理想內部同樣不被看好。彼時業界對端到端還停留在概念層面,沒有任何成功的落地案例,小鵬、華為的相關探索也都還處于萌芽階段。
就連理想自動駕駛團隊內部有些人也覺得是癡人說夢。
于是,郎咸朋選擇以“秘密招募”的方式組建團隊。他在部門大群里發出一則簡短的招募貼,并未點明是端到端項目,而是這樣寫道:我們正在啟動一個秘密項目,難度極大,風險極高,也不一定能成功。但如果能做成,它將讓我們一舉超越所有競爭對手,直接躍升到行業第一。至于項目具體內容,我現在不能透露。如果你有興趣或想法,可以主動來報名。
郎咸朋希望借此招募到真正自愿加入的戰士,而不是被動分配、心不在焉的人。只有主動投身其中的人,才會把職業命運與項目緊密捆綁,抱著背水一戰的決心去拼這一仗。
4月15日,在理想中關村研發中心舉行的首次誓師大會上,現場只有12人參會。這12人在聽完郎咸朋闡述端到端的理念后,被深深打動,隨后主動去動員身邊志同道合的同事加入。就這樣,項目逐漸在正式啟動時,成功聚攏了約100名核心成員。(端到端項目組建初期,為什么招募不到人員,其中細節,歡迎添加作者微信Hugh-wangruihao交流)
郎咸朋為端到端項目取名“達摩克里斯”,寓意每個人頭頂都懸著一柄利劍,隨時可能墜下,成敗一念之間,唯有全力以赴才能保全自己。當時郎咸朋對端到端項目的態度是注一擲、破釜沉舟,沒有退路,只有成功這一條路。
在理想中關村辦公室,郎咸朋專門將《達摩克利斯》油畫打印并掛在墻上
郎咸朋將端到端研發的重任交給了夏中譜。
夏中譜于2023年從百度加入理想,初到公司便與郎咸朋一同推進百城 NOA 的交付,隨后又成為無圖 NOA 研發的中堅力量。他最大的優勢在于對算法有著深刻而獨到的理解,因此郎咸朋放心地把端到端研發的核心工作完全交由他統籌。與此同時,團隊的二號人物賈鵬則負責 VLM 的研發,兩條研發線并行推進。
夏中譜于2016年從中科院博士畢業,博士期間主要研究強化學習,這在當時屬于前沿方向。他所在的課題組是國內最早開展強化學習研究的單位之一,理論積淀深厚。
2016年夏中譜參加各公司面試時,強化學習在國內仍鮮有人涉足,那一年正值阿爾法狗熱潮,他的專業背景為進入百度提供了機會。加入百度后,夏中譜進入 L4 自動駕駛部門,工作了約八年。
在此期間,他始終專注于用強化學習解決核心問題,主要聚焦決策與規劃領域。八年間,他參與了三代技術開發:第一代負責障礙物預測,第二代推進學習化決策,第三代實現聯合規劃。這些算法最終成為百度 L4 系統的核心,并展示在阿波羅(Apollo)開源平臺上。
夏中譜加入理想汽車初期,理想智駕團隊基礎相對薄弱,行業認可度不高,也很難吸引到頂尖人才。再加上早期投入有限,許多優秀人才被華為、小鵬、蔚來等公司吸引走。因此,在輕圖和無圖 NOA 研發階段,除了技術研發,夏中譜的另一項主要工作就是組建團隊、搭建組織架構和技術基礎設施。
這為端到端項目的啟動打下基礎。
到了2024年2月,端到端預研人數得到增加,夏中譜的團隊規模擴大到約40人;隨著4月份項目組的成立,他帶領的團隊逐步擴展至約180人。
不到一個月,夏中譜便帶領團隊研發出了端到端的Demo版本。5月15日,一輛搭載端到端Demo的車被郎咸朋開上了路。車子雖然開得歪歪扭扭,但有一個亮點尤為突出——縱向控制表現異常出色,遠超此前的有圖和無圖方案。當時副駕的賈鵬被郎咸朋問道:“賈老師,這是你特調過的吧?”
賈鵬搖頭:“郎博,沒有,我們也覺得很神奇。”
僅靠把數據輸入到模型訓練,效果就遠超當初團隊手動編寫的上萬條規則。到這一天,團隊首次真正意識到,端到端方案,很可能真的能實現。
夏中譜帶領團隊又攻堅了一個月,并在6月1日交出了優化后的Demo。
當時正值李想準備前往6月8日舉辦的重慶論壇之際,在出發前兩天,郎咸朋帶他首次體驗端到端試駕,車上還坐著張穎——李想私交最好的投資人之一。
這是李想第一次試駕端到端,郎咸朋壓力巨大,甚至做好了如果體驗不佳,當場辭職的打算。
在李想試駕端到端的前一天,郎咸朋在內部召開了一次小會,討論無圖版本的交付時間。
產品團隊和交付團隊都給郎咸朋施壓:“郎博,我們要做兩手準備,如果端到端失敗了,我們還能有無圖版本交付,所以你必須留人留資源,把無圖版本交上。”
郎咸朋當場反駁:“你們能不能相信我一次?要么就別做端到端,要做就把它做好。如此瞻前顧后,怎么可能成功?”
郎咸朋情緒激動,堅持認為端到端只需再等一個月,就能顯著超越現有能力。在5月15日的試駕中,端到端僅經過一個月研發,其縱向控制能力便已全面超越之前的規則版本;再給一個月,其成長潛力將令所有人震驚。
由于其他人尚未對端到端有直觀體驗,這次會議后,公司緊急召回了已被裁員的50人去負責無圖版本的交付。
但僅僅過了兩天,李想親自試駕后,團隊的所有質疑都煙消云散。
試駕當天,陪同李想一起上車的,還有他的老朋友、經緯創投管理合伙人張穎。張穎不僅是理想汽車的早期投資人,更是李想在創業路上最信任的私交伙伴之一。
兩人認識已久——早在理想汽車最艱難的融資階段,張穎曾三次伸出援手。李想后來在公司上市演講中公開感謝三人,除了CFO李鐵、推薦145位車主的老友外,張穎是唯一被提名的投資人。他在臺上說:“公司每次遇到融資難題,張穎總是第一個沖上來幫忙。”
這一次,張穎再次出現在理想的重要時刻。
那天,李想在北京順義總部附近試駕理想最新的端到端版本。車輛自動行駛著,最初他沉默不語,神情專注;隨著系統在復雜路況中一次次平穩應對,他的表情逐漸舒展,語氣也越來越興奮,不時轉頭與張穎交流:“哎,這真好!未來的自動駕駛就該這么做。”
張穎坐在副駕,目光始終盯著前方,也忍不住笑出聲來。他評價道:“這是我體驗過的智駕系統中,表現最好的一版。如果滿分是10分,我會給今天試駕打9分。”
李想的興奮一直持續到重慶論壇。原本團隊為他的演講準備了其他內容,但他臨時自行改稿,全程脫稿講述理想自動駕駛的發展路線與未來愿景。

在試駕此前的智駕系統時,李想最多只是認為數據是個不錯的工具,但這一次的端到端體驗徹底改變了他對 AI 的認知,他更加深刻體會到AI能力的強大:“我靠,原來這個模型,能力竟然這么強。”
自此之后,理想內部才第一次真正開始相信端到端。
2024年底,李想宣布理想汽車將All in AI,這一決定,與他第一次試駕端到端所帶來的震撼密切相關,正是那次經歷讓他下決心全面押注AI。
李想試駕后,郎咸朋獲得了更多資源全力推進端到端項目。此后,夏中譜領導的算法團隊規模從原先的40人擴大至160人,數據、仿真與測試團隊也擴展到近300人,使整個端到端項目的總人數超過400人。
2024年7月5日,理想正式舉辦發布首次對外發布了端到端方案,并在同月完成了千人推送。
智駕團隊參加參加AI talk錄制,從左到右分別是:詹錕、郎咸朋、賈鵬
此后端到端項目進入用戶交付階段。
2024年10月23日,理想“端到端+VLM”開啟全量推送,率先支持城市場景。
2025年1月16日,“端到端+VLM”將支持場景拓展至高速和環路,理想由此成為國內唯一、全球第二家將端到端技術應用于全場景的車企。
一位深度參與端到端項目的內部員工告訴雷峰網,從4月份項目啟動到7月份交付,大約只用了100天,中間沒有出現過任何紕漏。相比之下,其他公司如華為、小鵬等,在端到端方面至今未達到理想當時的一段式端到端水平。而理想僅用100天就完成了千人推送,并在10月份實現全量推送,隔年1月份完成了高速和城市場景的統一。
理想的端到端量產奇跡,帶給行業的啟示是多方面的。
理想的端到端,第一次讓行業見識到了如何花最少的錢,辦最大的事。
一位內部員工向雷峰網透露,理想端到端項目的核心算法團隊不足200人,相比競爭對手華為、小鵬、蔚來等少得多;即便算上整個項目總人數,理想也僅超400人,而競爭對手的自動駕駛團隊規模通常都超過1000人。
在如此有限的投入下,理想的端到端項目卻取得了驚人的成功——它不僅讓理想的智駕水平一躍成為行業頭部,還直接帶來了銷量。在此之前,智駕功能更多只是錦上添花,很難成為促使消費者下決心購車的關鍵因素。
2024年初,AD Max車型在理想整體銷量中的占比僅為20%;但自7月份端到端完成千人推送后,這一局面迅速發生逆轉。
千人推送驗證效果良好后,理想迅速將端到端推廣到線下門店,一時間掀起了消費者的試駕熱情,試駕端到端的用戶比例陡然上升至超70%,不少消費者反饋,端到端體驗甚至優于華為的乾崑智駕。
到了年底,搭載端到端智駕系統的車型在理想整體銷量中的占比已超過70%,相比年初的20%實現了大幅躍升。
理想的端到端項目從4月份啟動研發到7月份完成千人交付,僅用了約100天。這得益于整個研發與交付過程中沒有出現任何紕漏,否則項目進度本可能大幅延誤。
100天奇跡首先要歸功于團隊的通力協作和應用技術的領先性。
理想端到端項目的技術負責人是夏中譜,他2023年加入理想后負責智駕系統的決策規劃模塊,當時郎咸朋給夏中譜的定位是:用數據的方式,打造理想下一代自動駕駛系統。
夏中譜(右一)駕車測試端到端系統
夏中譜在2023年加入理想后便著手端到端預研,但當時主要任務仍是交付有圖和無圖NOA,真正專注于端到端的預研團隊只有幾個人。直到2024年2月,整個端到端組織才完全劃歸給夏中譜,夏中譜算法團隊規模增加到40人;到了4月份,預研階段結束,郎咸朋告知夏中譜開始為量產做準備。
從4月15日到7月,僅不到100天的時間,夏中譜帶領團隊便完成了端到端千人推送的交付,這一過程之快在行業內極為罕見。整個研發過程中,團隊基本沒有出現任何錯誤,否則7月份的交付根本不可能如期完成。值得注意的是,當時團隊算法規模僅有40人,算力配置也只有2000卡,是最小化配置條件。(夏中譜為什么能憑借2000張卡就做出了端到端,其中細節,歡迎添加作者微信Hugh-wangruihao交流)
從早期算法定義、數據定義,到線上框架和產品定義,夏中譜幾乎從零搭建了整個系統。在此過程中,確保各個模塊及各個團隊之間的緊密協作成為核心挑戰。
一位項目成員告訴雷峰網,團隊成員之間的高效配合、信息流通和協作執行,是端到端項目能夠在如此短時間內順利推進、并且無偏差完成的關鍵經驗。
另一個關鍵在于前瞻性地應用了一段式端到端技術。
一段式端到端是一種設計非常前沿且非常干凈的技術,突破了傳統模塊化方法的局限。傳統自動駕駛研發通常依賴規則化和模塊化方式:感知、地圖、規劃與控制、數據和仿真測試各自獨立運作。雖然這種方法可以快速跑通最小閉環,實現局部優化,但最終只能得到局部最優解,難以形成全局最優。
端到端大模型技術將感知、規控、定位、地圖等模塊集成到一個網絡中,一次性處理所有任務,實現系統化設計。數據從一開始就經過精心規劃;模型訓練直接以任務目標為導向,無需拆分成多個獨立模塊;測試環節圍繞端到端算法定制設計,從而提高效率并降低復雜度。通過云端、車端與算法的緊密配合,整個系統能夠實現全局最優,以最低成本、最快速度完成研發。
夏中譜的優勢在于,他是一個對自動駕駛全領域、全技術都非常精通的人,清楚地知道每個模塊的短板在哪里(以前每個模塊都是獨立的,一個的短板就是整體的短板),并能通過全局思維,將一個模塊的短板用其它模塊彌補,使各個模塊形成合力,從而實現全局最優。
對于郎咸朋和夏中譜來說,在這個過程中,不僅要求他們對整個技術體系有全面的理解,同時還要明確技術架構如何與組織協同配合。這不僅關乎技術本身,還涉及人才梯隊的建設,需要將人、事、組織以及它們之間的關系有機協調,用系統性的思維進行拆解和把控,這一點至關重要。
正是這種對技術與組織的雙重統籌,使端到端項目在不到100天的時間里完成千人交付,并迅速實現全量推送與場景拓展,從而讓理想汽車在智能駕駛領域實現了彎道超車。
長里程路測端到端的高速性能
如果把這100天的量產奇跡比作一次聚光燈下的舞臺演出,那么能否成功,表面上取決于演出的內容是否契合時代潮流,以及每位演員之間的默契配合。但決定性的因素,實際上是這場演出背后長達數年的持續準備與積累。
對于理想來說,決定100天量產奇跡的決定性因素在于,郎咸朋從入職理想起就開始搭建的數據閉環系統。
這也正是理想能夠用數百人的團隊,交出媲美甚至超越競爭對手數千乃至上萬人團隊成果的智駕系統的根本所在。
郎咸朋第一次感受到數據的重要性來自于他在百度時期的一次研發經歷。
在2014年到2015年期間,郎咸朋擔任百度街景業務部門的技術負責人。當時,街景部門的算法資源十分有限,為提升街景識別率,郎咸朋主動尋求支持,找到時任百度IDL常務副院長余凱,請求借助深度學習技術來突破瓶頸。余凱隨即調派了IDL的核心成員、時任百度高級科學家黃暢前來協助。 在黃暢的協助下,街景識別率一路被提升至86%。當時黃暢對郎咸朋說了一句話:“我們已經用上了世界上最先進的模型。”

黃暢(右一)、余凱(右三)
在此之前,郎咸朋依靠傳統機器學習的方法,識別率可以做到70%左右。
那是一個需要“人海戰術”的年代。彼時,百度街景的數據采集剛剛起步,車輛跑遍全國各大城市,帶回來的數據量以幾百個T 計。僅北京這樣一個大型城市,道路里程就有兩三萬公里。問題隨之而來——國家規定,街景不能出現人臉和車牌等敏感信息。于是,必須在所有圖像里,把這些信息一一抹掉。
怎么做呢?只能靠人力。街景團隊本身就有三五百人,再加上外包團隊,規模一度擴張到上千人。每天的工作,就是逐幀逐張地標記圖像,把人臉和車牌打上框,再做模糊處理。這是個沒完沒了的工程。全國四百多個城市的數據量壓下來,工作量巨大,既耗錢、又耗人,更關鍵的是耗時間。
團隊當然想過用算法來減輕負擔。當時人臉識別和車牌識別在學術層面已經有成果,可一旦落到真實世界,問題立刻暴露出來:魚眼相機帶來的嚴重畸變,讓人臉和車牌變形得面目全非;公交車廣告上的人臉經常被錯認成真實人臉。
自動化的識別率最高只能做到70%,而且其中還有不少誤判和漏判。假如一張圖里有100個需要打碼的地方,算法只能標出70個,還可能錯掉其中的30 個,剩下的30個完全漏掉。這種“半吊子”的結果,反而需要人花更多時間去修正。相比之下,還不如直接全程人工。
更讓人頭疼的是,街景里可不只是路人和車牌。有時,國家檔案館、公安局,甚至一些不掛牌的涉密單位門口,這些敏感人物和場景,絕對不能有一絲遺漏,否則后果嚴重。
在這樣的壓力下,團隊只能繼續依賴人力。但所有人都明白:這是條走不通的路。于是,郎咸朋找到了余凱團隊前來協助。
黃暢很快做出了模型,識別率提升到了86% ——相比原來的70%已經是飛躍式的提升。但即便如此,仍然與人工95%左右的水準差了關鍵的9個點。郎咸朋追問余凱、黃暢能不能再提升,得到的回答卻是:“郎博,你再找全世界任何一個人來都不可能了。我們已經用上了最先進的模型,這是極限了,你們自己想辦法吧。”
這段經歷讓郎咸朋第一次真切感受到:真實世界的復雜性,遠比實驗室里的理論要復雜得多。
萬般無奈之下,郎咸朋決定換個思路——不用去追逐“更聰明的大腦”,而是想辦法讓“腦子吃飽飯”。他意識到,再強大的模型,如果輸入的數據不夠充分,也難以產出理想的結果。
當時用于訓練的樣本圖片量是一萬張左右。在那個年代,這已經算得上“大規模”了。于是,郎咸朋將樣本量擴大10倍至10萬張,并且帶領團隊上手精標了其中的5萬張。這次,郎咸朋沒有使用黃暢研發出的“世界上最先進的模型”,只使用了普通的開源CNN框架,結果以一訓練,識別率直接沖到了 90%。
那是郎咸朋第一次見識到數據的威力,大家的眼睛一下就亮了,“原來在AI世界里,數據才是第一生產力。算力差點、模型差點都沒關系,只要數據好,結果就有效。”
這個發現瞬間調動起了所有人的熱情。大家一鼓作氣,把十萬張樣本全部精標完成。新的訓練結果更是令人振奮:車牌識別準確率達到99%,人臉識別率也穩定在97%。這不僅超越了人工標注的95%,更重要的是,徹底擺脫了對上千人外包團隊的依賴。識別交給機器后,只需加數據,就能源源不斷“嘩嘩”地跑出結果。
這對公司而言,是一次真正的降維打擊:成本驟降,效率暴漲。當時郎咸朋的上級顧維灝看到結果后都驚訝不已:“郎博,原來這個能做到這么好?趕緊推!”
效果甚至引來了競爭對手的關注。那時騰訊地圖也在做街景,是百度地圖的直接對手。他們的人跑來打聽:“你們是怎么做到的?怎么能又快又好?”
前后對比的沖突極為鮮明:從最初上千人耗時耗力地手工標注,到后來依靠深度學習+大規模高質量數據,不僅識別率超過人工,還一舉解決了效率和成本問題。這次突破,讓郎咸朋第一次切身體會到:AI的真正壁壘,不是模型,而是數據。
從此,數據驅動的理念成為郎咸朋開展研發的核心武器。
2017年,李想曾問郎咸朋,在自動駕駛中哪一項最關鍵。郎咸朋回答:數據。沒有足夠的數據去區分和訓練,再強的算力和最優的算法也無法充分發揮作用。(郎咸朋離開百度后為何加入理想汽車,其中考慮,歡迎添加作者微信Hugh-wangruihao交流)
2018年加入理想后,郎咸朋便開始著手搭建數據閉環系統,構建起完整的獲取、處理與應用數據的體系。到了2019年第四季度,理想交付第一輛車時,這套系統便正式投入運行。
為了獲取更多且更高質量的數據,從理想的第一款車型理想ONE開始,智駕系統的軟件和硬件就全部標配,使每輛車都具備完整的數據收集與采集能力。在國內車企中,只有理想做到這一點,其他廠商要么硬件不是標配,要么軟件需要額外付費。
郎咸朋對傳感器布局極為堅持,他對李想說,無論是L6、L7、L8還是L9車型,傳感器的布局必須保持一致。可以更換芯片,但傳感器的位置和數量不能更改。曾有人建議更換部分傳感器,郎咸朋明確表示,可以去掉激光雷達,但視覺和圖像傳感器的布局必須完全按照原設計執行。
這種統一的布局保證了每輛車采集的數據標準化和可比性(可以復用),使得整個數據閉環系統高效運作,并為后續算法訓練提供了可靠、統一的數據基礎。
截至2025年8月29日,理想用戶輔助駕駛總里程達到49億公里,作為比較,截止到2025年7月,華為乾崑智駕活躍用戶數達70萬人,智能輔助駕駛總里程突破35億公里。
從2021年的衛城計劃,到2024年的端到端方案,郎咸朋帶領理想智駕團隊在短短三年間完成了五輪技術方案迭代,實現了智駕水平從落后到追趕,再到行業領先的三級跳。
對于數據的認知,是理想智駕在過去幾年反超速度快,交付效果好的根本原因。
進入2025年,理想汽車的智駕系統再次迭代到了VLA方案,那么,這一次,它憑借什么實現領先?
本文作者長期關注理想汽車,歡迎對理想汽車感興趣的讀者添加作者微信 Hugh-wangruihao 交流。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。