小鹏董事长何小鹏:坚信1-3年全自动驾驶会落地、3-5年汽车将成为强力超级智能体
3月2日,以THE FUTURE 为主题的小鹏第二代代VLA媒体体验⽇结束后,小鹏汽车董事长兼CEO何小鹏、小鹏汽车通用智能中心负责人刘先明接受了媒体的访谈。在现场,何小鹏回应了此前智能化部门整合,是看到了 跨域融合的行业大趋势,并立下军令状, 今年8月,无论是智能驾驶,还是智能座舱,都将带来的技术颠覆性升级。
而小鹏智能化“新帅”刘先明分享了他履新以来的心路历程,称 “压力很大”但信心很足,并介绍了第二代VLA在出海方面的优势, 不会像特斯拉FSD一样“水土不服”,强调了基座模型对于L4公司的重要性。
值得注意的是,在最后,何小鹏进一步强调了小鹏今年的三大重点任务,即组织能力的建设和改变、创建物理AI体系和全球化,很明显小鹏距离成为一家全球化的物理AI公司又迈进了一大步。
时间:3⽉2⽇
地点:广州小鹏科技园 T3-二楼
受访嘉宾:小鹏汽车董事长 CEO 何小鹏
⼩鹏汽⻋通用智能中心负责⼈ 刘先明

以下是对话内容(略有删减):
1、媒体:恭喜发布第二代VLA与新产品。第一个问题请问小鹏为何建议跳过L3、并向两会提出该建议,是为了我们可以有一个更领先的技术吗?第二个问题是第二代VLA到底能够做到什么程度?是已经完全可以达到L4,还是在什么样的阶段?第三,第二代VLA将落地到多少台车辆,能否给出大致预估数据?
何小鹏:
第一个问题,我认为L4开始就会有新的责任主体,在今天全球科技发展的情况下,基本上从L2的下一个台阶就是L4,中间专门加一个L3实际对于硬件、软件、法律法规都是挑战,所以从我的角度来看,我认为中国应该一个是L2,一个是L4。
第三个问题,我们所有的Ultra和Ultra SE都会都会搭载第二代 VLA,你可理解为未来小鹏在全球市场的车型,将会提供基础智能辅助驾驶和顶级智能辅助驾驶两种选择。
刘先明:
第二个问题,现在到底做到什么水平。目前还没有完全说自己能达到百分之百的L4,但是现在整个VLA2.0搭建了一套非常通用并且高效的架构,所以基本上每天都会有新的版本出来,不停地去迭代新的问题,而且进步速度也是超乎我们想象的,所以我们有信心,在未来的一段时间内能做到L4水平的一套比较完整的体系。
具体的时间可能还没有办法给出完全的判断,1—3年是大师兄给出的判断,我们的判断是如果按每一天迭代的速度比前一天快,看到整个训练速度和数据规模曲线是加速上升的状态,如果我们一直维持这个状态的话,我相信会很快。
2、媒体:我们看到先明的职位已经变成通用智能中心负责人,这是一个很大的变化。为什么会把智能座舱和智能驾驶合并,形成这样的组织架构调整?目前这种变化似乎也是车企中正在发生的趋势,想请问小鹏汽车这次调整与其他车企有什么不同?也想问先明担任这个职位后感受有何变化,和之前只负责智驾时相比?
何小鹏:
我来回答上半段问题,感受肯定是先明来回答。
我相信汽车领域很快会迎来跨域融合。从机器人领域可以看到,机器人甚至可以没有底盘,它的全身控制、全身动力、全身的线束和汽车不完全一致。汽车行业正在进入新的跨域阶段:自动驾驶是整车运动,智能座舱是整车大脑,再加上动力、底盘,我们认为这四个域都在进行跨域融合中。
未来L4或Robotaxi车型,很多厂商会从原来单一域的集成(比如一个域由多家供应商集成,或单独一个域研发),转向跨域融合。这样能让整车更快、更安全、更灵敏,能力提升数倍,从被动使用转向主动服务。所以,先明负责的通用智能中心,正是跨域融合进程中的一部分。这也是我非常坚信1—3年全自动驾驶会落地、3—5年所有汽车都会成为强力超级智能体。
刘先明:
我来回答第二个问题感受,感受就是压力更大了。
网上也流传很多段子,问我睡不睡觉、是不是睡办公室,其实没那么夸张,但压力确实更大了,同时也看到了更多机会。就像小鹏总所说,当历史转折点摆在面前时,每个人都会很兴奋。能有机会参与这件事,是每个技术人的梦想。
但我有信心,能在自动驾驶上验证过的 AI 能力,可以大规模迁移到座舱上,让整车真正成为一个有机的智能体,而不是割裂的一个东西。自动驾驶积累的经验和底层 AI 基础架构,都可以完全复用。
3、媒体:第二代VLA实现端到端智能革命,将于本月下旬全量推送。这套底层技术统一、动力形态双选的产品策略,将如何定义小鹏未来3年高端市场打法?另外,您今年两会将提交加快推动自动驾驶从L2跨越到L4的提案,能否详细介绍这份提案的主要内容?
何小鹏:
关于两会提案:按要求需等到两会开幕后再详细分享,目前仅先公布了提案标题。
关于未来1-3年,汽车将从软件时代进入AI时代,从软硬件独立发展走向跨域融合,从原来的、简单的智能新能源车升级为可主动服务的高阶智能Agent。因为小鹏在多领域同步研发,所以未来1-3年大家会看到有很多跨域融合的效果。
这也是我为什么非常激动地认为,包括以前的燃油汽车,以前靠汽车商想做好的方案实际上越来越想做好是困难的,而且汽车的变化一定会从原来的被动生产工具变成一个主动能够产生生产力的,我认为是划时代的产物,大概3—5年会实现。
4、媒体:第一个问题,刚才先明也提到基座模型是做好L4的基础。从行业来看,目前很多Robotaxi玩家对基座模型提及不多,或选择其他技术路线。未来基座模型是否会成为Robotaxi企业做好业务的标准吗?第二个问题,第二代VLA出海方面,您提到目前在瑞典的case使用云端模型进行仿真训练。特斯拉在做中国FSD时,也是通过网络视频、仿真训练等方式推进,我们如何避免出现类似特斯拉 “水土不服” 的问题?
刘先明:
先回答第一个问题,关于基座模型。
现在 L4 或者自动驾驶已经发生很大的技术范式变化。我们过去看到Waymo还有很多 L4 公司,其实上限很低,大家只能不停往前卷。这带来另外一个问题,就是L4的ODD概念,车辆到底能运行在什么地方,只能取决于铺了多少车、采了多少数据、建了多少地图。所以如果真想泛化性解决整个问题,技术范式就一定要变,这是不可避免的。
大家看到旧金山Waymo有很多有意思的案例,如果目前还是沿着过去路径走,可能大家也都会觉得这条路径是一个成本极高、并且泛化性很差的技术路线。所以Waymo也在做基座这类事情,但一家企业还是要看它到底有没有决心和投入来做这件事,以及到底能多快完成转型。
今天我们也在发布会上提到,做好基座模型,是一家做L4公司的必修课。不做这件事,就可能在这次技术转型中落在后面,或者没办法完成完整的技术转型。
第二个问题
第二代 VLA 模型在没有经过任何海外数据适配训练的情况下,从今天大师兄发布的视频里可以看到,已经具备很强的能力。第二,小鹏是一家全球化企业,我们会在合规前提下,在全球任何有小鹏车辆的地方正常拥有并使用当地数据。第三,对于更多泛化性场景,通过世界模型的生成方式,也可以让我们快速达到一个能力起始点。
所以整个小鹏全球化自动驾驶的策略,一定是这几点结合在一起:模型本身要有极强的泛化能力,不能只依赖中国数据、只能在中国跑,这个事情是行不通的;再加上小鹏的全球化布局,以及我们在技术上的突破。
5、媒体:世界基座模型如果同时赋能多样化智能体,它在多模态交互、空间感知这些方面会不会存在技术复用的瓶颈?不同形态的智能体能否对基座模型反哺,加深模型的优化?下一个问题请教大师兄,您觉得基座模型领域的市场存量大概有多少?估值大概多少?
刘先明:
底层的复用能力应该还是很强的,整个VLA或基座模型的设计是原生多模态,不太会只针对自动驾驶,是可以复用的。具体的复用情况我们还在持续探索,目前暂时无法给出特别明确的结论。现阶段首要任务还是先在车上先把整个事情跑完,下一步再推进舱驾联动。
何小鹏:
第二个问题说实话我也不知道。基座模型能给一家车企或自动驾驶企业带来多少估值,我认为它是一个必要条件。我只知道它投入很大,去年就花了几十个亿,今年更多。做基座模型不仅投入资金多、以及优秀的人力,但必须往前推进,否则上限会非常低,做到一定阶段就很难再突破。所以真的只有依靠强大的基座模型,未来才能泛化到多种具身智能体中,这是我的看法。
6、媒体:非常开心第二代VLA终于发布了,昨天我也摸了一下,说实话摸之前我心里是没底的,摸完之后觉得确实交了一份不错的答卷。我的问题是两个,第一自动驾驶进入到端到端,进入到模型这个范式之后,其实大家都在用人类的数据去做模仿学习,今天先明也有给我们分享世界模型在仿真世界里做大量的强化学习的case和案例,实际从去年开始,很多人就在谈人类数据其实价值不大了,所以这个问题我想先问大师兄,您觉得人类数据还有它的价值吗?还有RL强化学习是不是真的万金油,所有的问题都可以解吗?有没有它不擅长的东西?第二个问题想问一下先明,这个版本交了,您跟大师兄打的那个赌,您觉得您会在街头裸奔吗?
何小鹏:
我觉得物理世界、人类世界的数据量现在来看是无限的。
以前我觉得有10万台、100万台车跑了多少公里就够了,现在我觉得远远不够。很多人说我有车队、我有公司,车卖得多就有很多数据,这些都是错误的。如何收集有质量、有价值、超大规模的数据,我觉得是非常困难的一点。不论是汽车还是机器人,这件事上都远远没有看到头,这是我的看法。
刘先明:
大师兄说的这个观点是没有问题的。目前我们还没有看到明显的收敛趋势,就是增加人类数据,模型的基础能力不会下降。今天也提到,模型本身的体量还在不断上升,我们在联合优化芯片、编译器和模型本身来提升效率,也会进一步推升模型规模。这两者一定是相辅相成的,数据没有到头,模型规模也没有到头。
大师兄提到的数据质量和价值,确实是目前特别难的问题。数据每天都可以收上来,但存储成本高,而且很多也用不上。所以怎么挖掘真实世界里真正好用的数据,是一个会一直被探索的问题。
再说强化学习。强化学习不是万金油。现在学术界、工业界都在说强化学习很厉害,但它一定需要一个非常强的基座模型——至少能采样到解决这个问题的可行解。如果连这个能力都没有,强化学习就没办法继续提升。但强化学习是效率特别高、能定向解决问题,并且能持续探索长尾问题的一种学习方式。所以我觉得大家不用把强化学习当成可解万物的万能解,而是一个非常高效的学习方法。
至于打的那个赌,感觉我有一半可能性不用裸奔了,我们确实已经开始准备找食堂了。
7、媒体:作为小鹏车主和忠实用户,我想先问先明:目前市场上算力军备竞赛宣传愈演愈烈,友商之间在疯狂堆算力,但很多用户实际体验后发现,算力大幅提升,体感提升却没有数值增长那么明显,问题大概出在哪?小鹏全栈自研在算力使用效率上有哪些长板?
刘先明:
其实今天我们分享的内容里,很大一部分就在讲这件事。算力不只是名义上的数字好看,更重要的是把算力用好,这是核心问题。这也是我们从通用处理器向专用处理器ASIC过渡的原因。其实你看NVIDIA(英伟达),就是在GPU和CUDA时代做这件事 —— 把算力用好,比单纯说算力提升多少倍更有价值。所以算力不仅要大,用好才是核心关键。
另外,大算力一定需要更高信息密度的输入、更大的模型来匹配,否则算力就是空转。这些因素合在一起就意味着:如果只是搞算力军备竞赛、单纯堆高数值,消费者是感受不到明显的体感提升的。一定是多方面协同推进,不能只看单一指标。
全栈自研的到底有多大用处?如果没有全栈自研,大家就看不到现在这么丝滑、安心的体验,这套能力也不可能真正部署上车,可能看到的还只是以小模型在车上以较低效率运行。全栈自研最大的好处,就是我们从硬件层、软件层、模型层从头重新定义整套体系,让它完全服务于我们的应用场景和最终上车落地的模型。
8、媒体:今天的发布会小鹏总说了很多关于要把第二代VLA打造成妈妈喜欢开的这样一个智能辅助驾驶,而且也做了很多相关的活动,比如你自己也陪食堂阿姨做了实际的体验。是什么样的契机让您做这些事情?您想给用户和社会带来怎样第二代VLA?现在的全量推送VLA达到您当初一个期望值了吗?
何小鹏:
今天我在发布会上流露出我为什么有这样的想法,最开始在几年前我带着我的妈妈,她是乘坐自动辅助驾驶,在那个时候她非常担心,在几年前。随着到了现在,我再次让她体验我们整个VLA,她才感觉到真正是丝滑,她放心。所以我通过自己的妈妈,首先一个想法是,如果L4或者Robotaxi应该是所有的人,不管你开车还是不开车,不管你擅长开车或者是一个新手司机,都敢开。
我的妈妈因为她已经有70多岁了,她对于新事物的接受程度比我们年轻人要稍微慢一点,所以换一个角度,如果我们让妈妈都放心,妈妈都爱开是一个非常重要的点,所以刚好向我们公司的妈妈厨房请教,请教妈妈敢不敢开?愿意不愿意开?有没有驾照?她们开完之后我们才发现,原来妈妈们跟我妈妈的想法很类似,不敢开,不愿碰,但是现在看到非常安心的一个过程。
所以我们通过这个事情把它放大,我在这里看到有一部分的媒体老师们,你们也在做一些试驾的比赛,我相信你们试驾的人员可能都是比较年轻的,但有没有一些年纪比较大,想买车的爸爸妈妈们。
如果我们走到欧洲会看到非常有意思的现象,欧洲的买车用户很多都是40-60岁的人是主体,要让一个好的技术在中国,在全球都能够很好地落地,政策法规是基础,技术可行也是基础。
但是要让大家有信心,很放心,很安心,更是真正能够把技术推到所有人的一个基础。
今天我们走出第一步,但是在今年和明年会以以前数倍的速度甚至10倍的速度加速跑,会让更多的妈妈们敢开,所以这次门店试驾,我们也欢迎更多家庭里的太太、妈妈来体验自动驾驶,不只是先生们来试驾。
9、媒体:小鹏X9的增程版上市之后成绩都还挺不错的,今年纯电版也发了,第二代VLA也上车了。从产品价值来看,这款高端的MPV产品它有哪些维度被进一步的增强了?这些维度对用户来说日常使用里面有哪些对他们是直接受益的?第二个问题今天发布会视频含量非常高,都是关于第二代VLA的,这一代的VLA在你们看来领先行业有多少?依据是哪些?另外它能不能解决一直以来智驾的一个问题,就是用智驾来促进消费者最后的购买决策?
何小鹏:
两个问题,先答第一个问题,就是 X9。
我相信,我们小鹏X9解决了几个非常好的问题:
第一,很安全,中欧五星,我觉得安全是所有家庭大七座车第一选择。
第二,小鹏X9之前解决了百变巨大的空间问题,一二三排都非常好、空间非常大。小鹏X9不管是增程还是纯电,都考虑到司机开大车的体验。很多人包括我原来对开大车都很畏惧,觉得不敢开,像开坦克一样。开了小鹏X9就知道特别好开,转弯很灵活,掉头一把就能掉过去,特别有面子。
第三,今天纯电X9还增加了两个能力:第一是续航,800V+5C,充电快、续航扎实,续航也是全球七座纯电里第一。
第四,就是今天讲的VLA。以前车越大,大家越不敢用智能辅助驾驶,因为载的是一家人。今天推出第二代VLA,就是为了更安全、更安心、更简单、更舒适,这些我们都做到了。
所以我自己觉得,小鹏X9这四项能力:安全、百变空间、最长最扎实的续航,无论是纯电还是新能源,最后是让全家都安心的智能辅助驾驶,不是司机一个人放心,是全家都安心。
第二个问题,我觉得领先多少见仁见智。
通过我们内部比较测评,我认为比行业一流选手领先接近5倍,无论是接近率、安心丝滑度,还是支持的可达范围。
我认为在这个领域里,今年、明年、后年,大家最终看到的最重要指标,是多少天没有碰过方向盘,也就是接管次数,这对用户最重要。
今天我专门提到,现在在停车场,特别是地下停车场,一键起步、原地起步、自动漫游开出来,我觉得还没达到主路上95分的水平,大概60分。我刚和先明聊天,期望未来几个月把它也做到95分。也就是说一上车它问我去公司吗?我说对今天做牛马,按一个键,就自动启动,自己开过去。
无论停车场、小区,收费站闸口,主路、辅路、公司园区,全部搞定。到了公司我下车,它自己开进去。我相信政策法规一旦通过,马上就能支持。这些才是我们的最高标准。
全场景都能开、完全放心、超高效率,这才是我们做自动驾驶的目标。到那时,车能自动充电,喝了酒可以坐后排,让它带你回家,各种功能都会实现。我认为这才是最重要的。而今天绝大部分L2,都只在有限场景,需要随时监管,很多Corner case场景下会刹停、暂停,甚至完全不能开,一定会让人不安心、不放心。
10、媒体:刚刚在发布会上,我们看到了X9纯电版配置上有了全面的升级,像800V的高压平台,高阶智驾,这些都是全系标配,但是价格却比上一代低了,让很多人觉得X9是加量降价,掀桌子,结合1月份超级增程版热销的情况,这样市场定价是出于什么样的考虑?去年11月在增程版成功破圈之后,这次纯电版的补位除了是“一车双能”矩阵闭环之外,还承载小鹏着什么样的战略考量以及市场预期呢?
何小鹏:
再过两年大家会看到小鹏整个汽车家族的产品谱系,从七座、六座到五座,全面满足全球及中国不同用户群体的需求,这是第一个关键点。我特别希望X9能满足家庭用户对大七座车型的全部需求,这是我非常重视的一点。
关于价格调整,我们最终是结合整体产品规划图谱和实际市场情况综合标定的。大家可以看到,对于2024、2025年的老车主,也有相当不错的权益,而且在过去一段时间里,他们可以先体会到科技的变化。
小鹏汽车过去几年在硬件和软件的迭代节奏上有所不同。近一两年大家会发现,未来小鹏在软件上的迭代速度会更快,硬件变化则会逐渐收敛。所以未来的汽车,会越来越像一个Agent(智能体),而汽车的基础能力,包括颜值、安全、可靠、舒适等,我认为在相当长的范围内,我们会做得相对更加稳健。
11、媒体:最近2—3年我们从行业实践来看,关于模型做决策怎么出轨迹这件事主要有两种方法,第一种方法是大模型直接给出最终的轨迹,第二个给出几种不同的轨迹之后,让系统从中选择一条,小鹏第二代VLA是前者还是后者,在您看来这两种不同的方案之间有没有优劣之分,哪种方案更符合未来的发展趋势?
刘先明:
第一个问题核心就是你是做自动驾驶还是AI?如果这个问题回答了,那答案其实很清楚了。我们做的是一个AI,不是专门只是用来做自动驾驶,所以一个AI模型是怎么做的,我们就是什么样子的。
既然都已经做了这么大的变化,就不会带着之前很多的逻辑,这些heuristic(基于经验规则的启发式方法),就是这些很多的规则或者办法来解决现在的问题,这个也是让数据和模型不停scaling(通过增加数据量、模型参数规模、算力投入,来持续提升模型能力)最重要的核心,尽量少加其他的东西进来。这个可能听起来有点过于简单直接,但是在过去这几年里面,整个AI的发展就是告诉我们这一件事,就是怎么能去做scaling,怎么能够快速地迭代,就能够快速的解决问题。核心就是你到底做的是智驾还是做的是AI。
关于管理方法,在刚才发布会环节也介绍到从去年科技日到今天一共120天左右的时间,迭代了468个版本,差不多一天迭代4个版本,我们也同时清楚小鹏智驾研发的同学是分布在中国和美国这两个地方的,两个地方有差不多12小时时差,关于基座模型的研发,最核心算法模型研发人员主要分布在中国还是美国?您是通过哪些管理的方法或者策略来让两地的同学更好地协作配合,推动模型快速地向前迭代?
刘先明:
我们是个多地研发的公司,有很多的同学在全球来做这件事,之间的协作是比较顺畅的。大家一直在提一个概念——Infra(基础设施)。基础设施不仅仅是研发的基础设施,还包括制度、流程的基础设施,我觉得这些都是要同步推进的,只有这些全都往前推进,才有可能让一个跨地域,跨时区的团队一起协作起来。所以不会存在说这个事只在这里做,那个事只在那里做,小鹏的团队还是非常快速协作,并且非常smooth的团队。
12、媒体:刚才提到第二代VLA要到3月和4月通过OTA推送到客户端,现在国内很多特别是以小鹏为代表的新能源汽车企业,他们很多都是通过OTA的形式来不断地增加汽车新的功能,这个在海外的汽车企业当中,有一种想法通过收费的OTA能够使汽车除了整车销售之后还可以通过软件升级获得收益。我们知道目前国内包括小鹏在内OTA好像都是不收费的,想问一下今后有没有这样的想法,通过收费OTA能够使得企业的利益增厚?大概在什么样的时候?通过什么样的功能能够达到这个目的?
何小鹏:
将来海外自动辅助驾驶升级到L4,或者更高等级的自动驾驶的时候,我认为很有可能会从次费变成月费,这是一个非常重要的趋势,因为不是百分之百的人都需要自动辅助驾驶,需要的人付费,不需要的人就可以不付费,这是一个蛮不错的选择。将来我们在海外甚至在中国,随着我们的AI能力的变化,一定会产生一些变化。
我们都认为OTA可以帮助汽车常用常新,也可以延长汽车的使用寿命,在这一块目前您是怎么看待国内这些车企频繁地进行OTA的现象?以及还面临着哪些课题或者是问题?
何小鹏:
小鹏从创立之初就一直认为汽车是可以升级的,包括软件、硬件、SOTA(Software Over-The-Air,通过无线网络对软件进行远程升级)、FOTA(Firmware Over-The-Air,通过无线网络对“固件”进行远程升级)。在这一套的方法论上,我们正在把它建成更全自动的,比如如何利用AI去单点OTA,如何能够去解决一些单点的问题和困难,我觉得将来都是有机会的。包括售后、可维修、保养,比如在保养之前已经把整个车预扫描完了,你过来不用再在里面做太多的检查,降低保养的时间的消耗,这样都是在未来时间里面我们会去做的事情。
13、媒体:过去大家普遍觉得L2和L4是两个赛道,用的是两种方法,两套硬件的体系,甚至是一年之前大师兄接受访谈的时候也说过:从L2到L4是线性的。但是一年之后你去硅谷试驾完FSD,我们换了第二代VLA,为什么我们就可以运用一套基座模型加一套硬件同时实现L2和L4,是不是意味着L4公司就没有护城河了?
何小鹏:
我们以前把自动驾驶当作一个车在一个区域,比如说一个国家的问题去解决。现在我们把它作为AI的问题,所以它可以跨车,跨国家,一定程度可以跨设备,这是完全不同的。
去年本来我去硅谷试驾的时候,我觉得我们是换道超车了,我们做到全新的架构了,一去发现他们原来已经切换了。实话说,FSD V13和V14是质的改变。V13很多人都开过,实际上还是一个L2级别的能力。换个角度我自己认为要推翻原来的范式,因为小鹏从算力、编译、基模、数据、整体思考逻辑,都期望为什么这样的AI能够落在不同的设备上,使它可以运行,为什么运行既有上限的高,还能够补下限的低。
为什么这一套模型甚至还可以跨域赋能机器人和飞行汽车,就是不同形态的具身智能的终端,因为我们经常说机器人最大的一个问题就是它的模型和数据,智能被锁死在特定的形态里面,它很难泛化,为什么我们的基座模型能够泛化,我们是通过怎样的底层逻辑和方案实现这种跨产品和跨场景的复用的?
何小鹏:
在最近的几年里面,小鹏自动驾驶过去十几年生涯间,我们一直在思考这个问题。为什么我们能够做到L4?为什么车可以自己开?为什么我们可以放心让车自己开?这一系列问题。
这个世界的规则太多种了,原来的L2靠软件完全无法做到。前几年我跟先明刚刚见面的时候,我们都在讨论,该怎么能够跨过上一个时代,到达下一个时代。
小鹏还是比较有勇气的,我们尝试了一种没有人走过的一套逻辑。并且这个月(第二代VLA)第一次量产,我还是很自豪的。因为大部分人都是跟随,尝试创新、探索出一条全新的道路,这是我们这一代科技创业者,科学家应该去做的事情。
14、媒体:大师兄发了开年的信,里面计划挺密集的,包括物理AI、出海等其他方面。我认为在资源和组织带宽有限的情况下,这些业务有什么优先级吗?如果到2026年底回顾整个一年表现的话,您觉得哪件事做成的话会觉得今年是赢了的?
何小鹏:
我觉得作为一个汽车企业,痛苦他要平衡。一件事做成是不够的,比如销量到达,好不好?好,也不及格。我认为,汽车这个商业模型不好,销量是抖动的,很难精准;加上销量毛利太低,销量到达不了彼岸。所以销量好不好?很好,但是不够。
我觉得组织能力的建设和改变是非常重要的。
第二是创建物理AI的AI体系,这个也非常重要。今天只是AI在自动驾驶、汽车领域的第一步落地,但是在智能座舱、机器人、飞行汽车的落地还没有。
第三个小鹏在全球化上做得非常深,明年大家会看到我们的效果。
小鹏汽车和大众在第二代VLA上也在合作,这个事您怎么看?这件事的意义是不是已经超过了商业价值的本身?
何小鹏:
我觉得大众是一个非常有想法,能看到未来的、非常好的企业,他们正在看中国的变化,不断地探索,所以他们引入了我们这一代的VLA。同时,他们也一直在思考在欧洲,在全球其他国家,什么时候会开始智能驾驶。我一直认为L2的ACC或者LCC或者高速、城区都不足以(进行智能驾驶)。
中国用户探索精神在全球都是排在前列的,但是有很多国家不是这样。所以真正要把一个自动驾驶做到像我们刚才讲的安心、全部场景、很高效率,到他觉得他比开的还好,他才敢真正地开。在很多国家,我们经常讲小路开的能力。实际上中国小路不多,在很多欧洲、东南亚国家,有很多的小路,他们的自动驾驶首先问,你在这条路上能开吗?中国很多的L2都开不了,都要接管。所以要小路能开,停车场也能开,能够漫游地开,我觉得才能真正走向完全不同的全球。
大众正在探索和尝试,我相信不远的将来一旦自动驾驶做好,包括我们,FSD都会在全球正面引导更多的人知道,原来汽车的自动驾驶是物理AI Agent第一个规模落地,也是第一个商业化落地的点。因为AI最难要如何赚到钱,形成一个正向的循环,在物理世界自动驾驶是最容易,也是最清晰的物理AI第一个Agent落地。
15、媒体:在模型训练过程中,“安心、场景、效率”这三个关键词是否存在取舍,是否有明确的优先级排序?另外,您刚才提到今年去了硅谷,才意识到他们已经完成了“切换”,那在您目前的观察中,全球范围内是否只有两家已经切换到原生多模态物理世界大模型?此外,今年的核心目标很多,您最后一句提到要“与行业拉开代际差”。这个代际差最核心的衡量指标是什么?是否是刚才提到的接管MPI?如果是的话,今天发布会上提到安全接管里程提升50倍、平均接管里程提升25倍,但并没有给出最终数值。如果我的理解是对的,能否公布一个目标答案,比如是否是1000公里?
何小鹏:
AI不是一个规则,它很难在最开始把这个需求提得很清晰。但从我们现在自己研发以及现在在进行训练的方案,安心排第一,因为安全、放心、舒服、舒心是我们认为最重要的。
如果一定要我排序,安心大于场景,场景大于效率。但是效率和聪明这个点,因为更聪明才有更高的效率,我相信在我们后面的版本也会有比较大的增强。
刘先明:
如果做过机器学习或AI,就知道PR曲线。当曲线较平时,只能在安心、效率、场景间权衡,本质没得选。
自动驾驶中,我们常问:到底想要什么样的自动驾驶?我走上这条路,是因为曾看到大卡车司机疲劳驾驶,眼睛闭着一两分钟。大家都有家人,都在等亲人安全回家,所以自动驾驶最核心的目标是安全。
但并不意味着安全就可以为所有其他东西让路,没人想要为了安全而要一个慢吞吞、没效率、跑不动的东西。解决这个矛盾,核心是提升基础能力——只有基础能力上去,才能在不牺牲其他维度的前提下,把安全做到更高水平。
我们说的 “代际差”,不只是单一指标的差距,更关键是有没有切换整套做事思路,迭代速度有没有质变。我们现在追求的是不仅跑得快,加速度还在持续变大,因为我们在构建底层通用能力体系,这才是真正的代际差,而非单点指标领先。
何小鹏:
关于最终具体数字,我给他们的要求跟他们给我反馈要求是不一样的,暂时还未能对外公布。但可以明确,我们的期望是千公里级接管,而非百公里级。
我们之所以有信心,是因为在多个城市、多个高难度时段的对比测试中——难度大致在85分到 99分之间,我们相对于第一阵营已经有了数倍提升。更重要的是,用户坐在我们的车里真的会感到放心和放松,无论是加速、变道还是制动。
另外,今天媒体试驾的,很可能是我们上个月训练的版本;而我们现在现在看到的版本,较上个月已有百分之几十的提升。过去做L2,多是“补丁式开发”,解决一个问题、修一个Bug,这种方式会不断限制能力上限。
我们以前写L2是真的靠人、靠规则,在螺丝厂里面做道场,在非常小的一个地方去雕花,但现在我们完全不一样。所以我们有信心,今年预计8月份,在守住安全底线的基础上,还会有多倍级提升,最终结果年底大家可通过测评直观感受。
16、媒体:第一个问题,在我看来第二代VLA属于非典型架构范式的世界模型,具备一定对物理世界的感知、理解、预测能力。这种新范式会不会成为未来主流?是否所有企业都会朝这个方向发展?目前有些企业还在VLA和世界模型之间二选一。另外第二代 VLA 也会用在机器人上,想了解相关进展。第二个问题关于智能涌现功能,去年小鹏总提到,系统可实现等红灯自动蠕行,这次又能自动避让救护车。这类智能涌现是否底层可控?我们是否担心涌现出影响行车安全的功能?
刘先明:
我先来说关于世界模型和VLA的问题:
大家一直在纠结这两个概念,实际上我们真的需要那么多概念吗?可能不需要,今天我们一直在说的一件事,我们本质上在做一个体系,原生多模的模型,不仅可以出动作,也可以出其他的。
世界模型其实本质上是对世界3D空间的理解、运动规律的理解,最终以一种形式展现出来,这个和VLA本质没有什么太大的区别,就是你想把一个车开好,让机器人控制得好,或者让功能做得好,首先先要去理解这个世界的3D空间,理解整个推演的规律,并且能向前去推演,评价什么动作是有风险的,什么动作是没有风险的,这个是我们的一些看法,不见得是对的,但是至少目前我们在朝着这个方向努力,这是第一个问题。
第二个问题关于涌现本身,涌现它不是一个严格可控的过程,但是做自动驾驶肯定安全是一个底线,就是这个安全一定是一个底线,所以我们没有办法抑制掉某些的涌现,但是我们可以控制好安全。
何小鹏:
我觉得后面那一点我稍微补充一下:
最开始,我认为很多“涌现”是因为我没有看到,而你先碰到了,所以对我来说是涌现;但现在我自己看到了,而且数据规模已经非常大。所以在今年以及后续的 VLA 上,我个人认为它会越来越聪明,会出现越来越多具备进化能力的COT(思维链)。到那个阶段,大家会明显感受到:它在驾驶中既足够安全,又会展现出一些超出预期的能力。
那这些能力里会不会存在不好的部分?我也不能完全确定。如果有,我们需要通过数据筛选,或者通过强化学习等方式去解决,可能会有,但我认为整体趋势一定是让所有人开车越来越舒心。
比如在暴雪环境下如何驾驶,或者像广州曾出现过的珠江漫堤、水淹路面这种极端场景,实际上绝大多数人都没有真实经历过。但因为系统“看过”全球范围内大量类似数据,它有可能进化出相应的应对能力。在这种情况下,对用户、对社会的帮助反而会更大,这是我的看法。
17、媒体:我去年体验过咱们的G7,但目前VLA还没有体验过,当时给我的感觉是,我们这个娱乐功能太强大了,咱们平时是怎么引导车主,让他们更加注重驾驶的安全?也想请教一下:VLA属于L2的辅助驾驶,一旦发生事故,您认为车企和用户的责任是怎么去界定的?为什么用“认为”呢?是因为我们知道2016年国内第一起自动驾驶致人死亡的事故,目前还没有判决的结果,所以国内目前我们认为这个领域的法律框架是比较模糊的,想听一下您对于这个的理解。
何小鹏:
我觉得汽车里面娱乐功能,随着汽车越来越像一个智能体发展一定会有,而且会从被动到主动。我认为现在在新能源汽车里面增加最强的就是听音乐,以前汽油汽车NVH没有那么好,本身汽车的发动机也有一些噪音,所以新能源音乐的能力会更强。
我觉得很快语言能力、交互能力会到了一个全新的点,以后会像和机器人互动一样,你不会通过屏幕去看一个世界,而是通过自然语言的交互。
至于您刚才讲第二个问题我觉得非常简单,今天在法律范围内,所有的自动辅助驾驶都是L2,除非是政府单独批准了Robotaxi,把人类司机从驾驶位放出来。但是我们所期望的在这个里面做到能够接近甚至达到超越L4软件的能力,这是我们正在做的事情,但是我相信这一块所有跟着政策法规走,这也是我们最为标准的认知。


