小鹏汽车袁婷婷:云端AI基座大模型的蒸馏模型年内上车,下半年带来L3级体验
4月23日,正值上海车展举办之际,第一电动《庞观》栏目于上海开启了主题为 "见智问答" 的线上直播活动。第一电动网CEO庞义成与多家车企高管围绕智能驾驶领域展开深度对话与交流。
小鹏汽车自动驾驶中心产品高级总监袁婷婷透露,年内将实现云端AI基座大模型的蒸馏模型上车,很多场景会有数倍于目前的表现,带来如 “iPhone4 时刻” 般的体验,大幅提升场景覆盖、功能与安全表现。
小鹏目标的下一步是通过极强的云端基座大模型,加蒸馏、加强化学习的方式,能真正意义上形成跨代式的变化。
谈及全场景能力,袁婷婷以大陆车在香港无数据训练却顺利行驶为例,表明小鹏大模型具备理解交通规则的能力,追求全场景无断点驾驶。关于 L3,她指出 L2 与 L3 核心区别在于责任转移,实现 L3 需国家准入、硬件冗余、大幅减少人工接管,小鹏计划 2025 年下半年带来L3级体验。
庞义成提及华为 ADS4.0 发布及技术路线,双方探讨不同企业技术差异。袁婷婷认为,各企业技术路线不同很正常,过往积累对当下发展意义重大,规则既可作包袱也能成基础,优秀企业需具备自我学习、迭代、革命与升级能力。
以下为对话实录(有删减):
庞义成:小鹏汽车自动驾驶中心的高级产品总监,欢迎婷婷总,介绍一下小鹏在这次车展最新的产品和技术。
袁婷婷:与大家分享一下最近的进展。我觉得小鹏是一家心怀星辰大海的公司,我们做的第一步是小鹏的汽车,今早小鹏还跟我们的人形机器人碰拳,人形机器人和飞行汽车都是我们物理AI大世界里的成员,自动驾驶是人形机器人的第一步,也是贴近大家生活,让大家摸得到看得到的一步,我们物理大模型的基座大模型,就是上次AI WorkShop分享的部分,也是我们小鹏AI的底座,这个底座里能生长出非常多有意思的具有想象力的未来的产品,而我们的技术链路就是云端有一个大型的基座模型工厂,大量数据,现在已经达到了200万clips的数据,现在我们已经在训720亿72billion的云端大模型,也是业界我看到最大规模的云端基座大模型,这些是我们在物理AI上进步的一小步,相信对于整个行业来说也是非常重要的一步,技术路线不仅有云端大模型,还会通过蒸馏,蒸馏到车端,让车端算力也有小身材、大容量的算力AI到车上,接下来大家看到的小鹏的车将会是真正意义上的AI汽车,因为拥有最强大脑。
庞义成:不知道直播间观众朋友听到婷婷说的有没有起一身鸡皮疙瘩,但我身上的70个billion的量真的没有听说过。
袁婷婷:现在车上端到端的模型一般是0.5B到1B之间,行业VLA的模型基本是2B左右,我们云端72B的模型比行业内VLA的模型大概是35倍左右,是巨大的脑容量的庞然大物。
庞义成:大家别误会,小鹏并不是打算把这个大模型塞到车端,还是要从大模型里蒸馏出一个中模型,数B左右的量级到车端。记得现场的朋友跟婷婷讨论安全上限的问题你说了一句话,你说AI的上限一定是高的。
袁婷婷:这是一个过程,AI的过程是极致的人类行为的模仿,是上个阶段说的非常多的端到端,端到端本质上就是对人类行为的模拟,接下来下一步就是要超越人类行为,比人类还要开得更好,要比人类开得更好要怎么做呢?我们的做法就是云端类似于有个获得诺贝尔奖的特别聪明的老师,车端也有一个聪明学生,因为车端自研芯片算力非常大(对比同行),我们从车端的学生是云端蒸馏出来的,比直接训车端的模型更聪明,再加上强化学习的部分,促使老师和学生不断往更新的境界进步,这个过程就是AI突破上限的过程,也让我们看到了AI在未来有机会超过人类现在驾驶能力的机会。
庞义成:从4月号天梯榜的成绩来看,总榜第一名是小鹏,100.95分,比华为99.75分高大概1分多一点,这是8站比赛成绩累加的结果。
我们看到评论区有很多小鹏的车友很自豪,也有华为的车友不服气,你们别着急,后面还有很多站比赛,我们可以一站站看,小鹏第一,华为第二,第三Momenta,第四理想,四名之间的总差距不到2分,很接近。
昨天华为发了ADS4.0,今天我们也当场求教了一下,开场时我和海荣老师也分享了一下,核心点是第一云端上了大模型,车端打通了一体化端到端,所以软件有比较大的变化,硬件也有升级,基于这些才推出了昨天说的高速路上的L3,我相信应该是英雄所见略同,婷婷能不能分享一下,从现在开始到今年底在可见计划里可以对外说的部分,可以跟直播间观众们分享一下吗,还有哪几个关键里程碑可以让大家提前知晓?
袁婷婷:一是云端AI基座大模型的下一步:蒸馏上车,这件事在年内会实现。小鹏目标的下一步是通过我们极强的云端基座大模型,加蒸馏、加强化学习的方式,能真正意义上形成跨代式的变化。
我也经常看第一电动的直播,而且我觉得第一电动的天梯榜做的特别好,因为客观又透明,客观就是大家都是直播的,怎么扣分、怎么计分现场都可以看到,所有网友都是监督者,二是车友自己报名,都实时呈现在大家面前,我觉得特别好,我对我们产品的下一步是真的让大家只要上车就能感觉跟上一代产品是两代产品。上次我得到这种感觉是端到端上车的时候,行业内的人一上车就知道端到端和规则是两个时代,规则已经做的很好了,已经是无图了,但端到端一上车,一上手就知道有没有,下一个时代是当我们的基模蒸馏真的有最强大脑出现时,当新的图灵芯片上车时,我希望让大家看到一上车就知道不一样,让你感受到这样的感觉,这是我们今年最大的期望。
庞义成:那个不一样的程度类似于去年端到端上车和规则的区别。
袁婷婷:是的,这就是我们说的跨代变化,有点像行业内经常说的iPhone4时刻。
庞义成:非常期待这个时刻。
袁婷婷:希望年底前让大家看到这个变化的不同。另外我相信今年在安全和企业,在场景的覆盖度上,在功能点上,大家应该会看到整个行业都能够往前走一步,这也是必然的,而且我相信今年随着政府部门对企业更高的要求,安全会提到更加重要的位置,这是件好事。一开始我们就聊到了这个话题,其实去年10月左右的时候,我们开了一个分享会,看到行业里有很多乱象,大家怎么对消费者做宣传,可能有一些Over的部分,对于大家来说、对于行业来说这是不是好事,其实也不一定,但到今天政府做出规范性引导,给大家明确的指向,能够让大家投入更多关注在安全和体验上,这对行业是很好的引导,相信今年行业会更好地往前走。
庞义成:回应婷婷刚才的观点,我完全赞同,虽然开场时我揶揄了一下这个尴尬时刻。实际上主管部门对这次智驾的监管,我们理解这是一次,由于前段时间赛道技术迭代速度太快,客观上法规是没有完全跟上的,这是第一。第二,投资有点过度,营销有点过度,确实导致市场暂时失灵了,在市场失灵的情况下,这是一个涉及千千万万人身安全的巨大赛道,出于保护这个赛道和消费者的角度出发,政府部门有必要干预,市场失灵时你是要干预的,不干预容易出大问题,所以我个人对这次监管持正向态度,不像大多数朋友说的管得过多了,只不过大家有点过于紧张了,我们要理解主管部门的初衷,肯定是要把脏水泼掉,但孩子不可能泼掉。
袁婷婷:让行业更加科学、健康、合理地发展,能够感受到主管机构的关心。我想到一件事情,不知道小鹏地您知不知道在行业内第一个推出开智驾要考试的公司就是小鹏。
庞义成:我知道,但在行业内对智驾管制最严格的公司是特斯拉,上次我们借来第一台车到手时发现已经有两次脱手了,就剩一次了。当时我们不理解为什么它这么严格的惩罚措施。
袁婷婷:特斯拉那个是因为它允许你更长时间的脱手,特斯拉的脱手政策和国内众多同行脱手政策是不一样的,它几乎允许你全程脱手,但它要求你脱眼的时候监控更加明确。而这个允许脱手不允许脱手的策略也是V12以后才出的,这也是它产品策略设置的一部分,你说严格吧,它允许你脱手;你说它不严格吧,三次以后就不允许你用了。
庞义成:我们可以看到未来一段时间关于智驾安全的技术进步会迭代很快,更让我们向往的是今年你们的蒸馏模型上车,实现一大步的跨越。
袁婷婷:可以在众多场景里看出比原来有数倍的增长。
庞义成:我们先想象一下它能解决哪些问题,我来提问,能说的部分你说是,不能说的部分你不说就行了。
天梯榜分场景、安全、效率,场景这块目前4月号第一名是理想,第二名是Momenta,反正前三名就是理想、华为、小鹏、Momenta这几个,但其实在我们心里真正的第一名是特斯拉,只是不满三次,不能列入排行,但在我们测试里特斯拉太强了,尤其是到陌生地方、陌生城市、陌生地库、陌生车位,它根本不需要学习,也不需要扫图,就是进去东张西望,自己找地方去了,在我们看来这是真正的全场景无断点,如果它不是对有些交通标识不熟悉的话,它真的就无所不能了,所以我第一个问题,模型上车以后,特斯拉这种全场景能力是不是小鹏也具备了?
袁婷婷:上次在香港开WorkShop的时候有一个视频,可能大家在网上看到过,是网友拍的,一辆在中国大陆两地牌的车,一个网友开着这辆车去了香港,其实我们从来没有拿香港的数据做过Overfed(音),完全没有过,香港还是右舵车,大陆是左舵,即使这种情况下我们也开得特别好、特别顺畅,好像能理解那边环岛怎么过,那边的标志也能理解。
庞义成:而且也没有走到逆行道上去。
袁婷婷:这个过程中体现了一点点。我怎么理解这个世界的过程。回到人类,我是非常喜欢自驾游的人,我经常会去一些陌生的地方,在陌生的地方我如何认识这里的路,认识这里的标牌,知道我接下来要开什么路,导航怎么看、我自己怎么开,人类是怎么理解的,眼睛+大脑,当然手脚要控制,所以我们的大模型本质上就是在做一个像人类思考链路一样的思考,我看到了什么东西,我理解了这件事情,所以我接下来要怎么做。
和你刚才说的话题,其实它的本质逻辑是一样的,本质逻辑上什么叫做全场景无断点,现在我们说全场景,当然小鹏现在已经是全国都能开了,本来就是全场景,包括车位到车位,园区内都能开,我们已经有园区漫游的功能。但我讲一下这件事情的本质是什么,本质还是你要以理解的角度,而不是以割裂的、场景的角度去想,以前可能认为我先解决高速,接着解决城市,接着解决掉头,接着解决左拐右拐,一步步走,这是一种做法;还有一种做法,OK,今天我给你换了个脑子,你脑子特别聪明,不用先解决高速再解决城区,而是直接看标志牌、理解交通规则就行了。
我说年底那次很大的突破,很大的不同,本质上就是换脑子的过程。
庞义成:本质上就是和特斯拉一样真正打通天与地,感觉像给整个系统注入灵魂的过程。这是第一个问题,谢谢婷婷老师的回答。
第二个问题,从目前看,今年内能够上车的话,到那步是不是可以说到L3应用的条件,技术准备已经完成了?
袁婷婷:我们先来讲L2和L3的重大区别是什么,可能很多用户朋友不一定了解。L2或L2+作为高级辅助驾驶,辅助驾驶本身就是所有责任在人,人可以短时间分神,但需要保持注意力随时接管,到L3的程度就是有一段责任是从人转移到保险公司/主机厂/自动驾驶公司,责任的转移是L2和L3最大的区别,本质上我们要做什么事情才能满足L3?
1、国家和政府出台L3合规准入的条件。2、做好硬件冗余。因为在L3和L4的过程中有可能会出现一些意外的状况,这时候会有冗余的各种组件硬件上车,包括传感器、电子电气架构,也包括跟算力有关的一系列冗余上车。3、在L3下大部分场景,辅助驾驶系统会大幅度帮你解决99.9%的问题,而只剩下一点点的问题,有限的问题需要你自己解决,这属于庞老师说的,脑子要极其聪明才能进入到这里。
对于大家来说,验这个车是不是达到了L3的水平,其实很简单,一点不负责,第一它有没有过了国家的合规准入;第二,是不是全套都做了冗余,这相当于配了一套额外的硬件成本,大家都能看到;第三,你上车以后发现接管次数和需要介入的部分已经比你开L2的时候少了1/10甚至更多,绝大部分不用管。
在现在的情况下,相信很多消费者,无论是小鹏的车友还是其它友商,大家每次开完一次零接管还是很开心的。
袁婷婷:1个小时、2个小时零接管,今天开的真是太棒了。到了那个阶段希望大家习以为常,宠辱不惊,不用再骄傲地宣称我今天零接管了,不是的,你每天都会遇到这个状况。
庞义成:是的,其实关于L3这个事,业绩比较积极的代表型企业,除了华为之外就是小鹏,因为小鹏同学本人也多次在公开场合说过,2025年下半年就可以看到L3量产上车的那一刻。
袁婷婷:带来L3的体验。
庞义成:从逻辑上看L3体验的那一刻就是模型上车的那一刻,联系到今天我们跟华为的互动,相关法律法规其实已经准备好了,准入工作已经开始了,华为昨天在会上公开宣称今年下半年实现高速车商用场景的L3,我觉得这肯定不是话为自己一家企业的事,应该是整个行业的事,对你们来说,在技术上的准备应该是同步已经完成的?华为实现的小鹏应该也能实现?
袁婷婷:因为我自己是特别喜欢测车的人,每次测华为的车我都觉得有惊喜,我觉得他们在辅助驾驶技术的积累和深度上是非常深的,他们能够往前走到这一步,小鹏往前走到这一步接着就会引领整个行业更快地往前走,这是一件非常好的事情,相信整个行业都会比较快速地以势不可当的趋势往前继续进步。
庞义成:是的,两家公司在技术路线和思考上还是有所不同,说一下我的感受,我今天特别在现场向华为的工程师请教了,上了大模型之后规则是不是要大大弱化?没想到得到的答案不是的,让我有点惊喜,工程师说不是,说我们仍然强调规则兜底的重要性,对我们来说强大的规则恰恰是我们的优势,我们要在规则的基座上建立大模型的顶盖。
记得那天在香港我们也聊到这个问题,对于小鹏来说早年间做了大量规则的储备,对于后期的强化学习有帮助,但小鹏并不会说引入大模型蒸馏上车以后还要由规则兜底,对吗?
袁婷婷:我觉得首先不同的公司在同一个行业里有不同的技术路线是一件非常非常正常的事情。就拿今天的AI来讲,OpenAI和DeepSeek和Kimi是不是用同一个技术不一定,但大家都是非常优秀的公司。我认可上一个时代的积累会在这一个时代仍然起到非常关键的作用,AI发展的特别好的前提是AI的基础工程做的好,基础工程核心需要非常强的工程体系和工程能力,华为在这件事情上很强,小鹏也在这件事情上很强,这两件事情都是上一个时代的关键积累。
而规则也是,上次我们聊到过,大家可能会认为规则是上一个时代的包袱,但事实上规则也可以成为这一个时代很好的奠基基础,比如在我们奖励模型的设计上,第一代从零到一的奖励模型,规则就给了我们很多启发,如何设置这个奖励模型,可能对于我们的其它友商来说,用规则设计安全兜底,这也是非常有效的手段,我觉得都是很好的方法,而且的确我看到一些非常优秀的友商在一代又一代的技术浪潮中,每一代都能漂亮华丽转身,这件事情更不容易。说明这个团队有持续的、强大的生命力。
庞义成:自我学习、自我迭代的能力。
袁婷婷:自我学习、自我迭代、自我革命,再自我升级的涅磐的能力,一次成功也许是偶然,但每次都能成功这中间一定有必然的成分在。
庞义成:是的,这一点说得特别好,智能驾驶,AI这场革命在过去三年来从全球掀起,在国内首先落地的场景就是智能驾驶,也是目前可以明确看到希望的场景,赛道规模巨大,才会有这么多优秀人才、无数资本涌进来。
但过程中我们会看到,优秀的团队越跑越快的核心原因就是刚才婷婷说的那句话,内心深处他们向往星辰大海,但他们又非常实事求是,脚踏实地,不断试错,错了马上改,不断更新自己,这样才能真正跑出来。我曾经跟Momenta的团队聊过,他们说过一句话让我印象很深,他们说把这行干好有几个条件:1、团队必须是学霸构成的;2、学霸们必须趴在地上干苦活;3、还得长年累月地干。
袁婷婷:我真的有感触,的确是这样。漂亮话是说出来的,但事情是做出来的,说到又做到,这件事情很不容易,而且是数年、十年如一日的不容易。我自己觉得很幸运加入小鹏的自动驾驶中心,我在这个中心里遇到了非常我认为是全球最顶尖(而不只是中国最顶尖)自动驾驶行业里的同事,见到他们,可以跟他们一起去面向我们成为全球第一的团队,去努力、去拼搏、去脚踏实地地呈现出这些产品来,给到我们的用户们,我觉得我非常非常幸运。
庞义成:是的,我们一块儿期待婷婷和她优秀的同事们在今年下半年某个时刻给我们呈现出她刚才描述的令人激动的那一刻,那一大步的跨越,看看那个时刻我们的体验到底是怎样的。
袁婷婷:说到要做到。