2025中国智驾开发者50人(第五期)
2025年度,谁在推动智驾进步?我们推出《2025中国智驾开发者50人》系列,分5期刊发,这是第五期。
入围的80多位候选人,绝大多数在国内,少数在国外,个别是海外华人。他们的研发成果,体现在过去两年里发生的两次智驾拐点上。但其中的大部分,都很低调。
入围的标准有两条(个别极其优秀者例外):
1、2025年内,在全球顶会顶刊发表高引论文的第一作者(含合著团队);
2、2025《智驾天梯榜》年度榜单上榜方案商和主机厂的核心研发人员。
经过核实与比对,最终挑选出50位有代表性的人物。他们的身份,大体分四类:
1、学术研究者,在顶会顶刊上发表高引论文的作者(含合著团队);
2、研发组织者,定投资、定方向、定目标、定范式、定团队的人,类似奥本海默;
3、研发骨干,负责某一个具体方向的研发统筹,并和兄弟们一起拼搏出成果的人;
4、产品和工程负责人,负责产品定义、用户交互、工程实施的人,做出了非常棒的产品体验,或者保障了连续的工程交付表现。
继第一期推荐11篇卓越论文的作者们,第二期记录理想汽车、小鹏汽车和Momenta,第三期记录特斯拉和华为,第四期记录博世中国、地平线、文远知行的智驾产研和工程负责人之后,本期(第五期),记录蔚来、小米、极氪、元戎启行的智驾的关键人物。
1、李斌:布道者的转身
职位:蔚来创始人、董事长、CEO

2024年底的蔚来还深陷“亏损泥潭”,被外界质疑能否活过2025年;而到2025年底,蔚来不仅实现12月交付量突破4.8万台、第四季度摸到盈利门槛,更在智驾领域站稳自研脚跟,完成了一场惊艳的“逆袭”。这场反转的核心推手,正是创始人李斌。
2025年对蔚来而言是生死存亡的关键一年,智驾领域更是深陷“研发投入受限+核心团队调整”的双重困境,而李斌作为企业掌舵人,用精准决策和务实举措带领公司破局,不仅守住了生存底线,更为智驾发展找准了方向,其核心贡献集中在两大维度:
一是推动公司全面“瘦身”,为智驾保留核心生存空间
面对企业濒临危机的现状,李斌率先启动“思想+经济”双重瘦身改革,核心思路是“摒弃虚耗、聚焦核心、以结果为导向”。
曾经的的蔚来,管理上的确有点“大户人家”的坏毛病。而李斌本人也像个理想主义的领袖,因为他有着宏大的梦想,内心充满了对未来美好生活的期待,总想给用户最好的,但结果就是成本控制一塌糊涂。
2025年,李斌最狠的一刀,是砍向了自己。在经济层面,他果断压缩非必要开支,尤其是与核心业务无关的个性化投入,把有限资金集中倾斜到智驾等关乎企业未来发展的关键领域,即便整体研发预算受到制约,也最大程度保障了智驾核心研发的基本需求,避免因资金断档导致项目停摆。思想层面,他统一全公司思想,打破过去部分“重理想、轻结果”的惯性,强调“生存优先”的核心目标,让包括智驾团队在内的所有部门都围绕“实际成效”开展工作,减少无效内耗,提升决策和执行效率。这一系列举措不仅缓解了公司的资金压力,更让资源配置更趋合理,为智驾团队在困境中坚持研发、寻求突破提供了必要的土壤。
二是智驾战略重大调整:从“多路并行”到“聚焦世界模型”,明确发展方向
2025年是蔚来智驾面临压力的一年:一方面企业为了求生存,不得不压缩成本开支,研发投入、研发进展、算力部署都受到影响;另一方面核心团队出现重大调整。但在重压之下,李斌做出了关键决策,智驾战略由多线作战,聚焦到任少卿这里做世界模型。“因祸得福”这个决定成为了2025年蔚来智驾的转折点。
过去蔚来智驾同时推进多个技术方向,分散了有限的人力、财力和算力资源,导致进展缓慢、难以形成突破。如今,聚焦核心,将所有智驾研发资源收拢到任少卿团队,推行世界模型的研发体系。这种模式能实现从技术研发到落地应用的贯通,减少部门间的协调成本,让资源集中发力于核心目标,快速明确了智驾发展的核心方向。
2025年,李斌的核心贡献在于“以生存为底线,以聚焦破困局”。他通过全面瘦身改革为企业守住了生存根基,更在智驾领域的关键节点做出精准决策,摒弃了分散资源的落后模式,以世界模型聚焦研发的战略,让蔚来智驾在投入受限、团队调整的双重压力下,不仅没有停滞,反而明确了发展路径、凝聚了核心力量。最终,蔚来不仅打赢了2025年的生存战,更让智驾能力摆脱了过去的落后状态,同时,为2026年加大AI投入,增加了更多的筹码,充分体现了他在企业危机时刻的决策力和担当。
2026年一季度,中国智能驾驶将迎来真正的交锋时刻。特斯拉“满血版”FSD将在华全面落地、小鹏第二代VLA即将内测、华为ADS4.1强势来袭、地平线和Momenta等供应商也蓄势待发。蔚来能否凭借世界模型2.0,在智驾“战国时代”脱颖而出,答案即将揭晓。
2、任少卿:蔚来智驾的“灵魂”
职位:蔚来汽车副总裁、智能驾驶研发首席专家

任少卿在2025年,为蔚来在智驾技术突破方面做出了里程碑式贡献,精准解决了蔚来智驾发展中的核心技术瓶颈问题。
一、2025年核心突出贡献
1、主导蔚来世界模型研发落地
任少卿在2025年10月蔚来CNCC技术论坛上,系统披露了其团队主导的蔚来世界模型(NWM)核心进展——构建出具备深度理解与预测能力的通用时空认知系统,这一成果并非单纯的技术概念,而是已进入工程化验证阶段,为蔚来下一代智驾系统奠定了核心技术框架。该模型的落地,让蔚来智驾从场景化功能堆叠转向通用化认知决策,成为行业内少数实现这一技术跨越的车企之一。
在世界模型研发中,任少卿提出“安全优先的时空认知”技术路径——区别于行业内部分企业追求炫技式功能,他带领团队先聚焦事故率降低核心目标,通过强化学习让模型持续学习不同场景下的安全驾驶逻辑,同时融合激光雷达、摄像头、毫米波雷达的多模态数据,构建360度无死角的环境认知体系,确保模型的决策安全性与准确性。
2、以奠基性技术获国际顶级荣誉
2025年11月,任少卿领衔团队凭借十年前提出的“FasterR-CNN”技术,斩获人工智能领域顶级奖项——NeurIPS(神经信息处理系统大会)“时间检验奖”,成为首位获此殊荣的中国学者。这一奖项被誉为“AI界奥斯卡”,其核心价值在于认可该技术经过十年产业验证,对全球AI发展产生了深远影响。对蔚来而言,这一荣誉不仅打破了国际市场对中国车企“技术跟随”的刻板印象,更直接提升了蔚来智驾技术的行业话语权与用户信任度。
二、重点解决的核心问题
1、蔚来的世界模型是什么?
2024年7月底,任少卿在2024 NIO IN(蔚来科技创新日)上发布蔚来世界模型(NIO World Model,简称NWM),宣布蔚来智驾从“感知驱动”转入“认知驱动”的新阶段。
蔚来的世界模型,是车端实时决策的大脑,采用云端训练+车端推理的双架构,直接通过生成式模型(如SORA)从原始传感器数据生成控制指令,跳过语言中间层,为动态场景生成轨迹规划。
蔚来这种一步到位、在车端构建一个平行世界引擎的设想,堪称大胆。仅“通过自监督学习直接处理原始传感器数据,无需人工标注”这一条,就把所有友商都比了下去。
其底层逻辑,是把“感知-决策-控制”整合为统一的生成式模型,现看、现想、现做,一切都在车端瞬间完成。这是通用人工智能的表征,如果实现,绝对是“颠覆式创新”。
2、蔚来的世界模型与华为、理想的世界模型有什么区别?
首先华为华为智驾走的是“车端是世界模型,云端是世界引擎”的道路,华为的WA,也就是world action,中间省掉language 这个环节,直接通过 vision 这样的信息输入控车,而不是把各种各样的信息转成语言,再通过语言大模型来控制车。”
其次华为强调多传感器融合算法(主要是摄像头和激光雷达)形成精准数据,降低车端模型的算力要求,主算需求置于云端;而蔚来则希望在车端通过视觉生成模型+自主监督学习一栈式解决问题,其技术构想更激进、车端算力要求更高。
另外,华为智驾高度依赖标注数据与仿真生成的混合训练,而蔚来则强调采用无监督学习与自监督学习,直接处理原始传感器数据。也就是说,华为走的是一条“规则引擎+端到端模型”的混合路线,而蔚来走的则是一条纯数据驱动路线。
与理想的世界模型相比,虽然两者都叫世界模型,但蔚来的WM,和理想提出的世界模型,也有着根本性的不同。理想的世界模型则以“仿真训练+场景验证”为核心,主要部署在云端,作为端到端+ VLM系统的“考试系统”。蔚来的世界模型,则是车端实时决策的大脑,采用云端训练+车端推理的双架构。
3、为什么需要世界模型,它相比VLA的有什么不同?
任少卿认为VLA 路线的优势在于:短期效果明显、与大语言模型生态协同度高、在复杂语义理解上表现突出。
但是,这是一条借鉴语言模型已经验证的路径。它的本质是在现有的语言模型基础再加上一个vision到language的插件,或者说一个转码器。虽然这样的方式借助了VLM来获取更多互联网数据,但距离理想中将绝大多数真实世界数据都转化为模型能力还差得很远。
因而,在实践中就会出现一个问题:语言模型及其各种变体对于真实世界的理解存在缺陷,或者说能力上限不够高。
例如,如果用当前的通用语言模型或 VLM 去询问关于速度、距离、安全的问题,它们可能给出定性的回答,但定量回答往往不准,包括对物理规律的理解也是如此。
这种对真实三/四维时空认知的缺失,根源在于当前大语言模型的训练数据以文本为主,图像为辅,视频数据极少。未来语言模型可能会融入更多视频和数据,但现状就是如此。
他认为仅靠图像是学不到这些物理量的,必须基于视频等,人类需要知道视频中的物体是如何运动的,才能学到这些东西。
因而,要做好智能驾驶,就需要一种更新的能力,这是为什么还需要世界模型的根本原因。目前,蔚来正在直接利用海量视频数据来训练自动驾驶或机器人的技术模型。
4、强化学习解决了什么问题?

首先,模型的逻辑性更好,因为训练中加入了代码、数学题等能够明确判断对错的数据,解决问题的范式发生了根本转变,不再是Code 1.0的遇到问题添加规则,也不是Code 2.0 遇到问题添加数据,而是转变为遇到问题我给你打分。
模型输出结果后,系统根据好坏给予正负反馈,让模型自行学习应该生成什么样的结果。在这个过程中,首先机器会有自监督过程的。主要路径则有两种:一种是reward分数器,另一种是使用数据,比如说人类行为反馈的数据,让reward反推出来。
比如,在通过左转路口时,构建一个仿真环境,并在该环境中,设定一条目标线。车辆成功越过给予奖励,且用时越短奖励越高。如此循环训练,当然,过程中会有一些更细节的专家数据约束,比如如果压实线,我再给你扣两分等。除此之外,几乎没有其他复杂规则。具体在哪个点位变道,如何安全通过三条车道,这些都由模型自己在仿真中探索解决。
这样做的好处主要有两点:第一,没有增量数据,只要仿真环境中能构建出类似的路口场景,逻辑上来说就是泛化。第二,它没有复杂的规则,也就避免了规则之间的冲突。
3、叶航军:小米智驾突破的“领航者”
职位:小米集团技术委员会主席、小米汽车自动驾驶部总经理

背景:
2012年加入小米,负责云技术并筹建人工智能部,担任人工智能部总经理。2021年小米宣布造车时,其主动请缨担任自动驾驶部总经理,团队核心成员包括分管端到端技术的陈光、负责VLA的陈龙及主导L3项目的王乃岩。截至2025年,其领导的智驾团队规模超1800人(含108位博士)。
主要贡献:
叶航军作为小米智能驾驶业务总负责人、集团技术委员会主席,同时也是小米汽车初始17人核心团队成员,凭借清华计算机博士背景及在Google、腾讯的技术积淀,在2025年成为小米智驾从“追赶者”跃入“行业第一阵营”的关键推手。精准解决了小米智驾此前存在的“场景覆盖不足、系统响应滞后、用户体验差”等核心问题。
一、2025年核心突出贡献:从技术到产品的跨越式突破
1、主导“端到端+VLM”技术架构落地
2025年,叶航军的核心技术贡献是推动小米智驾完成从“基于规则的模块化架构”到“数据驱动的端到端架构”的关键转型,并融合视觉语言模型(VLM)形成“端到端+VLM”的新一代技术。该架构通过单一神经网络覆盖“环境感知-决策规划-行为控制”全流程,彻底打破传统模块化架构中“感知、决策、控制”各环节的信息损耗,使智驾系统的驾驶行为更接近人类(如复杂路口避让、变道博弈更自然),而非机械化的功能堆叠。
2、带领团队实现3个大版本的高效迭代
在叶航军的统筹下,2025年小米智驾团队创造了“1年迭代3个重大版本”的纪录:从2025年初的“300万Clips端到端版”,到年中的“1000万Clips端到端版”,再到年底的“HAD增强版”落地,完成了雷军提出“进入第一阵营”的目标。同时,他推动“三地研发中心(北京、上海、深圳)同步开发”模式,将算法优化、仿真测试、实车验证等环节并行推进,使单个版本的研发周期大幅度缩短。
二、重点解决的核心问题:直击小米短板
1、破解“极端场景识别延迟”的安全隐患,弥补事故暴露的技术漏洞
2025年3月,小米SU7曾因“施工路障识别延迟”引发事故,暴露了传统“毫米波雷达+视觉”融合方案的局限性,在特殊路况下两种传感器数据无法有效互补,导致系统误判。叶航军针对该问题快速推动技术升级,在端到端架构中加入“多模态数据冗余融合”逻辑。
2、突破“边缘场景(CornerCase)处理能力不足”的行业共性难题
传统智驾系统对“不常见物体(如路边石墩)”“非标准路况(如无标线乡村路、临时改道路段)”的处理能力薄弱,这也是小米此前用户投诉的主要痛点。叶航军通过强化VLM视觉语言模型的应用,从根源解决该问题,VLM模型能将“视觉图像”转化为“语义理解”,例如识别出“消防栓=不可碰撞障碍物”,并结合人类驾驶数据训练出“灵活绕行策略”。
如果说雷军是小米汽车的“精神领袖”,那么叶航军就是小米汽车2025年智驾突破的核心推动者,从技术架构到产品落地的领航者。他和他的团队,完成了小米智驾从0到1再到10的关键跨越。
4、陈光:小米智驾技术落地的”操盘手“
职位:小米智能驾驶端到端技术负责人

背景:
陈光毕业于美国密苏里大学电子计算机系,获博士学位,并在人工智能顶级会议(如CVPR、NeurIPS)发表多篇论文,专长于计算机视觉与AI领域。
曾任百度Apollo美国研发中心感知系统技术负责人,主导自动驾驶感知技术研发。曾担任一汽南京研究院CTO,负责一汽集团自动驾驶业务整体架构,并带领团队开发红旗第三代L4级全无人Robotaxi。
2025年5月正式加入小米汽车,出任辅助驾驶感知负责人,向小米辅助驾驶负责人叶航军汇报。其核心职责包括:
统一管理所有智能驾驶路线的预研团队,涵盖WA(世界行为模型)、VA(视觉-行动模型)等主流技术路径,确保小米在技术探索上不“一刀切”,而是以用户体验为最终标准。
主导端到端技术路线的研发,推动小米智能驾驶从高精度地图向无图方案演进,并在2024年3月SU7上市后实现“一年追三代”的技术迭代。
协调团队资源,小米智能驾驶团队采用三条战线并行架构,除端到端和VLA(视觉-语言-行动模型)外,其他路线预研均由陈光直接统筹。
主要贡献:
作为小米汽车端到端算法与功能部负责人,陈光在2025年主导完成小米智驾从“数据驱动”到“认知驱动”的关键跨越,同时通过多路线预研规避技术风险,是小米智驾追赶的关键核心。
1、主导端到端智驾系统落地,实现“认知驱动”技术跨越
陈光在2025年的核心成果,是带领团队完成三次重大端到端(HAD)系统推送,最终在广州车展发布“XiaomiHAD增强版”,标志着小米智驾正式迈入“世界模型+强化学习”的认知驱动阶段。
2025年2月:向全量用户推送“300万Clips端到端版本”,首次实现小米智驾从“规则驱动”到“端到端驱动”的转变,复杂城市场景响应速度较传统方案大幅提升;
2025年7月:推送“1000万Clips端到端版本”,通过更大规模数据训练优化模型泛化能力;
2025年11月:在广州车展发布“XiaomiHAD增强版”,首次引入“世界模型+强化学习”框架,使系统具备“理解场景因果、自主探索策略”的能力——纵向跟车加减速、横向变道策略更平顺。
2、统筹多路线预研,构建小米智驾“技术护城河”
面对2025年智驾行业“VLA(视觉语言行动)、VA(视觉辅助)、WA(世界模型辅助)”路线混战的局面,陈光提出“主路线攻坚+全路线预研”策略,避免小米陷入“技术掉队”风险。他带领团队深耕端到端技术,将其作为现阶段量产核心,亲自管理“路线预研团队”,完成对WA、VA等市面所有主流路线的系统性研究(VLA路线由陈龙单独负责),形成“端到端为主、多路线备份”的技术储备——无论未来行业风向如何变化,小米均能快速切换技术方案。
3、推动安全辅助功能升级
在技术迭代的同时,陈光同步主导安全辅助功能的优化,填补小米智驾在低速防护与紧急避让的短板,新增前向低速防碰撞辅助(LAEB,覆盖1-135km/h)、后向低速防碰撞辅助(RAEB,覆盖1-30km/h),支持墙壁、立柱等静态障碍物识别;新增紧急转向辅助(AES),在80-135km/h高速场景下,当制动无法避撞时,系统可300毫秒内完成“识别-决策-避让”,且设定“能刹不绕”优先策略,确保安全冗余。
重点解决的核心问题:直击行业痛点
4、突破强化学习在智驾应用的两大行业难题
智驾行业内强化学习技术落地面临“世界模型保真度不足”与“并行探索效率低”的双重瓶颈,陈光带领团队针对性解决,在世界模型中植入“海量可编辑数字资产”,模拟极端天气(暴雨、大雾)、复杂路口等场景,确保虚拟环境与真实路况的一致性,使模型训练效果可迁移至实车;再通过设计“场景分层探索策略”,简单场景减少探索以节省算力,复杂场景(如加塞、施工路段)增加探索频次,结合异步并行训练架构,使模型单日可积累相当于人类驾驶员多年的虚拟驾驶经验,大幅缩短训练周期。
陈光团队的世界模型并非单纯的“仿真工具”,而是具备“场景编辑+因果推理”的核心能力。可自定义生成“天气(晴/雨/雾)、路况(施工/加塞/特殊路口)、交通参与者(行人/非机动车/大型车)”等参数,生成10万+种复杂场景,可覆盖大部分的真实驾驶痛点;还可以通过生成式AI模拟“不同驾驶决策的后果”(如“不减速会撞向护栏”“变道会与后车剐蹭”),使模型理解“为何需要这样驾驶”,而非单纯模仿人类操作,例如在复杂路口,系统能提前规划路径,避免“走错车道”。
另外,陈光团队不盲目追求数据规模,而是通过“数据筛选+闭环迭代”提升模型效果。通过高价值场景(如暴雨天施工路段、无标线乡村路)”训练,确保数据质量;并建立“路采-训练-OTA-反馈”闭环,通过实车路采数据反哺模型优化,然后OTA推送给用户后,再收集用户使用数据(如接管场景、投诉反馈),进一步迭代,形成“数据越用越优”的良性循环。
5、陈龙:小米智驾技术的”革新者“
职位:小米智能驾驶VLA负责人

背景:
陈龙是小米智能驾驶VLA技术负责人,2025年加入小米,主导开发了统一具身智能与自动驾驶的开源模型MiMo-Embodied,并入选《麻省理工科技评论》亚太区“35岁以下科技创新35人”。MiMo-Embodied模型已应用于小米YU7车型,端到端系统基于1000万Clips数据训练,提升辅助驾驶沟通与推理能力。推动小米“轻量化+端侧部署”AI战略,通过XLA大模型整合手机、汽车、家居生态,强化“人车家全生态”竞争力。
2025年加入小米前,任英国AI公司Wayve主任科学家,专注纯视觉端到端自动驾驶技术研发。
主要贡献:
1、将VLA模型引入小米智驾,定义“可解释决策”
2025年,陈龙的核心技术贡献,是将视觉-语言-行为(VLA)模型首次系统性应用于小米智能驾驶,打破传统端到端系统“只执行、不解释”的局限,VLA模型通过“视觉感知+自然语言理解+行为决策”三模态融合,让智驾系统具备“用语言思考、用逻辑解释”的能力,例如减速时会主动输出“正在减速,因为预测到右侧行人可能横穿马路”,变道时会说明“即将变道,因前方车辆速度低于限速20km/h”,彻底解决传统系统“黑盒决策”导致的用户信任度不足问题。
2、主导跨域开源模型MiMo-Embodied研发,打通“具身智能+自动驾驶”技术壁垒

陈龙团队在2025年发布首个统一具身智能与自动驾驶的开源模型MiMo-Embodied,解决行业长期“两领域技术割裂”的难题:
一是性能领先性:该模型在17项具身智能任务(如物体抓取、空间规划)和12项自动驾驶任务(如场景感知、行为预测)中全部取得领先,其中在“RoboRefIt物体定位”“CODA-LM复杂场景理解”“DriveLM驾驶规划”等核心基准上均排名第一,部分任务精度较行业专用模型提升15%-22%;
二是工程价值:模型基于小米MiMo-VL基座模型开发,首次证明“空间理解、因果推理”等底层智能能力可跨域迁移——例如机器人识别“桌面物体可操作部位”的能力,能帮助汽车更精准判断“道路护栏、施工围挡”的边界,以及汽车处理“动态交通流”的逻辑,并可优化机器人的“避障路径规划”。
陈龙主导的MiMo-Embodied模型通过“跨域训练框架”,让模型同时掌握“识别桌面杯子可抓取部位”(具身任务)与“识别道路护栏不可碰撞”(自动驾驶任务)的能力,底层的“空间理解、动态预测”能力可相互迁移,避免小米在两个领域“重复造轮子”,为后续机器人、智能家居与汽车的协同奠定基础。
3、推动XLA大模型落地
在VLA基础上,陈龙进一步研发XLA多模态大模型(扩展视觉、听觉、激光雷达等更多模态),并于2025年在小米YU7车型上实现规模化落地:
落地效果:小米YU7搭载基于1000万Clips数据训练的XLA端到端系统,复杂路况处理能力显著提升,纵向加减速平顺性更好(避免“急刹急加速”),横向变道决策速度更快(应对突发加塞更及时),窄路会车、无标线乡村路等长尾场景的“接管率”更低。
研发支撑:陈龙推动小米投入专项资源保障落地——截至2025年中,小米汽车智驾投入测试车辆超400台,同时联动小米AI实验室,将MiMo基座大模型的算力与数据能力注入XLA模型,缩短训练周期40%。
4、破解传统端到端系统的“黑盒+长尾”双重困境
传统智驾端到端系统依赖千万级视频数据模仿人类驾驶,存在两大致命问题:无法解释决策逻辑(黑盒)、无法应对未见过的场景(长尾)。陈龙通过VLA/XLA模型从根源解决这两个问题,面会黑盒问题,VLA模型的“语言推理模块”让系统能输出决策逻辑,例如识别“潮汐车道”后,会解释“检测到潮汐车道,当前可通行”,用户可清晰理解系统行为依据;遇到长尾问题,XLA模型引入“互联网通识数据”(如交通规则、物理常识),面对未训练过的场景(如临时施工路段、三轮车横穿),可通过“常识推理”生成策略——例如根据“施工围挡=禁止通行”的常识,自动规划绕行路线,无需依赖预设场景库。
6、王乃岩:小米L3自动驾驶落地的”守护者“
职位:小米汽车自动驾驶技术负责人

背景:
王乃岩,2015年于香港科技大学计算机科学专业获博士学位,现任小米汽车自动驾驶技术负责人。高中阶段保送浙江大学计算机专业,大二时期获得ACM国际大学生程序设计竞赛亚洲区域赛金牌,博士期间成为全球首个将深度学习技术应用于目标追踪领域的学者,相关研究成果被计算机视觉与机器学习领域顶级会议收录,并作为MXNet深度学习框架核心开发者。
2015年加入自动驾驶企业图森未来,深度参与北京公司算法团队组建及校招工作,2019年升任图森未来中国首席技术官,主导L2辅助驾驶与L4自动驾驶系统研发。2023年9月在第三届商用车自动驾驶大会上提出基于全冗余架构的L4技术路径,发布整合域控制器的TS-Box方案和节油领航智驾系统。
2024年3月从图森未来离职后,于5月23日经官方确认加入小米汽车,负责自动驾驶技术研发,该人事变动被视为主机厂吸纳自动驾驶高端人才的标志性案例。
主要贡献:
2025年核心突出贡献:L3技术与安全体系搭建。
1、主导L3级自动驾驶技术攻坚
王乃岩团队在2025年的核心成果,是推动小米L3级自动驾驶在“高速封闭场景+城市快速路”两类核心场景下实现技术闭环,达成“驾驶员无需持续监控”的关键目标,这一进展使小米成为国内少数完成L3特定场景技术验证的车企之一。
2、构建“全方位冗余体系”,填补L3级自动驾驶的安全漏洞
针对L3级自动驾驶“系统失效即引发安全风险”的核心隐患,王乃岩主导设计“架构+硬件+算法”三位一体的冗余方案,彻底解决传统智驾系统“单一故障即瘫痪”的问题,该方案被《汽车工程》期刊评价为“L3安全设计的标杆案例”。
架构冗余:搭建独立的“主控制系统+备用控制系统”双链路,供电、通讯、计算模块均配备备份(如主电源失效时,备用电源可在50ms内切换供电),确保任一模块故障时,系统仍能稳定运行;
硬件冗余:推动小米智驾硬件“全系标配多模态传感器冗余”,车辆搭载激光雷达、摄像头(覆盖360°无死角)、毫米波雷达(冗余感知),避免单一传感器失效导致的感知盲区;
算法冗余:开发“多源数据交叉校验算法”,让激光雷达与摄像头的感知结果实时比对,例如激光雷达检测到“前方有障碍物”而摄像头未识别时,系统不直接决策,而是启动“毫米波雷达二次确认+减速观察”,避免单一数据误判,若偏差超过阈值(如±5cm),系统自动启动“保守驾驶策略”(减速至安全车速),避免因数据误判引发事故。
3、牵头制定L3级自动驾驶合规与安全体系,为落地铺路
王乃岩深知L3落地不仅是技术问题,更需突破“责任界定、法规适配”的行业瓶颈。2025年,他带领团队完成三大合规准备工作,为小米L3后续量产落地扫清障碍,一是明确责任边界:联合小米法务部与行业协会,制定《L3级自动驾驶责任划分白皮书》,明确“系统激活状态下,因系统故障导致的事故由车企承担主要责任;驾驶员未按要求接管时,责任归驾驶员”,该白皮书成为国内车企L3责任界定的重要参考;二是定义ODD(运行设计域):通过梳理全国31个省市的道路法规与路况特征,明确小米L3的“适用场景清单”(如排除雨雪冰冻天气、无标线道路),并在车载系统中实时显示“当前场景是否支持L3模式”,避免用户误触发;三是设计人性化接管机制:开发“多级预警+渐进式接管请求”系统——提前10秒通过语音、灯光、方向盘震动发出预警,若驾驶员未响应,系统先逐步减速,最终在安全区域停车,避免“紧急接管导致驾驶员慌乱”。
2025年,王乃岩的核心价值在于他是小米L3的“安全守护者”,他没有停留在“L3技术炫技”,而是通过“全方位冗余”解决安全核心痛点,为小米L3从“技术验证”走向“量产落地”奠定关键基础。
7、印奇:千里智驾的“操盘手”
职位:千里科技董事长、旷视联合创始人

背景:
2006年考入清华大学自动化专业,后入选清华大学姚期智实验班,2010年获计算机科学学士学位,后赴香港中文大学学习。2013年获得哥伦比亚大学计算机科学硕士学位,研究方向为人工智能。
2011年与唐文斌、杨沐联合创办北京旷视科技有限公司,担任执行董事、董事会主席、首席执行官。
2024年11月当选力帆科技(现更名为千里科技)董事长,2025年1月提出全面拥抱“AI+车”战略,2月,公司更名为千里科技,并与与吉利汽车、阶跃星辰成立千里智驾合资公司,专注于L4级别智能驾驶技术解决方案研发。
2025年3月联合吉利发布“千里浩瀚”智驾系统,并提出超自然人机交互、自动驾驶全面落地及车联网大模型升维三大趋势。8月,吉利将极氪智驾团队、吉利研究院智驾团队及旷视旗下迈驰智行合并入千里智驾。9月,获得吉利控股集团董事长李书福授权管理千里智驾,宣布公司AI+车核心业务转型完成初步布局。
主要贡献:
印奇在2025年以“智驾新人”的身份切入行业,却凭借对AI技术的深刻理解与产业整合能力,成为千里科技“AI+车”战略的核心操盘手。他的首要贡献,是为千里科技明确“以AI为核心,覆盖智驾、智舱、智行”的业务布局,彻底摆脱前身“力帆科技”的传统汽车业务局限,转向智能出行领域。他主导推出“千里智驾(L2+到L4级方案)、千里智舱(自然交互座舱)、千里智行(Robotaxi)”三大业务线,形成“技术-产品-服务”的完整闭环。其中千里智驾,作为核心板块,2025年已落地1.0版本(分基础版/专业版/旗舰版,覆盖100-700TOPS算力,适配不同价位车型),2025年底发布L3级2.0版本。
8、陈奇:极氪智驾的“开路人”
职位:千里智驾联席CEO、吉利控股集团首席智驾科学家、极氪智能科技副总裁

背景:
陈奇于2003年获取西安交通大学硕士学位,随后加入华为。2015年,华为成立车联网实验室,陈奇负责自动驾驶,是华为智驾第一人。2019年5月,华为正式成立智能汽车解决方案业务部(车BU),陈奇被任命为华为自动驾驶研发部部长,全面负责华为自动驾驶产品的研发工作,为华为汽车业务元老之一。在此期间,他主导了华为第一代自动驾驶系统的全栈研发,实现了从0到1的突破,为华为在智能驾驶领域奠定了坚实基础。
2021年陈奇加入吉利旗下的极氪汽车,担任自动驾驶业务副总裁,完成了极氪自研智驾从0-1的搭建。2025年,随着吉利内部智驾团队的整合,陈奇被任命为千里智驾的联席CEO,同时兼任吉利控股集团首席智驾科学家。
主要职责:
极氪智驾团队一号位,完成自研团队从0-1的搭建,负责千里智驾技术的研发工作,特别是高阶智驾方案的迭代与量产。2025年在“一个吉利”的战略下,陈奇主导完成吉利集团旗下智驾方案的统一,并发布全新“千里浩瀚”品牌,并主导千里浩瀚系统中高端平台(如H5、H7、H9)的研发,负责从硬件方案到软件架构的全栈开发设计、并发布了无图城市NOA、车位到车位领航乃至L3级自动驾驶/L4Robotaxi功能的开发。
主要贡献:
1、实现极氪自研智驾从0到1的突破,并跻身”智驾四小龙“
在极氪期间,陈奇用两年时间完成了极氪智能驾驶系统的全栈自研,突破了高阶智驾的技术瓶颈,实现了跻身第一梯队的能力。在陈奇的领导下,极氪仅用10个月就完成了从自研发布到无图城市NOA全国上线,并且是国内最早一批实现车位到车位功能量产的车企,并且不断精进主动安全产品设计,发布了720°主动安全产品,并且是国内最早量产连续紧急避让G-AES的车企。
除了功能交付外,在陈奇的带领下,完成了技术方案的快速迭代,2024年极氪智驾方案全面进入端到端时代,并发布数字先决网络;2025年升级至全新的SmartAIAgent架构,随着云端WMA和车端多模态VLA大模型的上线,体验有了飞速进化,在2026年1月,极氪搭载“千里浩瀚”H7方案的极氪7X荣获获第一电动举办的智驾大赛温洲站第三名。
2、“一个吉利”战略下推动千里浩瀚品牌发布及产品矩阵量产交付
2025年3月,在”一个吉利“的政策下,陈奇主导推动了吉利智驾方案的技术路径统一,并发布了全新“千里浩瀚”品牌。该系统分为H1-H9五个等级,覆盖包括极氪、领克、银河等吉利集团旗下不同价位车型,实现了硬件、算力、软件与交付功能的标准化和平台化。H5方案开始具备无图城市NOA能力交付,并实现在售车型标配激光雷达方案。H9方案最高算力达到1400Tops,是首个与全球领先英伟达Thor-U芯片合作的方案,可进阶至L3高阶自动驾驶功能。2026年CES,吉利正式统一了千里浩瀚软件版本名G-ASD,并且实现了仅用8个月的时间,让H7方案在吉利13款车型的量产上车。
3、L3高阶自动驾驶方案的量产突破
2025年,陈奇主导的千里浩瀚H9方案在9X发布实现量产上车,是行业为数不多支持L3的旗舰标杆方案。H9方案实现了行业首个三重冗余设计,包括行业首个5激光雷达硬件方案,可实现3重360°全维感知覆盖。采用两颗英伟达Thor-U芯片,算力高达1400Tops,行业同级领先。车端和云端升级至SmartAIAgent架构,均搭载两大模型互为备份冗余。H9目前已经实现了无图园区漫游及涉水逃生能力。2026年1月,在陈奇的带领下,搭载千里浩瀚H9的极氪9X已获得杭州市L3级自动驾驶道路测试牌照。是目前全国通行面积最大、里程最长的L3级自动驾驶测试牌照。
9、杨沐:千里浩瀚落地的“推动者”
职位:千里智驾CTO

背景:
杨沐,本科毕业于清华大学姚期智实验班,曾获国际信息学奥林匹克竞赛(IOI)金牌。2011年,杨沐与印奇、唐文斌共同创立旷视科技。杨沐负责个人物联网移动业务的研发管理工作,带领团队在设备安全领域实现全球首款2D人脸解锁智能手机、首款安卓3D结构光人脸解锁智能手机及屏下指纹技术创新;在计算摄影领域首创AI+CV超画质算法,助力多品牌在DXO评测中取得高分并实现屏下摄像头商业化。他提出以AI重新定义光感知系统,主导移动业务成为消费电子领域重要解决方案供应商。
2025年,杨沐担任千里智驾首席技术官(CTO)。
主要贡献:
杨沐作为千里智驾首席技术官(CTO),是千里智驾“高含模量”技术路线的核心设计者与落地推动者,主导了从技术架构搭建、核心大模型研发到产品方案量产。
2025年核心突出贡献:从技术架构到产品落地的突破
1、主导“端到端Plus”技术架构落地
杨沐的核心技术贡献,是带领团队研发并落地“端到端Plus”架构,打破传统智驾“感知-融合-决策-规划-控制”的模块化割裂,实现全流程一体化智能,成为千里智驾“高含模量”路线的技术底座。新架构从两段式进化为一段式端到端,将感知(多传感器数据处理)、预测(交通参与者行为判断)、决策(驾驶策略生成)、规划(路径设计)、控制(转向/刹车执行)整合为单一神经网络,通过“数据直接驱动控制输出”复刻人类优秀驾驶员的驾驶逻辑,避免模块间信息损耗——例如在重庆“8D路况”中,系统可直接根据摄像头、激光雷达的原始数据,输出“避让匝道汇入车辆+减速过弯”的连贯控制指令,无需人工拆分规则;同时,该架构使复杂场景(如无保护左转、高速加塞)的响应速度和决策连贯性大幅度提升。
2、牵头研发RLM多模态大模型
针对行业“含模量低、规则依赖重”的痛点,杨沐主导与阶跃星辰合作,研发“基于强化学习的多模态大模型(RLM)”,成为千里智驾“高含模量”路线的核心AI底座。2025年6月,RLM大模型随“千里智驾1.0”方案同步发布,通过“基础大模型预训练-智驾数据特训-强化学习优化”三阶段开发,实现“通识能力+垂域适配”的双重优势,既能理解“临时施工围挡=需绕行”的交通常识(源于多模态基础大模型),又能精准应对“无标线乡村路、夜间远光干扰”等智驾专属场景(源于智驾数据特训)。RLM模型使千里智驾系统的“含模量”从传统方案的40%-50%提升至70%以上(2025年底接近80%),安全兜底规则的触发频率降低大幅度降低。
3、搭建数据闭环体系
杨沐深知“数据是AI智驾的核心燃料”,2025年他主导构建“数据采集-训练-验证-部署”的全流程闭环,支撑RLM模型与端到端架构的持续迭代。数据规模与质量依托吉利体系内数万辆L2+级车辆,实现每天上万公里真实路况数据采集,重点标注“长尾场景(如无标线道路、临时施工)、复杂交互(如人车混行、加塞博弈)”等高价值数据,为模型训练提供高质量样本;再通过“影子模式”(智驾系统在后台同步运行并对比人类驾驶决策)筛选高价值数据,经自动化标注工具处理后,72小时内可完成模型微调并推送OTA,使系统在跨区域路况(如北方冰雪路、南方多雨路)的适配能力提升。
4、突破“大模型实时性与车端算力矛盾”的工程化瓶颈
大模型推理需海量算力,而车端算力有限(如经济型车型仅100TOPS),传统方案易出现“推理延迟超安全阈值”的问题。杨沐主导研发“AgentOS智能体操作系统”解决该矛盾,AgentOS可动态调配车端“GPU/NPU(负责模型推理)+CPU(负责规则执行)”的算力资源——例如城市道路场景下,70%算力分配给RLM模型用于复杂决策;高速场景下,50%算力用于模型,50%预留备用,确保推理时延稳定在80ms以内(远低于100ms的车规安全阈值);并将RLM模型的车端部署体积压缩40%,在100TOPS算力的经济型车型上仍能流畅运行基础版城市NOA功能。
10、周光:元戎启行的“领路人”
职位:元戎启行CEO

背景:
全国青少年电脑机器人大赛金牌及亚太区第六名获得者,清华大学基础科学班毕业,德克萨斯大学达拉斯分校人工智能博士。求学期间,曾在清华大学高能物理研究中心参与科研工作,后前往美国师从FarokhBastani攻读人工智能博士学位。博士期间主导德州仪器Kilby实验室自动驾驶项目,获大疆开发者大赛全球总冠军,2016年加入百度美国研究院自动驾驶事业部。
2019年,周光创立元戎启行。
主要贡献:
2020年,元戎启行率先布局“无图”技术路线,2023年发布不依赖高精度地图的智能驾驶解决方案DeepRoute-Driver3.0。
2024年,元戎启行率先推出基于端到端模型的辅助驾驶平台DeepRouteIO,这也是国内首个不依赖高精度地图、使用端到端模型的智能驾驶方案。
2025年8月,元戎启行发布全新一代辅助驾驶平台DeepRouteIO2.0,该平台搭载自研的VLA(Vision-Language-Action)模型。目前,采用元戎启行VLA模型的首批量产车型已经进入消费市场。
据《中国智能驾驶行业趋势白皮书(2025)》 显示,2025年1-10月国内第三方城区NOA市场元戎启行累计搭载量约12万至15万台,累计市场份额约23%;其中2025年10月单月,元戎启行在国内第三方城区NOA市场份额占比约38%,排名第一,增长倍数为2.7倍。
截至2025年底,搭载元戎启行辅助驾驶系统的量产车辆交付超过20万台,覆盖车型超过15款。一年多时间,元戎启行市占率从零起步迅速攀升,至2025年10月单月市占率近40%,稳居行业第一梯队。
2025年,周光带领元戎启行成为第三方智驾供应商中的“黑马”,在技术路线、产品交付、未来业务布局三大维度实现突破。
1、VLA模型与“无图+端到端”量产上车
周光基于对AI技术趋势的判断,2025年推动元戎启行完成从“端到端”到“VLA(视觉-语言-行动)模型”的技术跃升,持续强化“无图化”核心优势。2025年1月正式发布VLA模型,实现“视觉感知+语言理解+动作决策”三模态融合——系统可通过自然语言推理处理复杂场景(如“识别‘施工围挡’+理解‘需绕行’+输出‘减速变道’指令”),在遮挡场景处理、防御性驾驶等方面全面超越传统端到端模型,成为行业首个量产VLA技术的第三方供应商。
2、实现突破的核心技术与方法
周光主导的VLA模型开发,实现“从理论到量产”,首先是基于GPT启发的ScalingLaw(规模效应),融合多模态基础大模型(图像、文本),让系统具备“物体识别、语义理解”的通识能力(如识别“消防栓=不可碰撞”);其次是,用20万辆量产车的路测数据微调模型,强化“交通场景专属认知”——例如“虚线变道=可操作”“行人招手=可能横穿”,使模型在智驾场景的决策准确率提升;最后在VLA模型外增设“规则安全层”,若模型输出指令超出安全范围(如急刹力度过大),安全层立即接管,确保量产落地的可靠性。
11、刘轩:元戎启行VLA技术的“落地者”
职位:副总裁、技术合伙人

刘轩作为元戎启行技术合伙人&副总裁,2025年深度参与元戎启行核心技术研发、方案量产推进,是VLA(视觉-语言-动作)模型落地与DeepRouteIO2.0平台推广的关键推动者。
1、主导VLA模型工程化验证,推动技术从“实验室”到“用户端”
作为VLA模型核心研发团队成员,他推动模型四大核心功能(空间语义理解、异形障碍物识别、文字类引导牌理解、记忆语音控车)的工程化适配,确保技术能匹配量产车型需求——例如针对“文字类引导牌”功能,他牵头完成全国30余个城市“潮汐车道、公交专用道、待转区”等动态路标的数据标注与算法优化,使该功能在复杂路标场景的识别准确率达92%以上。
2、推动DeepRouteIO2.0平台商业化落地
刘轩深度参与元戎启行新一代辅助驾驶平台DeepRouteIO2.0的推广与客户对接,为2025年量产交付量爆发提供关键支撑。2025年8月DeepRouteIO2.0发布后,刘轩牵头对接车企客户,推动平台实现“多模态(激光雷达/纯视觉)+多芯片+多车型”的灵活适配——截至10月,基于该平台已达成5个车企定点合作项目,覆盖SUV、MPV、越野车等品类,首批搭载车型(如长城旗下车型)于2025年四季度陆续进入市场。
3、解决传统辅助驾驶“盲区风险预判不足”的安全痛点
传统基于CNN的端到端模型(如BEV架构)存在“视野受限即无法预判风险”的短板——例如公交车遮挡、桥洞盲区、草丛遮挡等场景,系统无法提前感知潜在危险,易引发“鬼探头”事故。刘轩通过VLA模型的“空间语义理解”功能破解该问题,推动VLA模型融入“思维链推理”能力,可模拟人类驾驶逻辑,通过“空间关系预判”感知盲区风险(如“公交车右侧大概率有行人横穿”),在风险出现前1-2秒主动减速,而非事后响应。
1、破解“异形障碍物识别与语义理解脱节”的行业难题
智驾系统对“施工锥桶、超载三轮车、打伞行人”等非标准障碍物,仅能识别“存在障碍物”,无法理解其具体属性(如“超载=更难制动”“打伞=可能遮挡视线”),导致决策保守或误判。刘轩主导的VLA模型对“异形障碍物识别”功能针对性解决,让VLA模型融合语言模块与基础大模型能力,可解析障碍物的语义信息(如“识别超载三轮车-判断其制动距离更长-提前加大跟车距离”),而非单纯的“障碍物检测”;针对暴雨天“行人打伞遮挡身形”这一高频痛点,他牵头优化模型的视觉-语言融合逻辑,使系统在极端天气下对非标准行人的识别率提升。
2、突破“动态路标理解滞后”的问题
国内道路存在大量“潮汐车道、公交专用道、临时施工标识”等动态路标,传统方案依赖高精地图更新,无法实时适配,易引发违章或事故。刘轩推动VLA模型“文字类引导牌理解”功能解决该问题,他主导模型的“深层语言理解+逻辑推理”优化,使其能实时解析文字路标含义(如“‘潮汐车道’当前方向-调整车道选择”“‘左转不受灯控’临时标识-判断通行规则”),无需依赖地图更新;同时,在与长城等车企的合作中,他牵头针对不同地区的路标差异(如南方“待转区”、北方“可变车道”)做定制化优化,确保功能在全国范围的适配性。


