地平线余凯:基于大模型和智能驾驶两个杀手级应用,中国有望诞生世界级公司
“想要做好操作系统,就一定要有‘杀手级’的应用。”
2024年3月16日,中国电动汽车百人会论坛上,在谈到车载操作系统时,地平线创始人兼CEO 余凯表达了如上观点。余凯认为,整个行业要诞生大的操作系统必须要依赖杀手级应用,而智能电动汽车时代的杀手级应用目前可见的有两个:大模型和智能驾驶。
此前业内的常规思路都是以操作系统或者平台思维去做平台,但余凯认为,要通过应用来“裹挟”操作系统,只有足够大的应用才能培养出一个世界级操作系统。
按照这个逻辑顺延,余凯认为,在大模型和智能驾驶加持下,中国很有机会在智能汽车的产业发展窗口期诞生世界级的操作系统和计算方案公司。
圆周智行
19基于大模型和智能驾驶 中国有望诞生世界级公司
纵观电子消费市场,计算方案与操作系统一直都在紧密耦合。PC时代的Wintel联盟(Windows+Intel)、智能手机时代AA联盟(安卓和RAM)都是典型的软件硬件协同的案例。
在智能汽车时代,整个行业都需要思考一个问题:传统的计算平台,软件、硬件以及生态会呈现什么样的格局?
余凯的答案是,在人工智能和大模型,端到端Transfomer时代,未来自动驾驶跟智能座舱、智能交互不会完全统一,而是走向以AI计算为核心、以AI计算和操作系统作为中台,然后支撑上面百花齐放的应用,智能驾驶、智能座舱、交互只是上面的应用之一。这时候行业就会诞生一个全新的计算架构和操作系统,过去的架构和操作系统是以软件为核心,现在是以人工智能计算、以数据流的处理为核心。
在电脑时代,当个人电脑的性能提升到达一定阈值之后,用户对性能的需求趋于稳定,并不会随着时间增加。
智能手机同样存在这样的规律。当手机性能不能满足用户对性能需求的时候,软件要足够高的去适配硬件,才能够去获得相对的性能竞争优势;而当性能超越用户需求时,软硬件会发生解耦。
微软Windows支持RAM芯片,Servers支持高通RAM,苹果macOS跟Power PC结合,macOS支持X86芯片都在呈现这样的规律。当性能超过需求的时候,软件就没有必要去强行捆绑软件。
余凯认为,从操作系统入手做操作系统很难成功,但是从垂直应用切入去做操作系统就存在这样的可能性。这样的案例已经在PC和手机时代反复上演。
PC时代,Office的需求带来了Windows的成功;手机时代,GMS三件套( Google的Search、Google的Gmail、Google的YouTube)等一系列Google的垂直应用带来了安卓的成功。这些事实都印证了余凯的观察,从平台入手做平台都做不成平台,从应用入手做平台往往有大成。
智能汽车时代要诞生大的操作系统,只能通过应用来“裹挟”操作系统,只有足够大的应用才能统一操作系统。而大模型和智能驾驶就是两个有利的抓手。
车企抢跑大模型
目前,不管智能驾驶还是智能座舱,大模型已经是行业共识,整个行业也已经在大模型上加速奔跑。
百度智能云汽车行业解决方案总经理肖猛在百人会上表示,2024年是座舱大模型的元年,语音的渗透花了八年的时间到80%,座舱大模型可能一半的时间都用不了,国内的主机厂今年都会上线座舱大模型的能力,无非强弱之分,2025年国内新车的渗透率会达到80%以上。
在百度自有品牌极越上,百度早已将大模型能力带上车。理想、蔚来也都已经将大模型带上车。吉利系极氪、银河等品牌也明确表示会在今年将大模型能力带上车。
而在智驾大模型上,行业的步伐并没有那么快。
目前国内智能驾驶系统仍然采用模块化模型,将感知、预测、规划分别为三个独立的模型。每个模型的技术栈差异较大,处于下游的规划模型需要依赖工程师编写大量代码去制定行驶规则。在模块化的技术架构下,信息的传递会出现减损,系统的维护难度大,无法从容应对复杂路况。
端到端大模型的思路是将感知、预测、规划三个模型融为一体,无需程序员编写冗长的代码去制定规则,而是用海量数据去训练系统,赋予机器自主学习、思考和分析的能力。并且端到端模型不会出现信息传递减损,能够更好地处理复杂的驾驶任务,解决了模块化模型存在的所有“痛点”。
虽然整个行业还处于比较初级阶段,但头部企业依然是卷字当头,并且出现了多个“业内首个”的有趣现象。
百人会上,小鹏汽车董事长何小鹏表示,今年二季度,小鹏汽车将实现 “AI大模型上车”,官方称它会是汽车行业首个量产落地的车用人工智能和车用认知引擎。
何小鹏希望通过大模型的通用化能力降低自动驾驶的综合成本,惠及小鹏旗下聚焦10-15万元的第二品牌。
自动驾驶公司元戎启行CEO周光表示,智能驾驶端到端模型将会成就一位“超级AI司机”,元戎启行已经将端到端模型适配到量产车上,该批量产车将于今年投入消费者市场。元戎启行是国内第一家能够将端到端模型成功上车的人工智能企业。
与元戎启行不同,毫末智行CEO顾维灏表示,毫末在以循序渐进的方式落地大模型,此前毫末发布了行业首个自动驾驶生成式大模型DriveGPT雪湖·海若。
顾维灏介绍,毫末自动驾驶会在云端实现感知大模型和认知大模型的能力突破,并将车端各类小模型逐步统一为感知模型和认知模型,同时将控制模块也 AI 模型化。随后,车端智驾系统的演进路线也是一方面会逐步全链路模型化,另一方面会逐步大模型化,即小模型逐渐统一到大模型内。然后,云端大模型也可以通过剪枝、蒸馏等方式逐步提升车端的感知能力,在通讯环境比较好的地方,大模型甚至可以通过车云协同的方式实现远程控车。最后,在未来,车端、云端都会是端到端的自动驾驶大模型。
在大模型能力上,车企们都在加速狂飙。
智能驾驶从好用到爱用还有距离 但行业前景光明
而在辅助驾驶方面,整个行业也在快速上量。2023年辅助驾驶的装配率已经超过50%。其中NOA高等级自动驾驶在20万到30万级装配率也在不断提升。何小鹏表示,今年将会把高等级自动驾驶带向15万级别。
随着技术的不断演进,高级辅助驾驶装配率朝着100%去演进是必然趋势。
但必须承认的是,今天的高等级自动驾驶还存在很多问题:成本高和体验差是消费者较为直观的两个反馈。
余凯提出了智能驾驶技术的3个衡量标准,分别是可用、好用、爱用。
他认为,现阶段高速NOA已经跨越了可用,来到好用阶段。因为在高速以及高封闭的城区道路,系统基本上可以做到全程无接管,现在已经到好用或者刚到好用的阶段,但是不是消费者爱用,恐怕要打一个问号。
而在城区智驾方面,目前整个行业还在攻克可用难题。何小鹏提到,城区自驾有可能闹事区100公里接管10次都有可能,技术仍处于初始阶段。
智驾系统可用与成本、速度、接管率等指标强相关。但是好用要与用户的真实使用需求挂钩。比如在上班早高峰时间,如果辅助驾驶做不到安全,效率和体验,那就不能称之为好用。因为用户上班要赶时间,但又不能因此牺牲安全和体验。属于典型的既要、又要、还要,如果有其中一项不满足,智能驾驶就谈不上好用。
过去智能驾驶的技术开发主要遵循两个逻辑:扩大ODD范围和无人驾驶。
盲目扩大ODD范围,不注重质量带来的一个问题就是智能化水平低下;而在等级足够高的无人驾驶方面,系统又会被限定在一个固定区域,比如Robotaxi。
目前整个行业需要攻克的难题是通向全场景的高阶自动驾驶。自动驾驶水平既要上限足够高,又要ODD、运营领域足够宽。
沿着这个逻辑,余凯认为,下一代驾驶系统应该从三个维度来衡量:标准场景的通过率、通行效率、驾驶舒适性。
目前整个行业高阶自动驾驶在安全性上已经没有太大,下面一步就是舒适和拟人的问题。
地平线的解题思路是更先进的软件开发能力和软硬件协同能力。
2023年,地平线发表了研究界第一个端到端大模型的自动驾驶模型UniAD;最近,地平线又提出了Sparse4D算法,弥补传统的BEV算法的不足。
地平线希望通过这些软件这些算法的创新能力不断设计创新的计算平台架构,使硬件架构能够高效支持新一代软件算法。同时,软件算法全栈的研发也会去支持车企多快好省地开发高阶自动驾驶系统。
反映在产品端,地平线今年会推出基于全新技术架构打造的征程6系列计算平台,并且基于它打造高阶智驾样板间。
在期待统一操作系统之前,赛道里的所有玩家需要先跑赢智驾和大模型的战役。