英伟达的“座次焦虑”
北汽ARCFOX阿尔法S上搭载的智能驾驶计算平台,是华为针对这款车定制开发的MDC Pro 610,算力高达400+ TOPS。而接下来,华为MDC将结合业界普遍的智能驾驶算力需求,基于MDC Pro 610的底层能力打造成面向所有车企客户的平台化标准化产品MDC 810。
实现L4级自动驾驶究竟需要多少算力?并没有一个明确的答案,车企不太敢轻易下结论,而芯片厂商们的口径则一直在变。
前几年,有人说是300 TOPS;后来,有人说是500 TOPS;再后来,又有人说是1000 TOPS......从英伟达最近发布1000 TOPS算力的AI芯片Atlan来看,自动驾驶域控制器的算力应该很快就被“哄抬”到2000 TOPS以上。
而车企,无论自己在未来几年的算法水平是否真的需要那么大的算力,也得或主动或被动地卷入这场“算力攀比赛”中,用某自动驾驶芯片公司销售人员的话来说,这也是“内卷”。但没办法,在现在的大环境下,似乎只有大算力才能给车企足够的“安全感”。
但在4月18日的MDC 810(算力400+ TOPS)发布会上,华为则强调,自动驾驶域控制器,不能光拼算力,还得看背后的工程能力。正是有了这种能力,华为才有底气在发布会当日宣布“发布即量产”。
当前,200 TOPS以上高算力自动驾驶芯片的供应商只有英伟达、高通、华为,从目前已公开的信息来看,英伟达和高通最新款自动驾驶芯片的算力更高,并且,英伟达也拿下了最多的量产订单,但这两家公司的定位都是Tier 2,他们只卖芯片,却缺乏系统集成经验,而定位Tier 1的华为,则早已积累起了强大的整机工程能力。
固然,在软硬件解耦的大趋势下,会有越来越多的车企选择绕开Tier 1直接跟芯片厂商谈合作,但现阶段,多数车企仍然不具备自己做自动驾驶域控制器的能力——即便有这个能力,在当前的机会成本也比较高,因此,他们仍然要委托一个Tier 1来负责集成工作。
因此,如果芯片厂商自己就可以提供域控制器,则车企的工作量便少了许多。
算力攀比与英伟达的“座次焦虑”
2016年9月29日,在GTC欧洲大会上,英伟达首次正式公布了下一代Tegra处理器,代号Xavier。按计划,Xavier将基于台积电16n制程生产,集成多达70亿个晶体管,可在20 W的功耗下达到20 TOPS的算力。按英伟达最初的计划,Xavier将于2017年底在台积电流片。
在此之前,根据公开信息,正在规划中的自动驾驶芯片中算力最高的是Mobileye的EyeQ 5——最高功耗5 W,算力12 TOPS。由此看,英伟达的Xavier是瞄着“第一”的位置而来的。
不过,到了2017年12月,已经被英特尔收购的Mobileye却宣布EyeQ 5将推出12 TOPS和24 TOPS两个版本。有了24 TOPS的EyeQ 5,20 TOPS的Xavier就很难保住“第一”的位子了。
事实上,不服输的英伟达早已经“先发制人”了——2017年10月11日,在德国慕尼黑举行的GPU技术大会上,英伟达公布的Xavier参数已经升级至:12nm、90亿个晶体管、30 TOPS了,相应地,功耗也升级至30 W。
在这次大会上,英伟达还推出了一款号称“面向L4级自动驾驶”的计算平台Drive PX Pegasus,Drvie PX Pegasus包括了两颗Xavier SoC 和两颗基于图灵架构的 GPU,算力能高达 320TOPS。尽管这款功耗高达500W的计算平台完全不适合量产,但由于在它在那个阶段属于“算力之王”,仍然引起很多公司的浓厚兴趣。
不幸的是,不屑一切代价追求大算力的Pegasus并未能在“第一”的位子上呆多久——2018年10月份,在华为全联接大会上,华为推出的MDC 600算力高达352 TOPS,而功耗(352 W)却比Pegasus低。
尤其让英伟达感到紧张的是,当年华为MDC 600(技术预研版)使用的主芯片昇腾310算力高达16 TOPS,而功耗却仅有8 W,能效为2 TOPS/W,远高于同样基于12 nm制程的Xavier(能效1 TOPS/W )。
在被华为抢走自动驾驶算力冠军的同时,英伟达跟特斯拉的合作关系也开始走向终结。特斯拉在2017年底首次正式承认了正在自研自动驾驶芯片,而在2018年8月份,特斯拉称,自研芯片即将完成。
在2019年4月22日的“自动驾驶日”上,特斯拉正式公布了自研的FSD芯片的参数:16nm,72 TOPS,36 W。无论算力还是能效,都比Xavier高出一大截。
诚然,考虑到ASIC的高能效是以牺牲了一定的灵活性为前提的,拿ASIC芯片的算力和能效跟GPU比,对基于GPU核的Xavier“并不公平”,但在算力攀比的大背景下,很少有客户会理性地去看这个问题,甚至连英伟达自己也被绑架了。
于是,2019年9月,在Xavier仅拿下小鹏一个量产客户的情况下,英伟达依然迫不及待地发布了算力高达200 TOPS的7 nm自动驾驶芯片Orin。
按计划,Orin要到2023年才能量产。有人猜测,英伟达这么着急地推出Orin,就是被华为的MDC 600(技术预研版)给“刺激到了”。
不过,Orin并未能坐稳算力排行榜上的第一把交椅——它很快就被高通“斩落马下”。
在2020年1月份的CES上,高通也发布了自动驾驶计算平台Snapdragon Ride,该平台可在130 W的功耗下实现700 TOPS的算力,彼时,有消息称,Cruise和Argo都在使用高通的自动驾驶芯片做测试。
CES之后,多家中国车企开始跟高通接触。据知情者透露,高通的自动驾驶芯片有SA9000A和SA9000B两款,算力分别为200 TOPS和300 TOPS,跟英伟达Orin一样,SA9000也是基于7nm制程的,但能效却高达5 TOPS/W(Orin最初的版本能效是3 TOPS/W)。
高通的芯片在手机市场上和智能座舱市场上都有极强的竞争力,但其在自动驾驶市场上完全是一个新手,之前积累的优势也未必能发挥出来——高通的强项是CPU,但在GPU方面的能力积累不足,而在自动驾驶的计算中,GPU核占的权重比较大。
小鹏自动驾驶副总裁吴新宙在加入小鹏之前曾担任高通自动驾驶负责人,据称小鹏也曾跟高通有过谈判,小鹏最终并没有选择高通的Snapdragon Ride或SA9000,而是选择了英伟达的Orin。
2020年9月份以来,理想、小鹏、蔚来、上汽知己、上汽R品牌等在做“硬件预埋”方案时纷纷选择了Orin。看上去,英伟达已取得了阶段性胜利,但在硬件军备竞赛的大背景下,算力再多都是“不够用”,因此,英伟达仍不能高枕无忧。
有几则小插曲:
1.Orin原计划是在2023年量产,但为了配合理想X01的上市节奏,黄仁勋亲自拍板决定将量产时间提交前到2022年;
2.Orin的功耗,最初说是67 W,但在2020年9月份跟理想合作的发布会前后被后调整到45 W;
3.Orin的算力,从发布到跟理想合作时,对外说的都是200 TOPS,但到了2021年1月份蔚来ET 7发布会的时候,算力升级至254 TOPS。
本来,量产时间提前一年就已经很仓促了,而英伟达却又先后来了一次降功耗与一次算力升级,这个就很令人好奇了——如果已经有样品了,那功耗降低及算力升级就需要重新设计、重新流片(可能是重来了2次);而如果还没有样品,则功耗降低及算力升级就应该只是在PPT上“降低”或“升级”。
此外,高通SA9000目前也停留在样品阶段。而2020年9月底的北京车展上,笔者在华为的展台上了解到,其算力高达160 TOPS的MDC 610所用的芯片,在美国制裁之前已经有了备货。
也是在那次北京车展期间,Momenta公司CEO曹旭东在一场演讲中说,“MDC 610在已量产的自动驾驶计算平台中是算力最高的”。
2021年4月12日,对“排座次”看得很重的英伟达又发布了全新的自动驾驶SoC Atlan,单颗SoC的算力能够达到1000 TOPS,相比Orin SoC算力提升接近4倍。
不过,据佐思产研近日在《详解英伟达最新自动驾驶芯片-Atlan》一文中的评论,Altan实如此大算力的前提是高算力是“不太考虑成本,不太考虑功耗”。
作者还指出,英伟达推出Atlan的一个用意是“拉上对手做算力军备竞赛,在宣传上大造声势,压迫对手必须跟进算力游戏,直到拖垮对手”“其他厂家恐怕不会跟进这种算力数字游戏,这脱离了实际需求。Orin恐怕将是英伟达未来数年的主力产品。”
此外,Altlan要到2023年才能向开发者提供样品,至于量产装车时间,则要等到2025年了。
算力再牛,如果一时半会儿还无法提供样品,便不能为客户创造任何价值。
也是在那那天,笔者无意间在华为MDC平台负责市场营销的一个朋友的朋友圈那里看到一句话“不比期货吹牛逼,只拼现货真实力”。而最近凭强大的自动驾驶能力屡屡登上热搜的北汽ARCFOX阿尔法S上搭载的自动驾驶计算平台,便是华为为这款车定制开发的“现货”MDC Pro 610。
MDC Pro 610总算力高达400+ TOPS。看起来,算力比不上4颗英伟达的Orin,但胜在“有现货”。
话说,近几天,当华为跟北汽极狐合作的自动驾驶汽车在城区开放道路上跑的视频火起来后,许多业内人士都非常震惊,有朋友来问我的看法,我的回答是:
“我丝毫不感到意外。这些年,自动驾驶圈有个风气很不好,很多公司,还没有想清楚要不要做一件事的时候就开始放出说‘我计划做’,做到30分的时候,说‘马上做好’,只做到60分的时候,开始强调自己‘已经是第一了’;
而我发现,华为的风格则是,如果他们说‘我打算做’,就已经做到30分了,如果说“正在做”,就已经做到60分了,等到搞发布会的时候,差不多已经做到80分了,甚至是已经有可交付的成熟产品了。
这是华为在长期做To B业务的过程中形成的一种习惯。他们这么搞,往往使竞争对手很难跟进。”
言归正传,华为对MDC 810做了大量备货,却一直秘而不宣,这也是跟其长期以来“少说多做”的文化一脉相承的。
接下来,华为MDC将坚持平台化标准化的研发布局,结合业界普遍的智能驾驶算力需求,基于MDC Pro 610的底层能力打造成面向所有车企客户的平台化产品MDC 810。
英伟达和高通为什么只卖芯片,不卖“盒子”?
细心的朋友应该已经注意到了,华为MDC产品在市场推广中很少提芯片的具体参数,而是直接讲整个MDC平台的总算力、整体功耗等。这是由华为自动驾驶业务的商业模式决定的——不单独卖芯片,而是“卖盒子”。
所谓“卖盒子”,是指华为提供包括自动驾驶芯片、操作系统、算法、传感器方案、开发工具链在内的全栈式解决方案(包括但又不局限于域控制器)。这套全栈式方案,已经过 ISO 26262 ASLD认证,并即将搭载在北汽、长安跟华为合作的量产车上。
当然,在提供盒子的同时,华为又保持足够高的开放性,比如,客户可以自己决定算法怎么写、传感器怎么搭配。此外,华为不会跟车企争夺对数据的控制权。
相比之下,英伟达和高通主要是提供芯片和开发工具链,“盒子”主要由车企指定的Tier 1来完成。比如,在英伟达跟小鹏和理想的合作中,“盒子”的工作由德赛西威来承担。
在软硬件解耦的大趋势下,有不少车企是希望自己写算法、设计传感器方案的,因此,他们也倾向于只从芯片厂商那里买芯片,然后再跟Tier 1合作做“盒子”;但还有不少车企,现在比较着急在量产车上搭载自动驾驶套件,而自研算法、自己设计合作却又来不及,那么,对这些客户,如果芯片厂商直接提供包括算法在内的“盒子”,反而是更好的选择。
即便是那些具备自研算法能力、只从芯片厂商那里买芯片的车企,也应该很快会意识到,并非“只要有了芯片,搞个域控制器很容易”。事实上,“从算法到盒子”的过程,充满了各种“坑爹”的工程挑战。如果选择的“盒子集成商”(Tier 1)不够给力,车企的自动驾驶量产进度便会被拖延;或者是,尽管如期交付了,但效果跟预期有差距。
这个时候,如果芯片厂商有很强的系统集成能力,能把“盒子”做得很好,则车企便可选择从芯片供应商这里这里买回整个盒子的硬件部分及操作系统、工具链,然后再注入自己写的算法。
站在车企的角度看,与只卖芯片相比,芯片厂商“卖盒子”还有一个重大好处是:责任比较清晰,出了问题,他们只找盒子供应商就行了,而不是被芯片厂商、操作系统厂商及域控制器供应商互相“踢皮球”。
此外,即将成为潮流的“硬件升级”趋势,客观上也利好能提供“整个盒子的芯片厂商。
谈“硬件升级”之前,需要先谈谈现在比较流行的“硬件预埋”。正如我们在本本文开头所说,L4级自动驾驶究竟需要多少算力,谁也没个准数;事实上,我们看到的是,这个“多少才算够用”的标准,正在持续升级。
特斯拉在2016年下半年推出Autopilot 2.0的时候说是“可支持L4的硬件”,后来发现不够,又在2017年夏天加了两颗小芯片,升级至Autopilot 2.5;再后来,发现2.5也不够用,于是又推出了Hardware3.0硬件。Hardware 3.0号称能满足L4的需求,但如今特斯拉又在搞4.0的硬件,新版硬件打算在2021年底之前量产, 这就等于承认了3.0硬件的算力是“不够用的”。
此外,心细的朋友应该早就注意到了,英伟达的Xaiver,之前说是“L4芯片”,现在却只敢在L2市场上玩了。Orin之前说是L4芯片,但也许等Atlan量产之后,Orin会被归为“L2芯片”。
所以,我们需要设想一个问题:过几年,若芯片厂商们纷纷推出了算力高达2000 TOPS的低功耗芯片/计算平台,那些现在预埋了“可支持L4的硬件(算力1000 TOPS左右)”的车企们还能“坐得住”不?
由于芯片的迭代周期短于车的寿命周期,因此,特斯拉、理想、丰田等有前瞻性的车企在做“硬件预埋”的同时,还会为“硬件升级”做准备,即当预埋的硬件不能满足更高等级自动驾驶功能对数据处理的需求时,可对硬件进行升级,这需要车辆设计之初便预留好相应的硬件接口。若不能直接升级,就需要在改款版本中采纳新的硬件。
在应对“硬件升级”趋势时,华为这种“卖盒子”的公司,显然会比英伟达和高通这种只卖芯片的公司有更大的优势。事实上,华为早就为此做好了准备。在去年9月份的北京车展上,华为展出的MDC 610与MDC 210的尺寸及接口完全一样,就是为了保证日后做硬件升级时能“即插即用”。
相比之下,芯片厂商如果不做盒子,则在后续车企需要做“硬件升级”时,进度可能会被盒子集成商给拖累。
英伟达曾基于Xavier芯片做过DRIVE PX2 Parker 、DRIVE Xavier、DRIVE Pegasus等盒子,但都是定位于“开发板”(用于功能验证与技术培训之类的),而不适合量产,否则就不必让德赛西威基于Xaiver芯片又专门做一个IPU03盒子了。
从理论上讲,对英伟达和高通来说,在卖芯片之余再增加一个“卖盒子”的选项,是比只卖芯片更好的选择。然而,他们为什么没有这么做呢?
答案是:工程化能力不足。尤其是,高通从来就没有做过整机产品。
工程技术能力,类似于日本的“工匠精神”,表面看起来“单调枯燥”,实则有很高的壁垒。
比如,你能不能搞定散热问题?
算力比较小的“盒子”,因为功耗比较低,可以自然散热,既不需要风扇也不需要液冷;但通常只有功耗在30W以下的产品才可以自然散热,一旦功耗超过30W,便很难自然散热,如果散热问题处理不好,温度会急剧上升、发烫,导致产品的寿命和稳定性都会受到影响。
并且,无论制程多高,算力的提升总会带来功耗的上升,至于通过优化架构来降低芯片功耗,往往只能使功耗问题得以缓解,而不能根治,这意味着,算力的提升也必然会对系统的散热能力提出很大的挑战;而散热问题如果处理不好,则会严重影响产品的可靠性。
比如,搭载在乘用车上的“盒子”主要靠液冷散热,没有风扇,即便气密性做得很好,盒子里面还是会有少量空气存在,如果外面的温度变低而里面的温度比高,当里面的水汽碰到“盒子”冰冷的壳,就很容易液化;
有时,底盖下面结的露水,如果处理不好,就会滴到电路板上,导致电路板被烧毁。
需要再强调一下:做芯片时,实现低功耗是壁垒;但在芯片算力既定、做“盒子”的时候,如何处理高功耗下的散热问题,则是个很高的壁垒。遗憾的是,在算力竞赛的热潮下,后一种壁垒往往被忽略了。
传统汽车时代,由于电子元器件占比不高,并且ECU算力普遍比较小,功率也不太高,因此,中小型Tier 1们没必要经常去处理散热问题,也这导致他们在应对自动驾驶域控制器的散热问题时经验不足。
再比如,电路板上的线怎么排布?间距太大会占用板子面积,导致空间不够用;间距太小,则信号干扰会比较严重,进而导致产品性能极不稳定。
再比如,电子元器件用的胶水能不能防浸水?有些经验不足的Tier 1出于成本的考量选择了价格比较低的胶水,结果,只能防泼水,却不能防浸水。
工厂技术能力方面的壁垒,往往是靠花足够的时间来街垒的。而华为在做基站的过程中就已积累起了散热及精密制造等工程技术能力。
大算力自动驾驶芯片的市场格局性对稳定
除英伟达、高通和华为外,大算力自动驾驶芯片市场也许还会有一个很容易被忽略的潜在玩家:Waymo。
因为“看不上”别的公司做的芯片,Waymo已经自研了自动驾驶芯片,该芯片将由三星代工。而自2019年下半年以来,Waymo开始探索在做Robtaxi运营商的同时也做Tier 1,为车企提供包括自动驾驶操作系统、算法、芯片、激光雷达、毫米波雷达在内的全栈式方案。
以Tier 1身份出现的Waymo,在商业模式上跟华为极为相似。但有个重大区别是:Waymo是个软件出身的公司,完全没有做硬件的基因,他们的,他们的“盒子”集成工作,会交给麦格纳来完成。
理论上讲,如果Waymo这一条路能走通,则英伟达、高通、华为在自动驾驶市场上的份额都会减少。但现实也许并不会朝着Waymo设计的剧本走。
华为跟北汽合作的车上,装了3颗激光雷达+6颗毫米波雷达+13颗摄像头,相比之下,Waymo的车上装了5颗激光雷达,而摄像头则多达29颗,这完全就没有考虑到量产的可行性,没有成本意识。
从John Krafcik的下课看,Waymo也许已经意识到直接做L4的路线走不通,接下来,他们计划跟车企合作攻前装量产(L2+)市场,传感器方案也会“减配”。但是,对Waymo来说,做L2市场的Tier 1,也许比做Robotaxi运营商更难。
因为,在做Robotaxi业务的时候,Waymo自己就是甲方,可以自己定义需求,买车和元器件来集成就行了;但如果做Tier 1,他们还需要先搞定Tier 2甚至Tier 3,不仅确保各种零部件的质量没问题,还要控制好成本,这似乎已经远远超出了Waymo的能力。
此外,Waymo原来L4的算法架构,都是基于5颗激光雷达做的,现在做L2+,传感器已经减配了,你的算法架构能不调整吗?
由俭入奢易,但由奢入俭难,在传感器减配后,Waymo会经历相当长一段“阵痛期”。
更糟糕的是,尽管Waymo终于放心身段给车企做“乙方”了,车企们也未必买账。
Waymo在去年上半年的30亿美元融资中,没有一家整车企业参与投资;也就是说,暂时,还没有一家车企跟Waymo这个潜在的“技术供应商”深度捆绑。
也许,以是否投资Waymo为标准,可以把汽车制造商们分两种:有钱但不愿意投的;想投但没钱的。
先看看那些“有钱的”头部车企吧:
大众-福特、丰田、通用-本田这些公司/联盟,都已经为自研自动驾驶砸下了至少50亿美元的资金;
宝马已跟Mobileye深度结盟,戴姆勒的乘用车已跟英伟达深度结盟,只在卡车业务上跟Waymo合作(但仍未放弃自研自动驾驶卡车技术)。
现代已出资16亿美元跟安波福成立了合资公司......
不排除这些车企会在局部市场上拿出几百辆、甚至几十辆车跟Waymo做一些探索性的合作,但也仅此而已。
实际上,肯做Waymo的客户(搭载Waymo的自动驾驶技术去做运营)的,也仅限于一些比较弱势的车企,至少是一些在自动驾驶领域存在感不强的车企。
但Waymo跟这些“弱势车企”的关系并不牢固。
如Waymo的第一个车企客户雷诺日产三菱。在戈恩事件后,雷诺日产三菱联盟的关系能否持续,还存在很大疑问。假如联盟解体,之前跟Waymo签的协议能否照常履行?
FCA,虽然可能跟Waymo合作在意大利开展出行运营,但该公司早在2017年便加入了宝马-英特尔-Mobileye-德尔福的联盟,旗下玛莎拉蒂也确实已打算使用该联盟开发的自动驾驶技术。
目前给Waymo做供应商的捷豹路虎,好像并不打算再做Waymo的客户了。因为,该公司在2020年初刚已美国第二大出行公司Lyft投入了2500万美元,合作开发自动驾驶技术。
Waymo在2020年6月份跟沃尔沃达成了合作,但据沃沃尔一位曾参与过合作谈判的人士透露,其实双方合作的性质仍然是“沃尔沃卖车给Waymo”,而非“沃尔沃采用Waymo的自动驾驶技术”。
实际上,Waymo的技术授权模式喊了至少有两年时间了,却没有什么斩获。
因为车企不愿意做“富士康”,所以,Waymo觉得做运营商不容易;但技术授权这条路也不好走,因为,有进取心车企也不愿意做“惠普”“戴尔”或“安卓手机制造商”——即操作系统和芯片完全依赖供应商。
梳理后发现,车企中愿意做“惠普”“戴尔”的,应该主要是马自达、斯巴鲁、铃木这种存在感更弱的中小车企了。
至于中国车企,鉴于中国市场上有那么多自动驾驶方案公司,而且头部车企们自研自动驾驶技术的决心也很大,Waymo就别指望做他们的Tier 1了吧?
结合我们上面的种种分析来看,Waymo的技术授权模式,理想丰满,但现实骨感,很有可能找不到客户。因此,最终,Waymo将会“被迫造车”,从而实现“内循环”。但内循环之后的Waymo ,就不大可能跟英伟达、高通、华为会在芯片市场上竞争了吧?