×

助推 融合 革命 趋势 驱动

算力驱动的未来趋势:大算力SoC系统助推舱驾融合的革命

jnlyseo998998 jnlyseo998998 发表于2023-04-23 22:59:02 浏览11 评论0

抢沙发发表评论

来源 | 车轮上的电脑

知圈 | 进“滑板底盘群”请加微yanzhi-6,备注底盘

前言

当前,AI技术的发展推动用户需求爆发性的增长,对于汽车产品而言,是否只局限于L2+ADAS功能、DMS/OMS功能和NLP功能?答案是否定的。近年来的L2+ADAS产品,经历了AI算法推动的颠覆性革命,Transformer、Nerf、BEV算法都推动自动驾驶技术向L3/4等级进一步逼近,甚至颠覆了之前的技术方案。

在汽车产品满足功能安全的前提下,L2+ADAS功能尚且可以定义产品边界,而智能座舱的用户场景完全没有限制,呈现出“千人千面”的特性。除了最基本的DMS/OMS、自然语言处理NLP功能,还有基于用户画像的各种推荐功能、基于AR增强技术的沉浸式体验HMI功能等等。由此,对于产品的多样性,也许用这样一句话来形容比较贴切:没有消费者想不到的,只有开发者做不到的。

面对智能驾驶、智能座舱技术的快速演进,一方面表明算力预埋、生命周期内OTA 不断升级跟进技术革新的脚步、以实现功能多样性是唯一途径;另一方面,由于算法的算力需求大,而目前大部分量产端侧芯片的算力有限,OEM不得不把部分功能部署在云端,这又带来了流量成本增加、网络延迟限制、甚至数据安全风险等不利因素。由此, 市场迫切需要能够兼具大算力、高性价比(特斯拉的降价行为也表明了成本的重要性)、灵活扩展的车载芯片平台,让这些高大上的AI技术稳稳落地。这也是未来智能座舱技术和自动驾驶技术发展的重要方向,将极大地提升车辆智能化水平和用户体验。 下面,我们就从三个层面谈一谈大算力SoC系统如何助推舱驾融合的革命。

01

智能座舱与智驾技术路径与趋势

近几年,电动化和智能化是推动汽车半导体市场强劲增长的主要原因,其中与智能化强相关的包括智能座舱和自动驾驶两大域控制器,由此,我们分别从智能座舱和自动驾驶两个领域的主要竞争产品来分析其对大算力SoC系统的需求。

1智能座舱

智能座舱是用户体验的第一道门,成果易被感知,能有效助力OEM产品差异化实现,也是目前OEM创造利润的重要板块。

智能座舱是基于智能化、万物互联化大背景下的新型车内应用场景,通过整合驾驶信息和车载应用,利用其控制域的强大信息数据处理能力,为驾驶者提供高效且具科技感的驾驶体验。早在2016年,腾讯便在智能座舱领域布局,其座舱技能图谱如下:

图1:腾讯座舱技能图谱

从上图中不难发现,无论是感知、理解技术还是表达技术,智能座舱的技术图谱,包括移动端部署的硬件、软件和算法,V2X的互联技术,云端数据库的运营等,都要有所储备。智能座舱的场景包含了出行、学习、社交、工作以及娱乐,重点是识别用户属性需求,提供针对性的服务。

几年前envisics公司的AR-HUD产品demo就呈现了一个美好的智慧出行场景。试想一下,周末你和爱车来一次说走就走的旅行,它便会根据你的日常爱好(用户画像)、好友轨迹给你推荐一处野营地,同时帮你做好能源管理(图2)、准备出行清单(图3)、顺路带上一杯打折咖啡(图4),自动驾驶功能为你护航(图5),途中还可以根据备选的几个方案按实时情况调整优选(图6),实时分享好友状态(图7),在路况危险时提醒驾驶员接管汽车(图8)。

支持以上这些功能快速成功落地的基石——包括大算力的芯片处理器(包括CPU、GPU、NPU、 DSP),支持多操作系统并行的软件,高效的开发工具链,以及强大的AI交互算法,这些都缺一不可。 大算力芯片提供了竞赛的平台;易扩展、易维护的软件架构、高效的开发工具链提供了竞赛的工具;强大的AI交互算法提供了竞赛的战略灵魂,有了这些硬核技术的加持,OEM才能做到让他们的智能座舱产品快速更新迭代。毕竟在市场上抢占先机带来的优势显而易见,这也是OEM车型脱颖而出的关键。

2自动驾驶

传统的L2+自动驾驶产品,包括行车和泊车两个板块。每个板块的功能主要依赖包括障碍物识别、自动变道、可行驶区域判断、规划控制等算法来实现。这些算法基本依赖单摄像头作为输入数据,感知算法先对每个摄像头的输入图像进行特征提取、再结合雷达信号、定位/地图信息、车辆位姿信息进行后融合,最后结合车辆规控策略实现L2+的产品功能。虽然大部分量产车型都已成功部署这种算法方案,但目前仅止步于L2.999这个等级,其中部分原因是基于单摄像头感知、后融合各传感器信号的算法难免有以下几个缺点:

后融合是目标级融合,各自传感器数据提取特征的过程是相对独立的,强依赖人工处理规则,在车型量产时有诸多定制化工作。比如由于各传感器感知的空间有限,各传感器感知到的低置信度的目标很容易被丢弃、产生漏检。一般传感器安装位置确定后要依赖算法工程师大量的适配工作,确定阈值避免误检和漏检,很大程度上依赖工程师的经验,并且增长了开发周期。

基于卷积convoluation的感知模型,基本只对当前帧图片进行特征提取,因此丢失了很多时序信息,导致与时序相关的特征丢失,比如速度。

单摄像头视角,因为视觉的透视效应,图像很容易有遮挡,因而传统的感知任务只能感知看得见的目标,对于遮挡完全无能为力。

传统的前处理、感知、后融合这种类似“串行系统”的感知算法,很容易把上游的误差传递到下游,从而造成误差累积。同时,不同类型传感器的数据特征提取算法放在不同的计算处理单元上,计算后再进行后融合,也会带来数据通讯传输的时间延迟。

近两年,BEV范式的感知算法颠覆了传统的算法框架,BEV可以实现特征级融合,即直接把各种不同类型的传感器信号(camera、Lidar、 Radar、IMU、GPS等)一起送入BEV模型,最后推理得到3D目标位姿、速度等信息,克服了传统感知算法的缺点,同时可以实现实时地图构建。

然而,BEV感知模型基本要依赖4至6个以上的摄像头数据输入进行图像数据特征提取(image resolution:320*800,640*1600,736*1280等),并且为了实现时序上的融合,往往需要结合transformer框架,动辄一个模型就有1TOPs以上的运算数,并且需要混合精度计算(int8、fp16)。因为PTQ量化方法不适用于类似grid sample(bilinear)这样的算子,或者多层的transformer注意力机制。如果感知功能要求20FPS以上的帧率,就意味着满足一个模型的推理,至少需要20TOPS的算力,再考虑到多检测头机制(detection+segmentation+classification等)、算力利用率等诸多因素,没有60TOPS以上的算力也许都不敢直面BEV模型的挑战。而目前市面上主流的自动驾驶芯片,满足这个算力需求的也屈指可数。

以上我们分析了智能座舱和自动驾驶功能各自对域控制器的需求情况,这两个看似不相关的控制域,实则却是互相影响、互相成就的关系。DMS功能只有接入智驾域,为智驾提供策略参考才能真正产生价值,而不仅仅是一句报警的提醒而已;同时,只有随着自动驾驶技术的普及和提升,智能座舱才能有更大的发挥空间,两个域控制器所需要的计算单元也基本相同。

既然两个域控制器关系密切,那么舱驾一体化是否可以减少OEM成本,提升用户体验呢?下面,我们再来谈谈舱驾一体域控制器整合(舱驾融合)的必然性和所面临的主要挑战。

02

舱驾融合的必然性与主要挑战

从传统的E/E架构到跨域融合,再到中央集成式域控制器,OEM对这条路的方向是明确的,而路途却是艰辛的。究其原因,主要在于汽车行业自带的制造业属性,离不开系统庞大的制造研发体系、稳定的上下游供应链关系,同时由于当前OEM软件自主研发弱势,组织架构的职责划分等等因素,都会让这条大船在革新的路上显得格外迟缓。下面这张图列出了目前国内各OEM和tier1对不同域控制器进行整合的方向。

图9 不同形式的跨域融合尝试

在降低成本和缩短研发周期的双重驱动下,智舱域控制器和智驾域控制器集成在一个单SoC芯片上,已然是大势所趋。除此之外,智舱与智驾功能的相关软件和算法也需要完全部署在同一颗SoC芯片上,以最大程度地减少通讯成本、提升算力利用率。

如果我们从硬件和软件两个层面去考虑,视角是完全不同的。在硬件上的融合方面,需要更多地从硬件成本、设计、工艺的维度进行考虑,这对芯片设计、制造和封装工艺都提出了较高要求;而从软件上的融合方面,需要更多地从功能的维度进行考虑,主要包括:

如何设计易扩展、兼容性强的整体软件架构,从而使不同安全等级要求的功能部署在不同的操作系统上(Linux、Android、QNX);

能兼容Adaptive AutoSAR、ROS、Cyber等框架;

引入SOA面向服务的设计理念和工具,帮助OEM更便捷地实现客户定制化产品。

与此同时,软件和硬件这两个维度又不能完全割裂来看,它们如果能同时实现高度融合才是登峰造极的最佳状态。但目前受限于软硬件的技术水平、架构方案、供应链等方面的因素,基于单SoC芯片的舱驾融合方案成为各大OEM、tier1的重点研发方向,期待能快速获得技术突破和量产化进展。

03

国产大算力芯片的关键发力点

在国际形势、国内政策和市场需求的三重推动下,汽车芯片赛道上热闹非凡。2022年11月,在中国汽车工业协会主办的“第12届中国汽车论坛上”,人们见证了数十款国产汽车芯片集中首发的盛况;大算力芯片“卷王”英伟达和深耕于辅助驾驶领域多年的Mobileye两家国际厂商在自动驾驶SoC芯片市场占据了主要席位,智能座舱领域的龙头老大高通切入自动驾驶赛道并拿下宝马、大众等多个头部客户的定点,芯片巨头们的行动无不表明其对舱驾融合趋势的战略布局;而 美国政府在几个月前颁发的AI芯片禁令,使得芯片国产化替代的风潮蔓延到汽车领域,给国内芯片企业带来了千载难逢的重大机遇。也由此,大算力SoC芯片大战帷幕拉开,市场期待更好的车规级芯片,能在软、硬件上实现新的突破。

那么,是否芯片算力大了,成本低了,市场就一定为此买单?从开发量产车型的角度来看,除了算力之外,OEM还会综合考量芯片的架构设计、能效比、算法效率、算法开发难易程度、软硬件适配性、软件定制化开发的难度、安全性以及解决方案支持的灵活性和全面性等多方面因素,以对标车型的价格与定位。而他们考量的这些因素也是国产大算力SoC芯片的关键发力点,毕竟一辆车的成本不仅要考虑BOM成本,还要考虑研发成本和运营服务成本等;同时消费者买的也不仅仅是一辆车,还包括了其所带来的售后服务。以下我们就来分析几个关键的“发力点”:

1芯片架构设计

当前,各大SoC 芯片公司,其产品内部集成自研的ISP、BPU或NPU及DSP等等,其在提供强大算力的同时,还要确保不同类型的计算都有相对应的最优计算单元做加速,使得芯片可以承担传感器融合、图像拼接渲染、AI推理、实时/可靠的控制能力和功能安全等复杂功能,并能够用单芯方案承担舱驾融合的功能。此外,还要考虑低成本的算力可伸缩配置方案,用于满足不同价位车型的多样化需求。

使用Chiplet技术来设计这样的SoC芯片无疑是国内最为火热的技术之一,也是市场资本热捧的香饽饽。简单来说,Chiplet技术就是把不同制程的芯粒经过选型直接封装在一个SoC里面,将不同制造商、不同制程工艺的各种功能芯片像搭乐高积木般进行组装,从而能实现更高良率、更低成本的效果。同时各芯片厂商可以专注自己的芯粒和IP,不用为多余的IP买单。因此采用Chiplet技术进行SoC芯片的迭代设计会更加方便。

目前业内已有一些成功应用的典型案例,如第一个使用Chiplet技术之一的AMD 的“EYPC系列”、Apple公司的“M1 Ultra”、以及Intel公司发布的高端处理器Xeon Scalable“Sapphire Rapids”等,一经面世就引起市场的积极反响。由此可见,Chiplet技术具有巨大的发展潜力,相信未来无疑会成为处理器设计的主流技术。

2能效比控制

当前,行业普遍以“TOPS”为单位来评估芯片的理论峰值算力,然而在实际场景中,芯片的理论峰值算力基本不大可能会被完全释放,这是因为算力的有效利用率还受到芯片功耗表现和能效比控制的影响。

图10 自动驾驶SoC芯片能效比

对比以上的数据,能效比控制是不少国内自动驾驶芯片厂商的一个优势。高能效比不仅能够为汽车节约大量的电力,还能产生更少的热能,有助于芯片的散热与高性能的稳定运行。

3算法效率

试问,如果芯片的峰值算力高,也有效释放了,就一定能真正提升系统的整体处理能力吗?答案是,未知。如果芯片架构与算法的匹配度不够,导致算法的运行效率极低,整个芯片里面大量的晶体管实际上是在空转,算力再大,实际处理能力也并不是最佳。引用业内知名人士的几句话来与各位读者一起思考:

芯片峰值算力相当于汽车的马力,驾驶员或乘客能够真实体会到的是百公里加速度,而马力大的车并不一定加速就快。于芯片来说,用户可以感受到的是系统的处理能力和效率,而算力大并不一定能算得快;

算力只是一个理论上限,最终芯片能发挥出多少效率,还取决于软件算法配合等多方面的因素;

在整车生命周期和产品售卖过程中,芯片算力往往都不能完全发挥,甚至可能连一半都发挥不了;

现在市面上多数AI硬件加速单元是以单一加速单元为主,不同大小模型无法同时得到相应的加速,容易导致大模型推理时间长、小模型利用率低。

4软硬件适配性

智能汽车在持续发展,所搭载的传感器等硬件设备以及软件操作系统都在不断更新,对于满足舱驾融合的SoC芯片而言,其产品软硬件的适配性是一个绕不开的话题。 智能座舱和自动驾驶是个庞杂的产业链,涉及芯片、算法、软件、系统、硬件、协议栈和云端等各个层面,每个领域都需要考虑到快速迭代和升级的需求。

各大SOC芯片公司既要能提供自研的OS/中间件/感知算法,帮助OEM快速组建ADAS和智能座舱产品,又要能支持第三方软件移植,不绑定传感器/软件/算法等。此外,SOC芯片公司是否有够强的技术前瞻性去引领OEM 的智能化发展,也是OEM定点主要的考虑因素。毕竟汽车这类产品一旦卖出去,我们要考虑十年以上的生命周期,在这十年内如何进行软件/算法的OTA升级,如何帮助OEM实现数据闭环,都是其芯片产品的核心竞争力。

5开发便捷性

芯片作为算力基础设施,要服务客户做好算法开发,好芯片更得是“好用”的芯片。

当前,英伟达既对外售卖其开发的完整自动驾驶系统,也允许车企单独购买其自动驾驶SoC芯片,并为其提供了多种可供调用的成熟算法、基础软件堆栈以及DRIVE Hyperion Developer Kit自动驾驶开发套件。

Mobileye则从封闭的黑盒方案逐渐转为开放模式,在去年7月发布了软件开发工具包EyeQ Kit,让合作车企可以自主开发EyeQ 6H和EyeQ Ultra两款芯片,同时依然提供无需自研的芯片方案。

而国内的自动驾驶SoC芯片厂商,一直以来秉持的都是“开放共创”打法,并不断向车企放开更多的合作模式与开发权限。

虽然硬件方面国外芯片公司技术积累较早、更具优势,但在软实力方面,国内芯片公司具有近水楼台先得月的优势,可以在国内市场上更好地了解和把握消费者需求,并通过加强与其他本土企业的合作来提高创新能力。

由此,国内芯片公司的未来前景充满挑战但也充满机遇。正所谓“长风破浪会有时,直挂云帆济沧海”,尽管前路障碍重重, 我们确信,未来随着国内芯片产业政策的不断加强,以及芯片公司自身技术创新的突破与持续推进,国内芯片公司有望在未来实现技术水平的快速提升和市场份额的增长,真正实现乘长风破万里浪,到达理想的彼岸!

图片来源:

图2:CULane

图1: 公众号量子位

图2-图8:Envisics AR-HUD Driverless Car Demo

图9:公众号九章智驾

图10:公众号AutoByte

资料参考:

公众号AutoByte文章《国产自动驾驶芯片究竟做到哪一步了》;

智能汽车开发者平台文章《舱驾融合技术发展趋势分析》。