车东西(公众号:chedongxi)
作者丨 川徐
编辑丨 Juice
(相关资料图)
由车东西主办的GTIC 2022全球自动驾驶峰会于1月5日在深圳成功举办,来自自动驾驶行业的多位专家和企业代表出席了本次会议并发表主题演讲。
在”量产自动驾驶专题论坛”上,长城沙龙智能化中心负责人杨继峰通过视频连线的方式发表了题为《数据驱动,高等级智能驾驶量产的必由之路》的主题演讲,介绍了数据驱动是如何帮助高级别自动驾驶实现量产落地的。
杨继峰从驾驶自动化分级、整车产品形态和技术架构三个角度出发对“智能驾驶到哪一步了”这个问题进行了回答,介绍了数据驱动是如何帮助高级别自动驾驶实现量产落地的。
杨继峰认为,高阶智能驾驶系统量产不仅要实现技术的价值、产品的价值更要实现能够对用户形成更深层次的链接和整个生命周期内全面体验闭环。
以下是杨继峰演讲全部干货:
一、自动驾驶分级是产品形态 并不代表技术能力
从驾驶自动化分级的角度看待自动驾驶似乎已经成为了一个绕不开的话题。自动驾驶从业者经常被问到自动驾驶今天是L几了,这是一个绕不开的问题。自动驾驶领域在16-17年开始进行国标的驾驶自动化分级的编写,到今天已经发布了,针对L3以上级别自动驾驶的三支柱法也开始落地。这是从法规层面,但是越是从事自动驾驶软件架构开发或产品设计的同学就越容易理解,其实所谓的L2、L2.9、L3、L4级别的自动驾驶更多的是一些不同的产品形态,而非直接的技术水平的能力的表达。当然一个没有ODC限制的L5级自动驾驶可能是所有自动驾驶赛道殊途同归的目标,但或许这个目标在可见的未来永远是一个牵引。
在杨继峰眼里所谓的L2、L2.9、L3、L4的自动驾驶更多的是不同的产品形态,而不是简单的技术水平的能力问题。
▲驾驶自动化分级带来的智能驾驶产品形态
在自动驾驶的级别带来的产品形态背后,是多个产品开发方法论的交汇和融合。
经典的L0-L1-L2和以TJP为代表的可以脱手脱眼的L3,采用典型的瀑布式的开发,清晰的功能边界,集成化的软硬件架构,可通过数学方法验证的测试验证理论,深度结合整车质量体系,功能场景、驾驶策略、安全概念都是could be defined, could be designed, could be verificated and validated,所以更多的是一个人function pack的形式,不在功能设计范围内的feature很难在这一代技术栈上通过OTA的形式再做交付。
而伴随着AI在视觉领域突破而进入自动驾驶行业的伙伴,大家反而是从L4开始理解自动驾驶,系统架构上基于当前有的传感器能力寻求均布感知的最优解,能够实现落地的高性能的计算平台。小步快跑,敏捷开发,持续集成,长城对技术的理解一直是一个以平台的形式持续开发的概念。从功能场景上L4自动驾驶希望系统能够无限接近于道路真实场景(例如复杂的道路拓扑、异形交通标识标志交通灯,博弈和绕行为主的场景,各种道路交通参与者的异常驾驶行为),ODD(非ODC)更多以地理围栏的形式出现而非功能边界(无论是限定区域还是干线),对于ODD之外的问题,L4系统需要有完整的风险迁移方案。对于不能解决的问题,不仅仅需要检测到,还需要保障绝对的安全(调度和运营能力)。
所以怎么理解这一代量产高阶智能驾驶系统,从整车系统架构角度、智能驾驶安全理论的角度(特别是功能安全)、MRC和MRM的定义的角度,这一代系统开发沿用了很多传统ADAS的方法论,但是从软件架构特别是核心模块的算法架构上,从主线软件的开发、集成、交付形式上,从车端-云端的架构统一性和数据驱动基础设施的角度上,这一代系统又很接近现在的L4技术栈。
回到今天的题目“高阶自动驾驶量产”,2022年大家谈了很多L2和L4的飞轮、数据闭环以及它们之间的关系,所以站在今天去看待这样的L2.9的高阶端到端智能驾驶辅助系统的量产问题,是一个非常有趣的时间点。
回到驾驶自动化的问题上,L3比L2.9需要更多的硬件感知能力吗?不一定,因为L3的场景更少,也更容易去通过枚举定义场景和风险。L3比L2.9需要更多的算力吗?也不一定,因为算力更多反映的是算法架构的需求,L3反而是更多以逻辑计算的形式表达的。L3比L2.9需要更多的系统冗余吗?是的,因为安全、特别是功能安全在方法论层面尚未因为机器学习而发生本质变化。所以,驾驶自动化问题,他更愿意看做是一个系统设计、安全设计、功能设计、算法架构、测试验证、开发和交付方式的方法论层面的理解和表达。
所以长城从整车企业的角度和自动驾驶本身的技术角度,达到了这一代非常有趣又非常先进又真正第一次toC的时间节点,长城把端到端的具备完整架构的L2.9高级智能驾驶辅助系统给了用户。
二、智能驾驶提升明显 仍需要持续迭代
从整车角度,应该怎么样看待高阶系统的量产?
长城和大部分的整车企业伙伴们一样,都走过一些类似的路,通过发展侧重的不断调整来满足自动驾驶系统的升级与完善。
到第三代智能驾驶系统交付给用户的时候,智能驾驶系统已经是一个能够长期的迭代和成长的平台。所以从2020年或2019年到现在,自动驾驶从一个软硬一体的配置型产品变成了可成长平台型产品,长城认为它是一个要伴随着用户的全生命周期在硬件和软件架构上不断开发和迭代的平台。
时代给了量产高阶自动驾驶系统最佳实践平台和窗口,长城也肩负着这一代C端的价值和使命。在机甲龙上市之后,长城做了很多的用户沟通,杨继峰深刻地感受到智能电动汽车用户在C端发生的变化,用户开始理解他买的不是一个配置或者功能,而是理解为买了一个平台,因此行业把智能驾驶定义成一个1.0、2.0、3.0这样的平台性表达形式。用户对于智驾系统问题的解决带有明确的预期,用户认为在驾驶过程当中遇到的体验槽点是一定要通过OTA去逐步解决的。用户对于整个系统升级有着自己的预期,但是这些预期并不准确,在用户的角度来讲,很难分辨出哪些是这个系统在成长过程中一定可以实现的,哪些是一定不可以实现的,所以也需要更多的从业者和用户之间直面的沟通。
用户对于整个系统成本和功能价值有了不一样的认识,从业者也对于研发架构的认知发生了变化。如果说在几年之前行业是卖产品,今天卖的是整个自动驾驶技术栈本身,包括它的技术理念、软件算法、系统层设计的所有理念,以及在这个平台上的开发者。这些变化在今天来看,一部分已经落地,另一方面依然牵引着从业者在跟用户的整个生命周期里做持续的开发。
▲需要完成的C端价值和历史使命
智驾的系统成本从2020年到2023年,平台硬件成本+数据闭环流量成本加起来,上涨了差不多6-10倍,换来的是什么?换来的是行业已经做了一些挺酷的事情,中国的Navigation Pilot类型的功能走在世界领先地位,智能化标签也超脱了功能层面,成为了企业和品牌层面的竞争标签。但,这些还不够。
从整车角度上,智能驾驶成本在终端无论是订阅率还是选装率都还没有转化成用户价值;在品牌角度上,通过智驾能够形成科技标签且被用户买单的企业还很有限;用户角度上,依然需要很大量的工作去建立对这一代系统的预期和认知。
而这些在2023年需要被开发团队和合作伙伴,和行业整体,最重要的是和用户一起携手去推动,在杨继峰眼里高阶智驾必须要做到全面toC的技术闭环和体验闭环。
三、行业达成多项共识 数据驱动重要性凸显
从技术的架构来讲,自动驾驶行业在哪一阶段?
2022年行业整体完成了很多技术共识,对于新一代的感知架构,大家基本形成了一致的技术意见,多模态加大模型加BEV部署;从高精地图应用的角度来讲,重感知加轻地图被广泛提出,开发团队开始根据自动驾驶的软件需求去定义究竟需要高精地图里的哪些要素,跟地图企业有了更深层次的合作,通过经验图层去实现更智能、更接近真实交通流的场景表现,把车端感知加实时建图的能力做的更好。站在今年,杨继峰觉得有一个很大的变化是终于可以说高精地图不再是一个传统意义的零部件,而是真正深度成为自动驾驶解决方案的一部分。
▲2022年完成的技术共识和实践
2022年完成了L2到L4的架构闭环和数据闭环,车端架构和云端架构的进一步统一。自动驾驶行业基本上已经告别了全量落盘+全量标注,所以对于从业者来说没有足够的车辆和足够数据的竞争其实已经结束了,接下来的竞争是数据挖掘、数据的有效利用以及整个技术栈对数据的理解,以及如何在大规模的基础设施上平衡整个计算效率。
回到今天的题目,在自动驾驶领域谈数据驱动,从业者做了什么?首先很多模块已经发生了变化,从基于规则的视觉特征提取到基于数据驱动的端到端结果的输出;从基于确定数据的地图信息表达到现在一系列新进展和实践的落地,在预测和规划模块,深度强化学习等基础也开始做进一步的探索。
四、高阶智能驾驶离不开数据驱动
当谈到数据驱动的时候,经常会讲用数据驱动的感知、数据驱动的预测、数据驱动的融合、数据驱动的规划、数据驱动的地图,出现一些很激进的讨论,直到今天依然有L4的公司在讨论说,自动驾驶本身到底是不是一个end to end learning 的机器学习问题。
当谈到场景的时候,行业更愿意表达数据驱动如何让场景的体验变的智能,比如跟车的距离不再仅仅定义成它对于时距的一阶线性转成一个固定值等,这样的一些确定函数的表达,而变成了基于场景的更智能的跟车行为。
▲根据场景谈数据驱动
从硬件的角度讲,数据驱动带来的一个很大的特征就是大家开始更关心TOPS,即使是普通用户也会问,这个车的算力是多少TOPS。机器学习这种以AI计算为主的算法进入到量产阶段,所以TOPS就变成了一个用户愿意评价一个硬件好坏的核心指标。
从开发模式的角度讲,在传统的DRE的体系下,自动驾驶可以作为软硬一体的功能包,它的核心开发主要针对每个车型的标定和车配。但是如果定义2022到2023年是高阶智能驾驶辅助井喷的一年,那么接下来所有的开发者都会面临这样一个问题:开发和交付结构变化。只有不断降低自己的代码量,不断使用更多的数据驱动算法,不断的减少对一次性开发和标定的依赖,通过技术栈本身的角度去做整体优化,才能更好的做多个车型的平台开发。
比如通过数据回流实现对交通灯识别率的提升、预测精度的提升,而不是通过不断去修改它的特征的算法,举个例子,在机甲龙这个车型的开发上,长城和合作伙伴Momenta也对于这一观点做了进一步的实践,比如在10天之内通过数据驱动,自动驾驶的预测精度可以提升40%以上。
但是开发团队考虑所有技术点的时候,考虑更多的是这个架构的方案可以走得更远,可以兼容更新的模型,可以更充分的支持人们能看到的开发,但这也意味着增加硬件成本、算力成本、数据成本。所以从OEM的角度来讲,一个中算力加多传感器融合的低成本高集成的方案,也许是在2023年大家会回头去讨论的一件事情。
从产品的角度来讲,一个企业一定会有更高端的车型,像机甲龙,去实现技术栈在全生命周期内的扩展和全生命周期内的交付。但同样针对另一些品牌的车型,也许一个场景上可以覆盖高速高架、城市简单高频的场景、好用的记忆泊车的中算力的解决方案显得更具性价比。所以从定义产品的角度来讲,也许从算法栈可以不追求deep,从场景上可以不那么追求城市的复杂场景,从技术结构可以不那么追求实时车端云端的模型剪枝和蒸馏,从数据回流上可以不那么追求所有场景的全量数据(而是更多的通过数据挖掘和数据应用的效率),从开发模式上不那么追求自研或者说讨论开发以及合作形式的理性,在2023年也是一个不错的选择,当然持续的OTA能力是今年所有车型必须要有的。
▲数据驱动的未来
杨继峰最后说到,面向未来,长城依然在前行。如果把自动驾驶理解为一种服务的话,今天还远远做得不够好,还没有很好的实现体验闭环:驾驶员姿态的变化、用户信心导致驾驶策略变化,DMSOMS感知的信息,以及实时的环境和场景的变化,到今天为止并没有完全进入自动驾驶的系统设计里。长城接下来依然可以一些更智能的体验设计,比如做当驾驶员喝水、实现看向副驾或做一些其他行为、座舱里其他的成员做一些行为的时候,可以关联到此时即时辅助功能的一些驾驶策略。
场景闭环也还没有很好地实现:对于远期的愿景来讲,杨继峰认为自动驾驶可以实现对于局部交通流的安全和效率优化,以及对于全局交通流的如何理解道路的安全、道路的效率、道路的公平。所以在做自动驾驶开发过程中,开发者会被人问起,自动驾驶的车辆和非自动驾驶车辆混行的时候,对于一条道路每小时通行的车辆到底是变多了还是变少了?
运营闭环也还没有很好地实现:长城在2021年开始尝试运营闭环,包括让用户更多地使用这个系统,不断提升系统的MPI,提升系统的场景可能性,提升系统的道路可能性,提升用户对它的认知,以及和用户形成进一步的线上线下的闭环,也开始探索订阅等一系列的商业运营的方式。
未来的自动驾驶如何看待?杨继峰相信行业会从功能驱动的智能驾驶走向场景驱动的智能驾驶,也就是今天开发团队希望用平台型的开发和海量数据驱动软件技术栈实现更多的趋近于全面场景和更拟人化的功能目标。杨继峰希望这一代的智能驾驶技术平台能够从高速走向城市,希望这一代的自动驾驶平台能够真正走向用户,实现完整功能的覆盖和打通。面向未来,他希望自动驾驶应该是智能交通体系下的自动驾驶,它解决的不只是自车的问题,解决的是完整道路流的课题。同时自动驾驶也会成为用户体验的一部分,成为千人千面的自动驾驶体验。
回到数据驱动,杨继峰认为数据驱动的终点可能不止于自动驾驶,自动驾驶行业今天做的是基于数据驱动的软件模块,这是谈数据驱动谈的最多的,从业者们不断地把最新的机器学习研究成果广泛应用于车端的感知、预测、规划,并且搭建了完整的研发基础设施,包括车端和云端的模型自动化的基础设施。接下来做的是基于数据驱动的产品设计,他认为数据驱动会颠覆功能开发的场景定义,现在是通过推理定义一个场景,接下来会做的是通过理解数据和数据空间关系,找到场景和场景之间的关系。
长城也会做更智能的用户体验和人机交互,比如,如果能够通过对预测和决策模块的数据分布特征进行多模块联合优化的话,为什么不能通过DMS、OMS模块和自动驾驶决策模块之间的数据特征做一个千人千面的自动驾驶。像前言所述,如果说用驾驶员的姿态和视线追踪等行为结果关联自动驾驶的场景和驾驶策略去实现一个更智能的体验,这是功能策略和系统层面上进一步实践的话,那么直接在数据空间的数据挖掘、数据分布、数据表达层面形成连接就是一项更为远期的愿景和实践。
杨继峰相信自动驾驶一定会成为企业数字化当中的一部分,所有的数据会以一元化的形式统一挖掘、处理、储存、应用,包括自动驾驶模型最终也不应该是单一系统的形式存在,而是和企业级的AI模型关联。也只有做到这一切,才能真正转型成为一个更加理解数据驱动,整个AI贯穿整车所有数据和所有研发模块的一个智能开发体系,而数据驱动的理念也会伴随着行业进一步实践。