自动驾驶深度分析：决策算法成竞争焦点，呼唤新计算平台-矿山系统工程研究所

科研文库

当前位置: 首页 >> 科研文库 >> 系统工程 >> 正文

自动驾驶深度分析：决策算法成竞争焦点，呼唤新计算平台

作者：李星宇地平线副总裁

来源：智车科技

决策算法成为竞争焦点

从技术角度讲，自动驾驶由三大主要技术构成：感知、决策和控制。那现在自动驾驶技术真正的门槛在哪里？

如果你去CES参观各家公司的自动驾驶样车，你会发现一个趋势：各家公司的传感器配置越来越趋同化：前视多目摄像头，77GHz长距/短距雷达、环视摄像头、加上十个以上的超声波雷达，豪华一点的再配上几个低线束的激光雷达，这些传感器的供应商也差不多。

在感知层面，随着ADAS的大量部署和长时间的技术开发，已经相当成熟，可以说感知技术已经不是主要的瓶颈。而控制则是传统车厂和Tier1非常擅长的领域，做了很多年，积累了大量的经验。

自动驾驶在技术上的竞争，主要聚焦于决策环节。事实上，区分一个系统是ADAS还是自动驾驶，也主要是看该系统是否有决策部分。无论是谷歌，还是特斯拉，他们的核心竞争力，都还是体现在其决策算法方面。

传统汽车界的研发是基于功能安全的设计方法学建立的，渗透到开发流程的每一个环节，并且在过去一个世纪，将汽车的安全性提高到了极高的水准。

如今，顶尖的公司已经可以确保汽车发动机能使用一百万公里！但是面对汹涌而至的机器学习热潮，传统汽车界突然发现自己严重缺乏技术储备，面对特斯拉和谷歌激进的策略，显得力不从心。

这已经成为制约传统车厂开发自动驾驶的最大短板，目前，传统车厂或者大肆收购机器学习公司，或者与其合作，他们需要尽快补上这块短板。

传统车厂出身的克拉富西克显然深知这一点，在他出任Waymo CEO之后，谷歌一改之前模棱两可的商业策略，明确表示向车厂提供解决方案，并迅速宣布和本田合作，事实上是将自己定位在Tier 1的角色。

此前谷歌虽然在技术积累上处于领先位置，但一直没有确定可行的商业模式，克拉富西克的到来，让谷歌对于商业化的态度更接地气，也更精准。在该解决方案中，硬件基本也是外购的，显然无法成为谷歌的竞争壁垒，最有价值的，还是一整套经过验证的软件，尤其是其中的决策算法。可以想象的是，谷歌将会向业界提供软件授权，就像它之前在安卓系统上所做的一样。

理性决策是必然趋势

决策算法面临的最大挑战，就是如何达到自动驾驶所需要的极高的安全性和可靠性。自动驾驶决策的结果会输出到控制器，根据ISO26262已有的功能安全的规定，这会反过来要求决策系统也需要达到ASIL-D的标准。

目前，ISO组织对专门针对自动驾驶的功能安全标准正还在制定中，有可能会用一种新的标准进行考量，但功能安全的基本原则依然有效。

端到端的AI方法有隐患

这意味着，我们必须严肃地思考，如何才能满足功能安全的要求？对于谷歌、百度以及许多初创公司，这些非传统车厂出身的玩家来说，是一个全新的命题。

目前，很多创新公司都在使用深度学习加增强学习做端到端的训练，也就是说，从传感器的输入直接导出控制器（刹车、油门、转向等）的输出。但深度学习的问题在于它失去了透明性，仅仅依赖于概率推理，也就是相关性，而非因果推理，而这两者是有本质不同的。

相关并不意味着因果。举个例子，统计发现，手指头越黄的人，得肺癌的比例越大。但事实上，手指的颜色和得肺癌的几率之间显然没有直接的因果联系。那么为什么统计数据会显示出相关性呢？这是因为手指黄和肺癌都是由吸烟造成的，由此造成了这两者之间产生了虚假的相关性。

深度学习就像一个黑盒子，无法进行分析，出了事情你不知道原因到底是什么，也没有办法预测下一次会出什么状况。

有一个很搞笑的例子，用深度学习训练一个系统，来分辨哈士奇和爱斯基摩狗，初步测试效果非常好，但进一步的测试表明，这个系统其实是通过区分背景，而不是狗本身来判定其种类的，因为训练所使用的样本中，爱斯基摩狗几乎总是伴随者雪地的背景，而哈士奇则没有，想想看，如果这样的系统应用到自动驾驶，是多大的隐患！

深度学习的实际表现，基本上取决于训练的样本以及你所要求输出的特征值，但如果你的样本比较单一，输出特征值又比较简单，则很容易训练出你并不想要的结果来。就自动驾驶而言，这是无法接受的，它需要高度的理性决策。

如今，深度学习的热潮席卷了整个业界，很多人不再对基础算法进行钻研，而是疯狂加大数据，堆机器进行训练，以期更快地出成绩，结果看上去还不错，但这样的非理性态度其实是给自动驾驶埋下了隐患。我们需要的是对于事实逻辑的深入分析，以及不同方法论的结合，从这个意义上讲，如果用小数据可以达到好的效果，更能说明我们对机器学习技术的理解能力。

基于规则的专家系统不灵活

传统的主机厂和Tier 1面临的则是另外的问题。如果接触各大Tier1的ADAS产品，无论是AEB,还是ACC，LKA，你会发现都是基于规则的专家系统。这种系统精确可分析，但专家系统的问题在于，在场景非常多变时，创建的规则就无法保证足够的覆盖面。

结果，当添加更多新的规则时，就必须撤消或者重写旧的规则，这使得这个系统变得非常脆弱。并且，各个功能都有自己单独的规则，组合到一起，其可能性就非常多，甚至还存在矛盾，这使得ADAS向自动驾驶过渡之路变得更加艰难。

我曾经跟一家主机厂在交流他们的决策系统时曾询问过这个问题，得到的答案是：这种基于专家系统的规则经过组合，能产生一万种可能！你甚至很难对这个系统进行完整的测试。

新的决策机制：因果推理

因此，我们需要在自动驾驶领域引入新的决策机制。自动驾驶决策技术路线的一个重大趋势，就是从相关推理到因果推理。这样的人工智能框架是Judea Pearl在八十年代建立的，他也因此拿到了图灵奖。

上世纪 80 年代初，Judea Pearl为代表的学术界出现了一种新的思路：从基于规则的系统转变为贝叶斯网络。

贝叶斯网络是一个概率推理系统，贝叶斯网络在数据处理方面，针对事件发生的概率以及事件可信度分析上具有良好的分类效果。它具有两个决定性的优势：模块化和透明性。

模块化的优势非常重要，例如，假如任务是更新汽车的变速箱，当变速箱被更换的时候，你不必重写整个传动系统，只需要修改为变速箱建模的子系统，其余的都可以保持不变。

因此，我们可以把深度学习的系统作为一个子模块融入到其中，专家系统可以是另一个子模块，也融入其中，这意味着我们有了多重的冗余路径选择，这种冗余构成了贝叶斯网络的子节点，将有效强化输出结果的可靠性，避免一些低级错误的发生。

透明性是贝叶斯网络的另一个主要优势。对于自动驾驶而言，这尤为关键，因为你可以对整个决策的过程进行分析，了解出错的哪一个部分。

可以说贝叶斯网络是理性决策的极佳实现，适合用于设计整个决策的顶层框架。

因果推理的另一个典型范例就是基于增强学习的决策框架，它把一个决策问题看作是一个决策系统跟它所处环境的一个博弈，这个系统需要连续做决策，就像开车一样。优化的是长期总的收益，而不是眼前收益。这有点像巴菲特的价值投资，优化的目标不是明天的收益，而是明年或者十年以后的长期总收益。

谷歌把这样的框架用在下围棋上，取得了革命性的成功。自动驾驶的场景也非常适合应用这样的决策系统。比如说要构建价值网络，评估当前的驾驶环境风险，评估的是从现在时间到未来时间的整体风险；然后利用策略网络输出本车的控制决策，选择最优的驾驶路径和动力学输出。

同时，我们还可以构建一个基于模拟路况的仿真环境，通过增强学习去做虚拟运行，获得最优的决策模型，并且还将产生大量的模拟数据，这对决策算法的成熟至关重要。

可以说，向因果推理型决策模型转化是自动驾驶技术迈向成熟的重大标志。

目前的硬件效能达不到实用要求

对于自动驾驶这样的复杂任务，在设计软件的同时，还必须考虑与之匹配的硬件效能，这里包括性能、功耗和功能安全。

为了保证自动驾驶的实时性要求，我们需要保证软件响应的最大延迟在可接受的范围内，对于计算资源的要求也因此变得极高，目前，自动驾驶软件的计算量达到了10个TOPS（每秒万亿次操作）的级别，这使得我们不得不重新思考对应的计算架构。

图灵奖获得者Alan Kay，他有一句话是乔布斯一直信仰的：如果你严肃地思考你的软件，你就必须要做你自己的硬件。

事实上，整个数字半导体和计算产业的产业驱动力，正在从手机转向自动驾驶，后者所需要的计算量比手机要大两个数量级。

福特第二代Fusion自动驾驶原型车后备箱中鼓鼓囊囊地塞满了计算设备

今天，打开任何一家主机厂的无人车的后备箱，都是一堆计算设备，不但没有地方放行李，而且还要解决它的整个系统稳定性问题。之前在乌镇举行的世界互联网大会，记者在实际体验百度的无人车时，提到非常有趣的一点：“这辆无人车平稳地行驶了起来，但位于后备箱的车载计算机噪音较大，可以听到风扇在运行的声音。”

为什么呢？因为它使用的是CPU+GPU+FPGA的计算平台，计算所需要的功率非常大，GPU尤其恐怖，如果没有强力风扇来散热的话，夏天很容易烧坏机器。坐在这样的车里，就别讲究体验了。

功能安全是另一个巨大的挑战，这里面其实包含了多个方面的要求：处理器要符合至少ASIL-B等级的要求，可靠性需要能够保证在至少十年的使用期内不出问题。

高通在手机领域有非常强的实力，而且向汽车电子进军的努力也从未停止，但去年高通依然决定花370亿美元重金收购了汽车电子老大NXP，这从另一个侧面折射出汽车电子的门槛之高。

人工智能处理器与自动驾驶计算平台

这让我们想起计算机的发展历史，50年代是大型机的时代，那个时候一台大型机可以占据实验楼的一整个楼层，需要一个庞大的团队来操作，价格高到数百万美元；七十年代小型机占据主导，小型机可以安装进一个房间，价格也降到数万美元；八十年代是PC时代，可以摆放到桌面，价格则又降低了一个数量级，如今是手机，可以装进口袋；贯穿其中的是三个主要方面的进步：体积、功耗和成本。

人工智能所需要的处理器，从2012年开始业界已经开始广为关注，比如从GPU到FPGA，再到TPU，业界也沿着之前计算机走过路，重构人工智能所需要的处理器。

英伟达在本届CES上发布了最新的车载计算平台“XAVIER”，512 个 Volta CUDA 核心可提供高达 30 TOPS的计算性能，但最引人注目的还是其30W 的功耗，大大低于之前还需要水冷的Drive PX2。这是一个很大的进步，但还不够，要让自动驾驶得到普及，性能、功耗、成本和体积因素，一个也不能少。

英伟达Xavier自动驾驶超级计算平台

如今很多车厂都制定了非常激进的自动驾驶开发计划，但其实样车开发与其投入到量产车的日程表其实是差异非常大的。与量产车的设计理念完全不同，量产车必须考虑成本因素，不能跟今天的GPU或者其它的计算所需要的成本一样，而这就需要业界提供新的计算平台。

FPGA被越来越多的公司关注，其可编程特性可以满足专有计算构架的需求，微软、Intel等公司都在大量部署基于FPGA的系统。

FPGA在ADAS方面的出货量也在迅速增加，去年的出货量应该不会低于3Mu。但FPGA再往上走，计算资源的扩展会让成本上升到很难接受的地步。半导体业界无数的历史都表明，FPGA往往是定制化ASIC的前哨站，一旦某个应用的量足够大，定制化ASIC就会变得更经济。

地平线机器人则希望借助自己的研究优势，目标是将原本智能在云端运行的人工智能，实现在高性能低功耗的大脑引擎（BPU）上。这是一个全新的计算构架IP，将充分适配深度神经网络算法的要求，由此带来革命性的嵌入式人工智能，预计其成本和功耗都将比现有GPU低一个数量级。这样的IP 可以嵌入到SoC中，或者单独作为协处理器使用。目前地平线正在推进代号为“高斯”的计算构架IP的开发，预计17年底推出。

地平线BPU战略

软硬件协同设计是新的趋势

在过去，处理器都是作为标准平台提供给业界，软件工程师拼命优化编译器、代码、任务调度等来达到更高的性能表现，但现在，这已经无法满足产品快速上市的要求了。

英伟达在AI业界攻城略地，几乎已经成为标配，这其中有其高性能GPU的因素，但问题在于，为什么其它GPU供应商没有赢得这场竞争？

英伟达不仅提供GPU硬件，还提供了高度优化的CUDA平台，该平台封装了大量高频使用的数学运算库，英伟达更进一步面向自动驾驶提供了端到端的解决方案，这实际上是一种重要的产品理念：软硬件协同设计。

这揭示了英伟达市场竞争成功的秘诀：通过软硬件协同设计，优化软硬件系统的性能表现，缩短客户导入时间，赢得市场。

英伟达从云到车端对端的自动驾驶平台解决方案

新的自动驾驶计算平台，实际上是因应算法和软件的需求而来的，例如，为了更好地支持深度卷积神经网络极大规模的矩阵运算，你需要考虑如何使用二值化方法来降低对于硬件乘法器的需求，如何重新设计缓存机制以避免I/O带宽成为整个计算系统的瓶颈等。为了满足功能安全的需求，你需要硬件级别的虚拟化，这就要求处理器构架设计方面需要考虑多核、VMM、设备I/O请求管理等。

Intel也在加强其在人工智能算法方面的积累，对Nervana和Movidius的收购反映了这一点。通过提供至强处理器、FPGA，结合其Nervana平台以及面向深度学习优化的数学函数库（MKL），提供完整的AI解决方案。

能否提供同时满足经济性和性能要求的计算平台，是自动驾驶能否从样车转向量产车的关键因素之一。

结语

公众对于自动驾驶依然有深深的疑虑，但在每一次革命性的交通运输方式出现时，类似的疑虑都曾经存在过。航空服务刚刚出现时，安全性非常低，多数人甚至都不相信金属构造能飞起来。

美国海军统计表明，在二战期间，因技术原因损失的飞机达2100架，是被击落飞机的1.5倍，但航空业依然发展了起来；高铁同样有类似的经历，19世纪火车刚刚出现时，即使是最有远见的人都无法想象时速超过300公里的列车，那时候的人们认为仅仅是气压的问题就足以让乘客丧命，而后来这些都成为了现实，并且发展了体量惊人的配套基础设施：铁道和机场。

当技术不存在原理性的问题之后，只要有巨大的商业潜力，利益的驱动终能克服技术上的挑战。

如果我们考察一段文明的发达程度，运输水平可能是最直观的指标。唐代玄奘取经，鉴真东渡，耗去的是一个人半生的时间，这里体现的是客运成本；南宋时期，从福建泉州出发的瓷器运到欧洲，增值达一百倍，体现的是货运的价值；19世纪美国的崛起，很大程度上得益于其全国铁路网的建立，将联邦的各个州融合成为一个单一市场。

文明的发展过程，也必然伴随着运输成本的逐渐降低，以及运输效率的持续提升，它深刻重塑了经济的形态。Elon Musk的终极梦想是殖民火星，同样是一个运输能力改变文明的故事，自动驾驶就是当下发生的故事，当人的劳动力被释放之后，成本下降就会驱动一波全新的机会。过去一年里，自动驾驶领域的进步已经超出了绝大多数人的预期，自动驾驶的未来值得期待。

地平线机器人技术主攻嵌入式人工智能方向，致力于提供面向自动驾驶的高性能、低功耗、低成本的嵌入式人工智能解决方案。2017年CES，地平线联合英特尔推出了一款基于单目摄像头和FPGA的ADAS产品原型系统，其优越性受到众多国际国内知名Teri1及OEMs的认可。

上一条：人工智能是什么，你真的了解人工智能吗？
下一条：机器人读懂人心的九大模型