建筑工地成无人车噩梦 Waymo栽跟头多到被约谈

0 智能车参考 2024-05-19 15:48:51

摘要：

Robotaxi，防火防盗防“建筑工地”。Waymo就栽了。北美监管部门刚刚又开启了针对Waymo无人车的调查，起因是收到一系列相关事故报告。有撞上路边停放车辆的，有撞静止障碍物的，阻塞交通的…以及一个不寻常高频场景：建筑工地。

发生了什么

大概3个月内，Waymo积累上报了22起事故，引起了美国国家公路交通安全管理局的注意。

根据NHTSA的文件显示，这些事故包括Waymo无人车和静止和半静止物体（比如门）相撞、与停放车辆相撞以及违反交通安全控制装置的情况。

其中“违反交通安全控制装置”官方特别说明是一个重点调查方向，一个典型场景就是自动驾驶系统对交通锥/雪糕筒的检测识别能力。

这个点比较罕见。因为这次上报的22起事故中，很多都涉及同一种场景——建筑工地。

比如上个月，6辆编队行驶的Waymo Robotaxi，下班收工回停车场，结果遇到了施工现场临时交通管制，直接卡死在雪糕筒围成的临时通行区，造成了大约半个小时交通拥堵。

有本地生活经验的网友立刻就认出来，这是旧金山 Potrero 大道 101 号匝道，Waymo无人车卡死的地方，刚好是高速入口。

最后，是路上的司机老哥直接下车手动挪开雪糕筒，后面的车队依次绕过几辆“瘫痪”的无人车。

Waymo方面出了一个简单声明，大意是30分钟内就派人去现场挪车了，没有造成任何伤亡和财产损失，后续会配合调查。

不过在凤凰城的建筑工地，就没这么幸运了。

同样一辆Waymo无人车，无视了雪糕筒围出的施工区域，直接冲进了建筑工地。

幸好速度不快没撞到人，不过车辆本身、工地现场都有不同程度损失。

类似这样的事故很多，每次无人车“冲进工地”的小视频，都会在网络上疯传。

网友总结的很生动：交通锥就是Robotaxi的氪石（kryptonite），现在再神通广大的自动驾驶，遇到封闭道路的交通锥，都得完蛋。

咦？好像跟Waymo官方秀出的视频不太一样呀。

为什么建筑工地难？

Waymo第五代自动驾驶系统绕行施工区，曾被当做技术亮点专门解析过。

官方的Demo中，无人车面对的场景更加复杂，除了交通锥、不规则区域，还有来回走动的工人。

Waymo无人车当然是毫不费力完成了一系列避让、绕行动作，顺利通过了施工区域：

这里面让人啧啧称奇的是，Waymo无人车似乎能够看懂人类指挥交通的肢体语言，让停就停，让走就走，而不仅仅以路面条件作为依据。

怎么做到的？Waymo负责预测算法的工程师Maya Kabkab简要解释了一下，大意是第五代技术中，Waymo加强了对不同物体目标的理解能力，以及对可通行区域的识别能力，这两项使得系统能更好规划通行路线。

核心是用全新模型VectorNet替代CNN，提取传感器和高精地图信息。

简单的说，是将高精地图和传感器输入信息表示为点、多边形或曲线，VectorNet则将所有道路特征和其他对象的轨迹表示为相应的向量。基于这个简化的视图，VectorNet可以提取每个向量的信息以及学习不同向量之间的关系。

好处是VectorNet比CNN占用计算资源更少，出结果的速度更快，理论上也能更加清晰的提取出关键场景信息。

但VectorNet仍然没有解决“建筑工地”难题的核心——

“建筑工地”本身是高精地图的例外，不可能同步更新，只能靠传感器实时感知。

但传感器的数据在不同子模型之间依次传递，信息损失难以完全避免。

Robotaxi频繁出现被建筑工地卡死，直接原因是对交通锥、异形物的错检漏检。

而深层原因，是传统自动驾驶技术范式存在能力的上限、天花板，难以覆盖路上所有的corner case。

所以能不能顺利避让建筑工地，成了一种概率事件：官方Demo精雕细琢反复测试，那没问题；单上路实测，就只能看天吃饭了。

端到端能解吗？

“遇事不决量子力学”，是一句调侃。

但在自动驾驶领域，遇事不决，的确都可以“端到端”一下。

所谓“端到端”是针对传统技术范式而言的，其中自动驾驶的感知、决策、规控等等互相独立。传感器采集到的数据，需要通过这一系列不同的算法模块，最终才能“变成”操作指令。

每个独立模块之间的信息是逐级传递的，在这个过程中必然会存在信息的丢失和误差，而且前一个模块的误差会影响到下一个，多个模块之间的信息误差会不断累积，进而影响到自动驾驶方案的整体效果。

无论是纯视觉感知，还是融合感知，“错检漏检”的根源就在这里。

当然也有对应的解决办法，那就是通过人手写的规则，尽量打补丁提高感知识别的可靠性。比如能识别车、人，但识别不了“人站在车前”，那好办，直接将这类目标单独建一个数据集拿来训练模型不就行了？

这就是所谓感知“白名单”机制。

但问题是，很难穷举所有种类的交通目标和场景，这次解决了“人在车前”的问题，但如果车从乘用车变成大卡车呢？或者一个人变成大人牵小孩呢？

对于Robotaxi的建筑工地难题来说也是一样，工地可能临时出现，随机刷新，不会限定区域限定时间，而每家工地的搭建、施工路障都不一样…

所以从感知开始就实现信息的无损传递，让系统真正理解环境，需要有一个全新的算法范式——端到端算法模型。

两个端分别指数据输入端和指令输出端，中间不再分成几个相互独立的模块。

端到端模型能够通过完全数据驱动的模式，将其学到的能力和技巧迁移泛化到其他场景当中，自主且高效解决行泊场景中新出现的各类长尾问题，具备更快的迭代效率，有效降低开城成本。

通俗的说，就是让AI司学习人类成熟驾驶行为，看到一种场景，做出相应对策。实际上“端到端”已经摸到了AGI的门槛。

2016年端到端模型由英伟达首次提出。但真正得到量产实践这两年才开始。目前只有特斯拉的FSD和中国AI玩家的CVPR 2023最佳论文——UniAD。

智能车参考也分别就Waymo遇到的工地难题询问了这两家国内自动驾驶头部玩家的看法。

地平线从工程实践角度出发，认为：

自动驾驶的工地难题和端到端技术范式并不是绑定的。理论上讲，感知能力足够强、感知白名单足够丰富也是能解决问题的。

但显然，端到端的自主学习能力、类人思考会更大规模更高效率的解决这个问题。

而商汤的看法更加从“第一性原理”出发，绝影智驾相关技术专家相关认为：

不对具体的case进行评价。但基于规则的传统智驾方案的感知还是人为定义要素，并对感知信息进行抽象提取，这就会导致信息传递过程的损失和遗漏，让感知决策模块难以作出正确的决策。而端到端是在一个神经网络中，将外部环境的信息无损输入和传递，更准确和完整地理解外部交通环境，并作出规划和决策。

规则方案可以通过增加规则、添加补丁解决一个场景。但是这样的场景不会只有一个，是无限的。而足够多的数据进行学习训练之后，端到端方案可以像人一样思考、开车，自己解决更多类似的corner case。

总结一下，地平线和商汤表述不同，但核心一样，都认可端到端是解决Robotaxi工地难题最有效的方法。同时还是解决自动驾驶各类长尾问题的最高效途径。

对了多说一句，提出UniAD的CVPR 2023最佳论文，地平线和商汤的学者都参与了撰写。

端到端对传统技术范式革新，给了所有玩家新的机遇：更好的智驾体验、更低的维护、泛化成本，以及更有竞争力的自动驾驶方案成本。

但代价是以往模块化的、规则驱动主导的技术体系，必须推倒重构。

昔日自动驾驶绝对领军者Waymo，如今陷入“建筑工地”困境中，更加证明自动驾驶这条赛道“水无常形，兵无常势”：

老牌明星可能会优势归零重置，“后来者”也会获得领先优势。

我们在FebBox(https://www.febbox.com/cnbeta) 开通了新的频道，更好阅读体验，更及时更新提醒，欢迎前来阅览和打赏。

最新资讯

加载中...

今日最热

加载中...