这是每个司机的噩梦:行人突然出现在汽车前面,司机只有一瞬间的时间刹车或转向,避免最坏的情况发生。现在有些汽车配备了摄像头系统,可以提醒司机或启动紧急刹车。但这些系统还不够快或不够可靠,如果要将它们用于无人驾驶的自动驾驶汽车,它们需要大幅改进。
使用更少的计算能力实现更快的检测
现在,苏黎世大学 (UZH) 信息学系的 Daniel Gehrig 和 Davide Scaramuzza 将一种新型仿生相机与人工智能相结合,开发出一种系统,该系统可以比现有系统更快地检测汽车周围的障碍物,并且使用更少的计算能力。这项研究发表在本周的《自然》杂志上。
目前大多数摄像头都是基于帧的,这意味着它们会定期拍摄快照。目前用于汽车驾驶辅助的摄像头通常每秒捕捉 30 到 50 帧,人工神经网络可以训练识别图像中的物体——行人、自行车和其他汽车。“但如果在两次快照之间的 20 或 30 毫秒内发生了什么事情,摄像头可能会发现得太晚。解决方案是提高帧速率,但这意味着需要实时处理更多数据,并需要更强的计算能力,”该论文的第一作者 Daniel Gehrig 说。
将两种相机类型的优点与人工智能相结合
事件相机是基于不同原理的一项最新创新。它们没有恒定的帧速率,而是具有智能像素,每次检测到快速运动时都会记录信息。“这样,它们在帧之间没有盲点,这使得它们能够更快地检测障碍物。它们也被称为神经形态相机,因为它们模仿了人眼感知图像的方式,”机器人和感知小组负责人 Davide Scaramuzza 说。但它们也有自己的缺点:它们可能会错过缓慢移动的物体,而且它们的图像不容易转换成用于训练人工智能算法的那种数据。
Gehrig 和 Scaramuzza 提出了一个混合系统,将两者的优点结合起来:它包括一个每秒收集 20 张图像的标准摄像头,与目前使用的摄像头相比,这个帧率相对较低。它的图像由一个称为成交量积神经网络的人工智能系统处理,该系统经过训练可以识别汽车或行人。事件摄像头的数据与另一种称为异步图神经网络的人工智能系统相结合,该系统特别适合分析随时间变化的 3-D 数据。事件摄像头的检测结果可用于预测标准摄像头的检测结果,并提高其性能。“结果是视觉探测器可以像每秒拍摄 5,000 张图像的标准摄像头一样快速地检测物体,但需要的带宽与每秒 50 帧的标准摄像头相同,”Daniel Gehrig 说。
使用更少的数据,检测速度提高一百倍
该团队将他们的系统与目前汽车市场上最好的摄像头和视觉算法进行了测试,发现该系统可将检测速度提高一百倍,同时减少摄像头和车载计算机之间必须传输的数据量以及处理图像所需的计算能力,而不会影响准确性。至关重要的是,该系统可以有效检测在标准摄像头的两个连续帧之间进入视野的汽车和行人,为驾驶员和交通参与者提供额外的安全保障——这可以产生巨大的影响,尤其是在高速行驶时。
据科学家介绍,通过将摄像头与 LiDAR 传感器(如自动驾驶汽车上使用的传感器)集成,这种方法在未来可能会变得更加强大。Davide Scaramuzza 表示:“像这样的混合系统对于实现自动驾驶至关重要,既能保证安全,又不会导致数据和计算能力大幅增长。”
资讯来源:由a0资讯编译自THECOINREPUBLIC。版权归作者A0资讯所有,未经许可,不得转载