文 | 来源·auto.gasgoo.Com auto.gasgoo.Com

盖世汽车讯 据外媒报道,叶史瓦大学卡茨学院(Katz School)的研究人员推出自动驾驶汽车卷积神经网络(CNN)模型,可以减少与自动驾驶汽车相关的交通事故数量。因其在机器学习算法方面的杰出贡献,叶史瓦大学卡茨学院还获得未来技术会议(Future Technologies Conference)颁发的新兴研究奖(Emerging Research Award)。图片1.png

(图片来源:叶史瓦大学)

卡茨学院人工智能和计算机科学助理教授Youshan Zhang和人工智能硕士候选人Lakshmikar Polamreddy表示,这种自动驾驶汽车卷积神经网络(CNN)模型旨在解决该领域以往工作的局限性。

该LaksNet模型使用从Udacity模拟器收集的图像和转向角度。Udacity模拟器是用于训练和测试自动驾驶深度学习算法的开源模拟器,包括对汽车及其周围环境的虚拟表示(virtual representation),支持用户实施和测试任务(如感知、决策和控制)算法,从而为学习和试验自动驾驶技术提供安全的环境。Zhang表示:“这种方法涉及使用大量数据(通常以从摄像头收集图像的形式)来构建和训练端到端机器学习模型。这些模型被训练成以尽量减少事故的方式驾驶车辆。”

CNN是专为图像识别和处理而设计的人工神经网络,其灵感来自于人脑的视觉处理,其特点是能够自动学习图像特征的空间层次结构。它们已成为许多计算机视觉应用的支柱,包括自动驾驶汽车、面部识别、图像分类和医学图像分析。

研究人员此次开发的CNN模型名为LaksNet,使用由Udacity自动驾驶汽车纳米学位项目(Udacity's self-driving car nanodegree program)提供的模拟环境来生成训练数据并评估模型性能。该方法使用13万张图像及其在Udacity模拟器中生成的相关转向角来训练CNN模型。在经过所需数量的纪元(epoch,纪元是一次完整的训练数据集传递)训练后,该模型可用于预测转向角值,然后将其传递到模拟器中。Polamreddy表示:“纪元太少可能导致拟合不足,即模型无法了解数据中的潜在模式。另一方面,太多的纪元可能会导致过度拟合,使模型过度专注于特定的训练数据,并且在新的、未见过的数据上表现不佳。”

研究人员利用LaksNet来评估英伟达公司(NVIDIA)开发的模型性能。该模型的设计旨在直接根据摄像头视频中的原始像素来预测转向角。研究人员随后探讨了预训练ImageNet模型能否超越英伟达模型。预训练ImageNet模型通常用于各种计算机视觉任务,包括自动驾驶汽车中的对象识别和检测。

在测试阶段,研究人员监控终端上的转向角度,并在模拟器窗口实时观察汽车的运动状况。它为训练和测试提供了两条不同的轨道,通过三个安装在不同角度的摄像头拍摄图像。他们还收集汽车的视图,包括跑道、汽车本身和跑道外的环境。

由于预训练模型没有达到英伟达模型设定的期望值,研究人员开始针对这项任务构建自己的CNN模型。其中一款定制CNN模型的性能优于预训练模型和英伟达模型,使汽车可以在跑道上自动行驶150秒。Zhang表示:“我们开发了一种新颖的模型,其中有两个主要目标,包括实现最先进的性能和使用更少的参数进行训练。这种模型对于减少自动驾驶事故更加高效和有效。”