文 | 来源·auto.gasgoo.Com auto.gasgoo.Com

盖世汽车讯 一项新研究表明,大型语言模型(LLM)可以作为自动驾驶汽车的有效决策者,有逻辑地思考复杂的场景。据外媒报道,清华大学(Tsinghua University)、香港大学(the University of Hong Kong)和加州大学伯克利分校(University of California, Berkeley)的研究人员探讨利用LLM进行高级决策的自动驾驶技术。

图片3.png

(图片来源:arxiv.org) 

这项研究证明LLM可以成功地理解交通场景,根据相关规则做出合理的判断,并为其决策提供清晰的解释。相关论文于10月4日发表在预印本期刊网站(arXiv)上。

现有基于深度学习的自动驾驶系统具有发展潜力,但在处理罕见事件和提供可解释性方面仍面临挑战。因此,该论文中提到:“LLM可以像人类一样思考,并结合常识来推理新场景,可见的思维过程使其具有很强的可解释性。当前基于学习的自动驾驶系统在适应性和透明度方面存在局限性,而LLM具有推理能力和可解释性,有助于解决这些问题。”

为了充分利用LLM的优势,研究人员设计出结构化思维过程来管理推理步骤。该LLM可以收集相关信息,评估驾驶场景,并提供高级行动指导。然后,将这些文本决策转换为指导低级控制器的参数。大量实验表明,使用该方法可以大幅提高性能。

相较于强化学习和优化方法,在各种驾驶任务(包括十字路口、环岛和紧急操作)中使用LLM增强系统可以大幅降低成本,并提高安全性。该论文称:“考虑到安全性、效率、通用性和互操作性,本文介绍了利用LLM作为复杂自动驾驶场景的有效决策者的第一步。”

除了可量化指标,LLM还表现出类似于人类驾驶员的态势感知和适应性。例如,当另一辆车拥有通行权时,它会适当减速,而不是仅仅优化效率。

虽然仍处于早期研究阶段,但这项开创性工作为持续发展奠定了基础。该论文最后总结道:“希望它能对该领域未来的研究起到启发作用。”