利用深度强化学习在开放世界环境下进行主动射击

深度强化学习(DRL)的最新进展导致了功能强大的代理的开发,该代理可以学习如何直接对原始非结构化数据(例如图像)以端到端的方式执行复杂的任务。但是,这种方法在现实世界中的性能在很大程度上取决于用于训练它们的仿真环境的质量。本文的主要贡献是通过使用最新的图形引擎开发现实的仿真环境,以训练能够控制无人机进行主动射击的DRL代理。与以前的方法(仅依赖于简单的受限数据集)相比,这项工作所采用的环境支持具有挑战性的开放世界环境,为开发适用于各种无人机控制任务的有效RL方法迈出了坚实的一步。这项工作中还引入了一种适当的奖励塑形方法,以确保代理将按预期方式运行,避免不稳定的移动,如通过进行的实验所示。

Leveraging

原文地址:https://ieeexplore.ieee.org/abstract/document/9102966

相关文章

Leave a Comment