(资料图片)
本专栏将展示一系列经典的强化学习算法在AirSim无人机仿真中的应用,主要参考了莫烦python的视频教程。 本文章是记录 Q-learning 和Sarsa learning 控制无人机到达指定坐标点的简单实验记录,为了简单起见,现在仅控制x轴方向移动
下面是使用Q-learning算法训练100个个episode后的效果
其中 data 文件夹用于存放配置文件以及数据等,另外一个文件夹用于存放代码文件。
configs文件编写在 data 文件夹下建立一个 configs.yaml文件,写入以下内容
二、Q-learning和Sarsa learning代码实现
三、环境交互实现
总结 该文章仅仅实现了一个方向的控制,下一篇文章将会改进,以及使用更多其它的强化学习算法。 由于博主最近较忙,文章没有详细解释,不过有问题疑问可以留言评论,看到后会及时回复。
标签:
08-04 13:24:20
08-04 12:46:58
08-04 12:01:06
08-04 11:16:34
08-04 10:48:22
08-04 10:12:53