首页 > 热点 > 正文

AirSim中使用强化学习算法Q


(资料图片)

文章目录 前言0、准备工作代码工程结构configs文件编写 一、主函数逻辑编写二、Q-learning和Sarsa learning代码实现三、环境交互实现总结 前言

本专栏将展示一系列经典的强化学习算法在AirSim无人机仿真中的应用,主要参考了莫烦python的视频教程。 本文章是记录 Q-learning 和Sarsa learning 控制无人机到达指定坐标点的简单实验记录,为了简单起见,现在仅控制x轴方向移动

下面是使用Q-learning算法训练100个个episode后的效果

0、准备工作 代码工程结构

其中 data 文件夹用于存放配置文件以及数据等,另外一个文件夹用于存放代码文件。

configs文件编写

在 data 文件夹下建立一个 configs.yaml文件,写入以下内容

二、Q-learning和Sarsa learning代码实现
三、环境交互实现
总结

该文章仅仅实现了一个方向的控制,下一篇文章将会改进,以及使用更多其它的强化学习算法。 由于博主最近较忙,文章没有详细解释,不过有问题疑问可以留言评论,看到后会及时回复。

标签:

上一篇:《王者荣耀体验服》官网申请入口链接
下一篇:最后一页
快讯
热点
精彩推送
社科