您的位置: 首页 > 中文期刊论文 > 详情页

引入势场及陷阱搜索的强化学习路径规划算法

作   者:
董培方张志安梅新虎朱朔
作者机构:
南京理工大学计算机科学与技术学院南京理工大学机械工程学院
关键词:
Q值初始化人工势场陷阱搜索强化学习路径规划
期刊名称:
计算机工程与应用
基金项目:
基于钨丝增强锆基非晶复合材料分段伸出式弹芯高速侵彻机理
i s s n:
1002-8331
年卷期:
2018 年 16 期
页   码:
129-134
摘   要:
移动机器人在复杂环境中移动难以得到较优的路径,基于马尔可夫过程的Q学习(Q-learning)算法能通过试错学习取得较优的路径,但这种方法收敛速度慢,迭代次数多,且试错方式无法应用于真实的环境中。在Q-learning算法中加入引力势场作为初始环境先验信息,在其基础上对环境进行陷阱区域逐层搜索,剔除凹形陷阱区域Q值迭代,加快了路径规划的收敛速度。同时取消对障碍物的试错学习,使算法在初始状态就能有效避开障碍物,适用于真实环境中直接学习。利用python及pygame模块建立复杂地图,验证加入初始引力势场和陷阱搜索的改进Q-learning算法路径规划效果。仿真实验表明,改进算法能在较少的迭代次数后,快速有效地到达目标位置,且路径较优。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充