您的位置:
首页
>
中文期刊论文
>
详情页
基于DDPG算法的末制导律设计研究
- 作 者:
-
刘扬;
何泽众;
王春宇;
郭茂祖;
- 作者机构:
-
哈尔滨工业大学计算机科学与技术学院;
北京建筑大学电气与信息工程学院;
- 关键词:
-
确定性策略;
强化学习;
归纳偏置;
末制导律;
- 期刊名称:
- 计算机学报
- 基金项目:
-
可微分深度注意模型及其参数自适应方法研究
基于无监督的图嵌入表示学习算法研究
- i s s n:
- 0254-4164
- 年卷期:
-
2021 年
44 卷
009 期
- 页 码:
- 1854-1865
- 摘 要:
-
末制导律设计是拦截系统中的关键技术,常用的比例制导律及其变型在目标大机动时性能下降,且受到导航比的影响.提出基于DDPG算法的末制导律设计方法,通过对拦截问题的环境状态和动作(控制量)进行设计,实现了从仿真环境交互数据中学习回报最优的制导律;与传统方法相比,该无模型方法更具灵活性;针对强化学习方法动作集假设偏置弱带来训练效率低的问题,进一步提出将导航比作为决策优化参数,加速了训练过程并实现动态调整比例制导律中的导航比.对比实验表明,两种强化学习末制导律设计方法获得了优于比例制导律及其变型的拦截效果,展现出良好的研究前景和潜在的应用价值.
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...