基于DDPG算法的末制导律设计研究-中文期刊论文-农业学术服务平台

您的位置：首页 > 中文期刊论文 > 详情页

基于DDPG算法的末制导律设计研究

作者：: 刘扬; 何泽众; 王春宇; 郭茂祖;

作者机构：: 哈尔滨工业大学计算机科学与技术学院; 北京建筑大学电气与信息工程学院;

关键词：: 确定性策略; 强化学习; 归纳偏置; 末制导律;

期刊名称：: 计算机学报

基金项目：: 可微分深度注意模型及其参数自适应方法研究
 基于无监督的图嵌入表示学习算法研究

i s s n：: 0254-4164

年卷期：: 2021 年 44 卷 009 期

页码：: 1854-1865

摘要：: 末制导律设计是拦截系统中的关键技术,常用的比例制导律及其变型在目标大机动时性能下降,且受到导航比的影响.提出基于DDPG算法的末制导律设计方法,通过对拦截问题的环境状态和动作(控制量)进行设计,实现了从仿真环境交互数据中学习回报最优的制导律;与传统方法相比,该无模型方法更具灵活性;针对强化学习方法动作集假设偏置弱带来训练效率低的问题,进一步提出将导航比作为决策优化参数,加速了训练过程并实现动态调整比例制导律中的导航比.对比实验表明,两种强化学习末制导律设计方法获得了优于比例制导律及其变型的拦截效果,展现出良好的研究前景和潜在的应用价值.

相关作者

载入中，请稍后...

相关机构

应用推荐

置顶

我的订单

意见反馈

意见箱

匿名：登录

您的联系邮箱：

您的联系电话：

标题：

内容：

个人用户登录

快捷注册

第三方账号登录

使用数字科研平台帐号登录

使用知识服务总平台帐号登录

忘记密码

用户名^*

新密码^*

确认密码^*

手机号^*

个人用户注册

用户名^*

必须为有效邮箱

密码^*

6~16位数字与字母组合

确认密码^*

6~16位数字与字母组合

手机号^*

请输入正确的手机号码

信息补充