您的位置:
首页
>
中文期刊论文
>
详情页
深度强化学习算法在智能军事决策中的应用
- 作 者:
-
况立群;
李思远;
冯利;
韩燮;
徐清宇;
- 作者机构:
-
北方自动控制技术研究所仿真装备部;
中北大学大数据学院;
- 关键词:
-
智能军事决策;
深度强化学习;
多智能体;
深度Q网络;
深度确定策略梯度;
- 期刊名称:
- 计算机工程与应用
- i s s n:
- 1002-8331
- 年卷期:
-
2021 年
020 期
- 页 码:
- 271-278
- 摘 要:
-
深度强化学习算法能够很好地实现离散化的决策行为,但是难以运用于高度复杂且行为连续的现代战场环境,同时多智能体环境下算法难以收敛。针对这些问题,提出了一种改进的深度确定策略梯度(DDPG)算法,该算法引入了基于优先级的经验重放技术和单训练模式,以提高算法收敛速度;同时算法中还设计了一种混合双噪声的探索策略,从而实现复杂且连续的军事决策控制行为。采用Unity开发了基于改进DDPG算法的智能军事决策仿真平台,搭建了蓝军步兵进攻红军军事基地的仿真环境,模拟多智能体的作战训练。实验结果显示,该算法能够驱动多作战智能体完成战术机动,实现绕过障碍物抵达优势区域进行射击等战术行为,算法拥有更快的收敛速度和更好的稳定性,可得到更高的回合奖励,达到了提高智能军事决策效率的目的。
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...