您的位置: 首页 > 中文期刊论文 > 详情页

一种基于强化学习的三国杀多智能体博弈方法

作   者:
骆芙蓉王以松秦进于小民
作者机构:
贵州大学计算机科学与技术学院
关键词:
深度强化学习多智能体合作对抗三国杀游戏环境
期刊名称:
计算机仿真
i s s n:
1006-9348
年卷期:
2024 年 007 期
页   码:
484-490
摘   要:
深度强化学习在处理序列决策与策略探索问题上取得了很大的成功,大多从游戏中展开研究获得启发,其应用领域从单智能体场景扩展到多智能体场景中。基于纸牌的多人对战策略游戏是一种多智能体系统,但现有研究较少,且大多都来自于斗地主、德州扑克。为拓展基于纸牌的多智能体策略游戏的研究,提出了一种基于强化学习的三国杀多智能体博弈方法(SGS-MAPG),自建了以三国杀游戏为背景的2v2对战游戏场景作为实验环境,基于策略梯度的思想对合作的多个智能体建模,在其决策过程中包含了多智能体系统的团队合作与对抗,解决了多个智能体环境下的不稳定性问题。经计算机模拟对战过程,上述方法使智能体经过训练具有良好的学习决策能力,并且能够尝试获得多于基础算法的最终团队奖励,并得到高出至少12%胜率。
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充