一种基于步行比趋势变化的奖励函数建立方法
- 专利权人:
- 发明人:
- 孙磊,李云飞,董恩增,佟吉刚,陈鑫,曾德添,龚欣翔,李成辉
- 申请号:
- CN202011387443.2
- 公开号:
- CN112472530B
- 申请日:
- 2020.12.01
- 申请国别(地区):
- CN
- 年份:
- 2023
- 代理人:
- 摘要:
- 本发明公开了一种基于步行比趋势变化的奖励函数的建立方法,包括以下步骤:计算外骨骼机器人的穿戴者的步长D;计算步态周期T(k);根据步长D和步态周期T(k)计算步行比W;建立步行比采样序列并对步行比采样序列中的采样序列打分;建立奖励函数模型。该基于步行比趋势变化的奖励函数模型可运用于优化外骨骼参数的算法当中,增强强化学习的效率,促进外骨骼参数快速收敛。
- 来源网站:
- 中国工程科技知识中心