📄 中文摘要
在运动控制任务中,深度强化学习(DRL)已展现出高性能,但学习到的策略的决策过程仍然是一个黑箱,使得人类难以理解。已知在步态等周期性运动中,存在隐含的运动阶段,如支撑阶段和摆动阶段。基于此,研究假设为运动控制训练的策略可能也代表一种可被人类理解的阶段结构。为验证这一假设,研究考虑了一个适合观察策略是否通过与环境的互动自主获取时间结构化阶段的运动任务。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等