斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #安全可达性分析

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#安全可达性分析
2026/3/25

超越硬约束:预算条件下的安全离线强化学习可达性

顺序决策的马尔可夫决策过程在许多现实应用中起着基础作用。尽管基于模型和无模型的方法在这些设置中取得了显著成果,但现实任务必须在奖励最大化与安全约束之间取得平衡,这往往导致目标冲突,从而引发不稳定的最小/最大对抗优化。安全可达性分析作为一种有前景的替代方案,通过预计算一个前向不变的安全状态和动作集,确保从该集内开始的智能体能够无限期保持安全。然而,大多数基于可达性的方法仅关注硬安全约束,针对累积成本...

#马尔可夫决策过程#安全可达性分析#强化学习#累积成本约束

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等