斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #推理治理

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#推理治理
2026/3/18

引导冻结的大型语言模型:通过在线提示路由实现自适应社会对齐

大型语言模型(LLMs)通常通过后期对齐(如强化学习人类反馈或直接偏好优化)进行治理,这在部署和推理过程中产生了相对静态的策略。然而,现实世界的安全性是一个全生命周期的问题:静态防御对不断演变的越狱行为的抵御能力下降,固定权重无法适应多元化和时变的安全规范。因此,推理时的治理成为一种必要的手段,以在不进行昂贵的再训练的情况下引导模型行为。为此,提出了共识聚类LinUCB赌博机(CCLUB),这是一...

#大型语言模型#自适应对齐#推理治理#共识聚类#安全性

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等