斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #hidden states

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#hidden states
2026/3/30

大语言模型中的 H-Node 攻击与防御

研究提出了 H-Node 对抗噪声消除(H-Node ANC)机制框架,旨在识别、利用和防御基于变换器的大语言模型(LLMs)中的幻觉表示,重点关注单个隐藏状态维度。通过对最后一个令牌的隐藏状态进行逻辑回归探测,能够将幻觉信号定位到一小组高方差维度,这些维度被称为幻觉节点(H-Nodes),并且在四种架构中探测的 AUC 达到 0.90。在推理时,白盒对抗攻击通过实时前向钩子放大这些维度,选择性达...

#大语言模型#对抗噪声消除#幻觉节点#隐藏状态#防御机制

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等