斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #automated tool

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#automated tool
2026/3/13

Anthropic构建了一个30万查询的行为审计工具,因为模型行为会发生变化。以下是生产版本。

Anthropic在其对齐研究中开发了一种名为Petri的内部工具,这是一个自动化的行为审计系统,用于跟踪模型在不同版本和训练运行中的行为变化。该系统运行了超过30万个测试查询,发现Claude、GPT-4o、Gemini和Grok之间存在“数千个直接矛盾和解释模糊”。与此同时,五角大楼的首席技术官将Claude视为供应链风险,指出Anthropic的训练宪法“嵌入在模型中”,并“直接影响Clau...

#行为审计#模型行为#自动化工具#训练宪法#开发者

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等