斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #逻辑难题

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#逻辑难题
2026/3/19

大型语言模型的推理能力如何?在文本游戏环境中评估多步骤演绎推理

在推理谁是罪犯的过程中,大型语言模型(LLM)代理面临挑战。研究实现了经典桌游《克鲁》的文本基础多代理版本,作为评估多步骤演绎推理的规则基础测试平台,参与的六个代理来自GPT-4o-mini和Gemini-2.5-Flash。进一步探讨了在结构化逻辑难题上的微调是否能转移到游戏内推理和游戏玩法的改善。在18场模拟游戏中,代理仅获得四次正确胜利,表明在整个游戏过程中保持一致的演绎推理存在困难。此外,...

#大型语言模型#演绎推理#文本游戏#微调#逻辑难题

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等