📄 中文摘要
该研究提出了一种轻量级且无需训练的控制器 REDEREF,用于多智能体大语言模型(LLM)协作,旨在提高递归委派过程中的路由效率。REDEREF 集成了多种技术,包括基于信念的委派,通过汤普森采样优先选择历史上贡献积极的智能体;利用经过校准的 LLM 或程序化评判者进行反思驱动的重新路由;基于证据的选择方法而非输出平均;以及记忆感知的先验知识,以减少冷启动效率低下的问题。该方法在多智能体系统中表现出显著的性能提升,能够有效应对复杂的长时间推理任务。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等