斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #DQN

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#DQN
2026/3/31

学习选择视觉上下文示范

多模态大型语言模型(MLLMs)通过上下文学习(ICL)适应视觉任务,而示范的质量对其效果至关重要。目前主流的示范选择策略是无监督的k-最近邻(kNN)搜索。尽管该方法简单,但对于复杂的事实回归任务而言,其相似性优先的策略并不理想,往往选择冗余示例,无法全面捕捉任务的输出范围。该研究将选择过程重新定义为一个序列决策问题,并提出了学习选择示范(LSD)的方法,训练强化学习代理构建最优示范集。通过使用...

#多模态大型语言模型#上下文学习#示范选择#强化学习#DQN

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等