斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #多任务评估

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#多任务评估
2026/3/30

RealChart2Code:利用真实数据和多任务评估推进图表到代码生成

RealChart2Code是一个新的大规模基准,包含超过2800个实例,基于真实数据集并具有明确的分析意图任务。该基准首次系统性地评估了从大规模原始数据生成图表的能力,并在多轮对话环境中评估代码的迭代优化。对14个领先的视觉-语言模型(VLM)在RealChart2Code上的综合评估显示,与传统方法相比,性能显著下降。这一研究为图表生成领域提供了新的评估标准,推动了图表生成技术的发展。...

#图表生成#视觉-语言模型#多任务评估#真实数据#基准测试

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等