#Benchmarking - SijiGPT

2026/4/1

ChartDiff: 大规模图表理解对比基准

ChartDiff 是首个针对跨图表比较总结的大规模基准，旨在填补现有图表理解基准在多图表比较推理方面的空白。该基准包含 8,541 对图表，涵盖多种数据源、图表类型和视觉风格，每对图表均附有 LLM 生成和人工验证的摘要，描述趋势、波动和异常的差异。通过使用 ChartDiff，评估了通用模型、专门针对图表的模型以及基于管道的模型。结果表明，前沿的通用模型在 GPT 基础质量上表现最佳，而专门模...

#图表理解 #比较总结 #基准测试 #数据可视化 #人工智能

ChartDiff: 大规模图表理解对比基准

🔗 相关标签