📄 中文摘要
构建 OmniDetect 的过程中,作者发现单一的 AI 内容检测器在边缘案例中的准确性往往不可靠。通过对 211 个样本的基准测试,结果显示不同检测工具之间的结果差异显著,GPTZero、Originality.ai 和 Winston AI 在同一文本上给出了不同的判断。这种不一致性使得依赖单一工具进行内容检测变得风险较高,强调了多引擎检测的必要性。作者的研究揭示了 AI 内容检测领域中不为人知的挑战和局限性。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等