📄 中文摘要
长文档主题分割在信息检索和文档理解中起着重要作用,但现有方法在超长文本设置中仍存在明显不足。传统的判别模型受限于固定窗口,无法建模文档级语义;生成性大型语言模型虽然可以输出段落边界,但推理成本高且难以支持长输入。为了解决这些问题,提出了一种基于Qwen3-0.6B的判别分割模型。在基础网络之上,增加了跨窗口上下文融合层和边界分类头,并结合重叠滑动窗口策略。该模型支持单次输入长度达到13k字符。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等