📄 中文摘要
符号序列如书面语言和基因组DNA展现出特征性的频率分布和跨越多个符号的长程相关性。在语言中,这表现为单词频率的Zipf定律以及跨越数百或数千个符号的持久相关性;而在DNA中,则反映在核苷酸组成和在嘌呤-嘧啶映射下的长记忆游走中。现有的代理模型通常只能保留频率分布或相关性特征,而无法同时保留这两者。提出了一种新的代理模型,能够同时满足这两个约束条件:它保留了原始序列的经验符号频率,并重现了其长程相关结构。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等