斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #Soft Nearest Neighbor Loss

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#Soft Nearest Neighbor Loss
2026/3/31

软最近邻损失的专家混合模型:通过表示解耦解决专家崩溃问题

提出了一种增强的专家混合模型(MoE)架构,该架构利用特征提取网络,并通过软最近邻损失(SNNL)进行优化,以解决专家崩溃问题。在传统的MoE架构中,由于输入特征空间中类边界的重叠,多个专家往往学习到冗余的表示,导致门控网络的路由变得僵化。通过在将输入特征传递给门控和专家网络之前,对潜在空间进行预处理,最小化类相似数据点之间的距离,从而有效地解决了结构性专家崩溃问题。这种方法不仅提高了专家的多样性...

#专家混合模型#软最近邻损失#专家崩溃#特征提取#表示解耦

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等