斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #torchtitan

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#torchtitan
2026/3/25

实现高达 41% 更快的预训练:在 B200 上使用 TorchTitan 的 MXFP8 和 DeepEP 进行 DeepSeek-V3

在 PyTorch 和 Nebius 的联合努力下,成功在 256-GPU 的 NVIDIA B200 集群上使用 TorchTitan 训练 DeepSeek-V3 混合专家模型(16B 和 671B)。通过评估两种正交方法,MXFP8 和 DeepEP,显著提高了模型的预训练速度,达到了高达 41% 的提升。这一进展为大规模深度学习模型的训练提供了新的技术路径,推动了高效计算和资源利用的边界。...

#预训练#DeepSeek-V3#TorchTitan#混合专家模型#高效计算

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等