📄 中文摘要
Phi-4-reasoning-vision-15B 是一个拥有150亿参数的开放权重多模态推理模型,现已通过 Microsoft Foundry、HuggingFace 和 GitHub 提供。该模型具备广泛的能力,能够处理多种视觉语言任务,如图像描述、问答等。Phi-4-reasoning-vision-15B 的发布标志着多模态模型在视觉与语言理解方面的重要进展,为研究人员和开发者提供了强大的工具,以推动相关领域的创新和应用。
Powered by Cloudflare Workers + Payload CMS + Claude 3.5
数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等