斯基GPT
主页|标签|归档|关于|RSS

🏷️ 标签: #Nemotron

共找到 1 篇相关文章

$ 订阅我们——📱Telegram 频道◆📡RSS 订阅
首页→标签→#Nemotron
2026/3/22

构建基于本地优先的 RAG 研究工具:使用 Nemotron + vLLM + 工具调用

构建了一款完全在单个 GPU 上运行的本地优先 RAG 研究工具。该工具结合了工具调用和 RAG 方法,经过了一番探索。技术栈包括使用 Nemotron Nano 9B v2 日文模型和 vLLM(FP16,RTX 5090),后端采用 FastAPI、SQLite FTS5 和 Jinja2,所有功能集成在一个 app.py 文件中,同时使用 NVIDIA 的官方解析器插件进行工具调用和推理。系...

#本地优先#RAG#工具调用#Nemotron#vLLM

🔗 相关标签

浏览所有标签 →

Powered by Cloudflare Workers + Payload CMS + Claude 3.5

数据源: OpenAI, Google AI, DeepMind, AWS ML Blog, HuggingFace 等