📄 中文摘要
检索增强生成(RAG)是减少大型语言模型(LLM)幻觉并使 AI 访问私有数据的黄金标准。通过从零开始构建 RAG 系统,可以完全控制整个流程。使用 Google 的 Gemini API 进行嵌入和文本生成,以及 FAISS 进行快速的向量相似性搜索,可以实现高效的 RAG 系统。该系统的技术栈包括 Gemini 2.5 Flash 作为 LLM,gemini-embedding-001 作为嵌入,FAISS 作为向量数据库,以及 Python 3.13+ 环境和 uv 包管理器。