2025年12月

RAG 生成集成与系统整合

文章详解了食谱RAG系统的两大核心文件:main.py负责系统初始化、模块协调与用户交互;generation_integration.py实现查询路由、重写、LLM调用及三种回答模式(列表、基础、详细步骤)。整体采用分层架构,结合混合检索、父子文档、流式输出与元数据过滤,实现精准、高效、用户友好的...

RAG 索引构建与优化生成模块

文章系统解析了RAG的索引构建与检索优化两大模块:前者用BGE-small向量化文档并构建FAISS索引,支持持久化与增量更新;后者在其上实现向量+BM25混合检索,用RRF重排序与元数据过滤提升召回与精度,形成“基础向量层—高级优化层”两级架构,兼顾语义与关键词互补,实现毫秒级精准检索。

RAG 数据生成模块

data_preparation.py 为 RAG 系统实现父子文档检索:按 Markdown 标题将食谱分块,子块精准匹配,父块提供完整上下文;自动提取分类、难度等元数据,按匹配数排序去重返回父文档,兼顾检索精度与生成质量。

目录