- 2025-12-05
- /
-
默认分类 & RAG
- /
- 875 阅读
- /
- 暂无评论
- /
- 全文约 7230 字
- /
- 阅读预计需要 37 分钟
文章详解了食谱RAG系统的两大核心文件:main.py负责系统初始化、模块协调与用户交互;generation_integration.py实现查询路由、重写、LLM调用及三种回答模式(列表、基础、详细步骤)。整体采用分层架构,结合混合检索、父子文档、流式输出与元数据过滤,实现精准、高效、用户友好的...
- 2025-12-05
- /
-
默认分类 & RAG
- /
- 917 阅读
- /
- 暂无评论
- /
- 全文约 5930 字
- /
- 阅读预计需要 30 分钟
文章系统解析了RAG的索引构建与检索优化两大模块:前者用BGE-small向量化文档并构建FAISS索引,支持持久化与增量更新;后者在其上实现向量+BM25混合检索,用RRF重排序与元数据过滤提升召回与精度,形成“基础向量层—高级优化层”两级架构,兼顾语义与关键词互补,实现毫秒级精准检索。
- 2025-12-05
- /
-
默认分类 & RAG
- /
- 1207 阅读
- /
- 暂无评论
- /
- 全文约 1610 字
- /
- 阅读预计需要 9 分钟
data_preparation.py 为 RAG 系统实现父子文档检索:按 Markdown 标题将食谱分块,子块精准匹配,父块提供完整上下文;自动提取分类、难度等元数据,按匹配数排序去重返回父文档,兼顾检索精度与生成质量。
文章介绍将Netty RPC客户端接收服务端返回结果的方式,从阻塞的AttributeMap改为CompletableFuture,实现异步非阻塞调用,代码更清晰,使用更简单,并建议限制未处理请求Map容量防OOM。
- 2025-11-24
- /
-
默认分类,分布式系统
- /
- 1105 阅读
- /
- 暂无评论
- /
- 全文约 24600 字
- /
- 阅读预计需要 123 分钟
文章系统梳理 Redis 高频面试考点:内存高速读写、丰富数据类型及底层实现、单线程+IO多路复用、6.0多线程IO、AOF/RDB/混合持久化、主从+哨兵+Cluster高可用、惰性+定期过期删除、8种内存淘汰、缓存雪崩/击穿/穿透及一致性策略、分布式锁与Redlock、大Key与异步删除、管道与...
- 1
- 2
- 3
- 4
- ...
- 15
- 后一页 »