RAG(检索增强生成)听起来重,但第一版往往可以很轻:一份清洗过的文档 + 简单切分 + 基础检索 + 大模型总结。真正容易翻车的是下面三点。
1. 分块策略与文档结构一致
按标题、条款、表格拆,比固定 500 字一刀切更稳。法律、合同类尤其明显——断句位置错了,检索到的片段会「半句话」。
2. 回答必须能指回原文
界面或日志里保留「引用片段」或页码,用户才能核对。没有溯源的 RAG,幻觉时你无法辩解。
3. 准备一个小评测集
十来个真实问题 + 标准答案要点,每次换模型或换分块都跑一遍。**体感」不可靠,对比表才可靠。
向量库、重排模型可以后加;上面三件事没做好,堆工程只会放大噪声。