Plunget | Plunget

RAG（检索增强生成）听起来重，但第一版往往可以很轻：一份清洗过的文档 + 简单切分 + 基础检索 + 大模型总结。真正容易翻车的是下面三点。

1. 分块策略与文档结构一致

按标题、条款、表格拆，比固定 500 字一刀切更稳。法律、合同类尤其明显——断句位置错了，检索到的片段会「半句话」。

界面或日志里保留「引用片段」或页码，用户才能核对。没有溯源的 RAG，幻觉时你无法辩解。

十来个真实问题 + 标准答案要点，每次换模型或换分块都跑一遍。**体感」不可靠，对比表才可靠。

向量库、重排模型可以后加；上面三件事没做好，堆工程只会放大噪声。