RAG は重く聞こえますが、第一版は軽くでよいです。清浄化した文書・単純分割・基本検索・要約で始められます。つまずきやすいのは次の3点です。

1. 文書構造に沿ったチャンク

見出し・条・表で分割し、機械的な固定長だけにしない。契約系では特に「半分の文」が致命的。

2. 出所を示す回答

引用やページをUI/ログに残す。出所なきRAGは幻覚時に説明できません。

3. ミニ評価セット

実問十数本+期待要点をモデルや分割を変えるたびに再実行。体感より表が信頼できます。

ベクターストアやrerankは後追いでも、上記が弱いとノイズが増幅されます。