RAG звучит тяжело, но первая версия может быть легкой: вычищенные документы, простое деление, базовый поиск, суммаризация. Чаще ломается из‑за трёх вещей.
1. Чанки по структуре
Режьте по заголовкам, пунктам, таблицам — не «ровно N символов». В договорах обрывы фраз убивают доверие.
2. Ответ с указанием источника
Цитата или страница в UI/логах. Без этого не отмоешься от галлюцинаций.
3. Мини‑набор для оценки
Пара десятков реальных вопросов и эталонных тезисов — гоняйте после каждой смены модели или нарезки.Ощущения врут, таблица нет.
Векторные хранилища и реранкеры позже; без базы они усиливают шум.