「ベンチで勝った」は参考にすぎない。現場の三問へ。

1. 推論中心か検索中心か

強い推論は専門モデルが有利。検索+RAG主体は埋め込みと管線で差が縮まりがち。

2. 1ターンに生テキストはどの程度

ウィンドウとコストの両立。長文は先要約してからQ&Aの方が安く安定することがあります。

3. 誤りの代償

医療・金融・公共性では人のゲートと責任分界を書き残す。モデル性能は責任を消しません。

ベンチは雑誌。場面とリスクが意思決定の主語。