커뮤니티는 «X가 벤치 찍었다»를 좋아하지만 제품팀은 세 가지부터.

1. 추론 vs 검색 비중

무거운 추론(수학, 난해한 리팩터)은 특화 스택. 검색·RAG는 임베딩·파이프라인이 기여를 키움.

2. 한 턴에 원문이 얼마나

윈도·$/토큰. 긴 계약은 요약 후 QA가 나을 때가 있음.

3. 틀리면 대가

의료·금융·공공은 사람 게이트와 자동화 경계 문서화.

리더보드는 참고.상황·리스크가 결정.