커뮤니티는 «X가 벤치 찍었다»를 좋아하지만 제품팀은 세 가지부터.
1. 추론 vs 검색 비중
무거운 추론(수학, 난해한 리팩터)은 특화 스택. 검색·RAG는 임베딩·파이프라인이 기여를 키움.
2. 한 턴에 원문이 얼마나
윈도·$/토큰. 긴 계약은 요약 후 QA가 나을 때가 있음.
3. 틀리면 대가
의료·금융·공공은 사람 게이트와 자동화 경계 문서화.
리더보드는 참고.상황·리스크가 결정.
작업 형태, 컨텍스트 창, 실패 비용이 «최강»보다 중요.
커뮤니티는 «X가 벤치 찍었다»를 좋아하지만 제품팀은 세 가지부터.
무거운 추론(수학, 난해한 리팩터)은 특화 스택. 검색·RAG는 임베딩·파이프라인이 기여를 키움.
윈도·$/토큰. 긴 계약은 요약 후 QA가 나을 때가 있음.
의료·금융·공공은 사람 게이트와 자동화 경계 문서화.
리더보드는 참고.상황·리스크가 결정.