세 개의 AI를 동시에 돌려봤더니, 혼자 쓸 때 보이지 않던 것들이 보이기 시작했다

복붙 삼형제 문제

나는 중요한 기술 결정을 내릴 때마다 Claude, ChatGPT(Codex 계열), Gemini를 따로 열어서 같은 프롬프트를 세 번 붙여 넣는 습관이 생겼다. 처음엔 귀찮은 의식 같았는데, 실제로 세 모델이 다른 답을 낼 때마다 그 간극이 생각보다 유의미하다는 걸 알게 됐다. 문제는 이 과정이 너무 번거롭다는 것이다. 탭을 세 개 열고, 복붙하고, 각 답변을 머릿속에서 비교하는 데만 10분이 훌쩍 지나간다.

Council은 이 워크플로를 터미널 한 줄로 압축한다. 세 모델을 병렬 실행하고, 합의 지점과 불일치 지점을 분리해서 보여준다.

Council이 뭘 하는 도구인가

Council은 Codex, Claude, Gemini CLI를 각각 탐지해서 동시에 실행하는 Node.js 기반 CLI 래퍼다. 세 모델이 각자 응답을 스트리밍하는 동안, 대시보드 형태로 진행 상황을 실시간으로 보여준다. 응답이 모이면 리드 모델이 세 답변을 종합하되, 의견이 갈리는 부분은 평균을 내지 않고 불일치로 표면화한다.

설치나 별도 API 키 등록이 없다. 이미 로컬에 설치된 CLI들을 그대로 쓴다.

npx @armstrng/council "이 마이그레이션 계획 검토해줘"

이미 claude, codex, gemini 명령어가 PATH에 있다면 바로 동작한다. 세 개 중 일부만 설치돼 있어도 있는 것만 실행한다.

실제로 어떻게 쓰는가

나는 주로 세 가지 상황에서 쓴다. 아키텍처 결정, 코드 리뷰, 그리고 프롬프트 자체의 품질 검증이다.

예를 들어 DB 스키마 변경을 앞두고 이렇게 입력한다.

echo "users 테이블에 soft_delete 컬럼을 추가하려 한다. 
현재 인덱스 구성은 (user_id, created_at)이다. 
성능 영향과 마이그레이션 순서를 검토해줘." | npx @armstrng/council

세 모델이 동시에 응답을 스트리밍하면, 대부분의 내용은 겹치지만 한두 가지가 반드시 엇갈린다. Claude는 인덱스 변경 순서를 중요하게 다루고, Gemini는 락 타임을 먼저 짚을 수 있다. 이 불일치가 바로 내가 더 깊이 파야 할 지점이다.

숫자를 눌러 특정 모델의 전체 답변을 펼치고, 후속 질문을 타이핑하면 이전 컨텍스트를 유지한 채 다음 턴으로 넘어간다.

왜 이 방식이 효과적인가

각 모델은 학습 데이터, 튜닝 방향, 컨텍스트 처리 방식이 다르다. 같은 입력에 대해 서로 다른 가중치로 답을 생성하기 때문에, 세 모델이 동의하는 부분은 높은 확률로 신뢰할 만하고, 갈리는 부분은 불확실성이 높거나 판단이 필요한 영역이다.

단일 모델을 반복 질의하는 것과 근본적으로 다른 이유가 여기 있다. 같은 모델은 같은 편향을 반복한다. Council이 합의와 불일치를 분리해서 보여주는 것은 단순한 UX가 아니라, 이 구조적 차이를 활용하는 방식이다.

함정과 한계

세 모델 CLI를 모두 로컬에 설치하고 인증을 마쳐야 한다는 전제가 있다. Codex CLI는 OpenAI 구독이 필요하고, Claude CLI도 Pro 이상이어야 한다. 이미 세 서비스를 쓰고 있지 않다면 Council이 줄여주는 것보다 설치 비용이 더 클 수 있다.

응답 품질 자체는 Council이 개선하지 않는다. 나쁜 프롬프트를 넣으면 세 모델이 모두 나쁜 답을 한다. 리드 모델이 종합을 잘못 정리할 수도 있고, 세 모델이 공통으로 틀린 방향을 향할 때는 합의가 오히려 오류를 강화한다.

JSON 출력(--json)이나 파이프라인 연동(--headless)은 CI에서 자동화할 수 있지만, 아직 레이턴시 제어 옵션이 부족하다. 느린 모델 하나가 전체 응답 타임을 잡아먹을 수 있다.

오늘 바로 해볼 것

이미 Claude CLI나 Gemini CLI 중 하나라도 설치돼 있다면, 다음 한 줄만 실행해봐라.

npx @armstrng/council "지금 네가 할 수 있는 것과 없는 것을 구체적으로 알려줘"

모델이 하나뿐이어도 동작한다. 이 결과를 보고 나서, 나머지 CLI를 추가 설치할지 판단해도 늦지 않다.

※ 본 글은 정보 제공 목적이며 특정 제품·서비스의 추천이 아닙니다.

'IT' 카테고리의 다른 글

동의 없이 4GB를 심다: 구글 크롬이 당신의 하드드라이브를 AI 창고로 쓰는 방법 (0)	2026.05.06
AI 기업들이 교실을 원하는 이유: 리터러시인가, 로비인가 (0)	2026.05.05
스포티파이가 '인간 아티스트' 인증 배지를 도입한 진짜 이유 (0)	2026.05.04
환자에게 말을 거는 AI, 뒤에서는 무슨 일이 벌어지는가 (0)	2026.05.04
생산성 폭발과 예산 위기 사이: Uber의 Claude Code 청구서가 주는 교훈 (0)	2026.05.04

안드로이드뽀개기

세 개의 AI를 동시에 돌려봤더니, 혼자 쓸 때 보이지 않던 것들이 보이기 시작했다

복붙 삼형제 문제

Council이 뭘 하는 도구인가

실제로 어떻게 쓰는가

왜 이 방식이 효과적인가

함정과 한계

오늘 바로 해볼 것

'IT' 카테고리의 다른 글

티스토리툴바

세 개의 AI를 동시에 돌려봤더니, 혼자 쓸 때 보이지 않던 것들이 보이기 시작했다

복붙 삼형제 문제

Council이 뭘 하는 도구인가

실제로 어떻게 쓰는가

왜 이 방식이 효과적인가

함정과 한계

오늘 바로 해볼 것

'IT' 카테고리의 다른 글

관련글

티스토리툴바