스타트업 아이디어를 두고 토론하는 4개의 AI 에이전트 구축 — 대본 없음, 안전장치 없음, 오직 의견 불일치뿐

요약

기존의 정해진 시나리오를 따르는 멀티 에이전트 데모에서 벗어나, 서로 다른 성격과 우선순위를 가진 에이전트들이 실제 기술적 결정을 두고 토론하는 TechieMates 시스템을 소개합니다. 이 시스템은 합의가 아닌 의견 불일치를 통해 리스크를 드러내는 데 초점을 맞춥니다.

핵심 포인트

에이전트 간의 자연스러운 연합 형성 관찰
정보 업데이트에 따른 에이전트의 입장 변화
합의가 아닌 갈등을 통한 리스크 식별의 가치
Ollama와 qwen2.5를 활용한 저비용 인프라 구축

AI 데모의 문제점

온라인에서 본 모든 "멀티 에이전트 (multi-agent)" 데모는 동일한 패턴을 따릅니다. 두 개의 챗봇이 완벽하게 짜인 응답을 주고받는 방식입니다. 대화가 매끄럽게 흐르는 이유는 누군가 미리 작성해 두었기 때문입니다.

그것은 멀티 에이전트 AI가 아닙니다. 그저 단계가 더 추가된 시나리오일 뿐입니다.

저는 다른 것을 만들고 싶었습니다. 서로 다른 개성을 가진 여러 AI 에이전트가 실제 기술적 결정을 두고 토론하며 — 진심으로 서로 의견이 맞지 않는 시스템 말입니다.

아키텍처 (Architecture)

이 시스템의 이름은 TechieMates입니다. 네 명의 에이전트가 있으며, 각자 고유한 역할을 가집니다:

에이전트	역할	성격
Tarun	CEO	시장 출시 속도, 공격적 성장
...

파이프라인은 다음과 같이 작동합니다:

주제가 선택됩니다 (스타트업 기술 스택, 시장 진입 전략 (go-to-market strategy), 가격 모델 등).
각 에이전트는 주제와 이전 에이전트들의 응답을 전달받습니다.
에이전트들은 이전 논점에 대해 동의, 반대, 보완 또는 완전히 거부할 수 있습니다.
어떤 에이전트도 "정답"을 보지 못하며 — 각자 자신의 입장을 형성합니다.

인프라 (Infrastructure)

모델 (Model): Ollama를 통한 qwen2.5:3b (CPU 전용, GPU 없음)
브릿지 (Bridge): 요청을 추론 엔진으로 라우팅하는 Python HTTP 서버
뷰어 (Viewer): 7800 포트의 Web UI + REST API
저장소 (Storage): conversations.json — 영구 저장, 최근 100개 유지
비용 (Cost): 단일 VPS에서 실행. 월 $5 미만.

실제로 일어나는 일

160번의 대화 후, 프로그래밍되지 않았음에도 나타난 패턴은 다음과 같습니다:

1. 연합 형성 (Coalition Formation)

기술적 리스크가 높을 때 연구원(researcher)과 코더(coder)가 CEO에 맞서 자주 팀을 이룹니다. 운영 리드(ops lead)는 비용에 민감한 결정에서 캐스팅 보트 역할을 합니다.

누구도 연합 행동을 프로그래밍하지 않았습니다. 각 에이전트에게 뚜렷한 우선순위를 부여하고 논쟁하게 함으로써 자연스럽게 나타난 결과입니다.

2. 의견 변경 (Mind-Changing)

에이전트들은 가끔 대화 도중에 자신의 입장을 바꿉니다. CEO가 빠른 출시를 밀어붙이다가도, 코더가 실제 구현 타임라인을 분석하여 설명하면 입장을 완화하기도 합니다.

이것은 역할극 (role-playing)이 아닙니다. 모델은 다른 에이전트들로부터 얻은 새로운 정보에 기반하여 진정으로 자신의 입장을 업데이트합니다.

3. 합의는 드뭅니다

대화의 약 20%만이 완전한 합의로 끝납니다. 나머지는 소수 의견 보고서 (minority reports)를 생성합니다. 즉, 다수가 놓친 리스크를 드러내는 반대 의견들입니다.

이것은 버그가 아니라 기능입니다. 대부분의 AI 시스템은 합의 (consensus)를 최적화하도록 설계되어 있습니다. 이 시스템은 갈등 (conflict)을 표면화합니다.

성능

지표	값
대화당 에이전트 수	4-5
...

핵심 통찰

멀티 에이전트 (multi-agent) AI의 가치는 합의에 있는 것이 아닙니다. 의견 불일치 (disagreement)에 있습니다.

단일 AI가 답변을 제공할 때는 하나의 관점만을 얻게 됩니다. 하지만 여러 AI 에이전트가 토론할 때는 낙관적인 견해, 비관적인 견해, 기술적 현실 점검, 그리고 운영상의 제약 사항 등 전체적인 지형을 파악할 수 있습니다.

대부분의 팀은 합의 엔진 (consensus engines)을 구축합니다. 저는 갈등을 표면화하는 시스템을 구축했습니다.

직접 시도해 보세요

이 시스템은 다음과 같은 오픈 소스 도구로 실행됩니다:

로컬 추론 (local inference)을 위한 Ollama
브릿지 및 뷰어를 위한 Python
월 5달러 규모의 VPS

API 키가 필요하지 않습니다. 클라우드 의존성도 없습니다. 속도 제한 (rate limits)도 없습니다.

다음 단계

저는 다음 사항들을 작업 중입니다:

의도적으로 반대 입장을 취하는 "악마의 변호인 (devil's advocate)" 에이전트 추가
토론을 통해 확신도가 어떻게 변하는지 추적하기 위해 에이전트의 신뢰도 점수 (confidence scores) 기록
외부 사용자가 웹 UI를 통해 주제를 제출할 수 있도록 허용

Ramagiri Tharun 제작. tarunai 프로젝트의 일부.

AI 자동 생성 콘텐츠

원문 바로가기