Aider 리뷰: 어떤 LLM과도 작동하는 오픈 소스 AI 페어 프로그래머

구독료 없음. 벤더 종속성(Vendor lock-in) 없음. 모든 AI 변경 사항은 되돌리거나(undo), 체리 피킹(cherry-pick)하거나, 감사(audit)할 수 있는 git 커밋입니다.

저는 Claude Code의 Pro 플랜에서 일주일 만에 세 번째로 속도 제한(rate limits)에 걸린 후, 2026년 3월부터 Aider를 사용하기 시작했습니다. 저는 좌절감을 느꼈습니다. 에이전트 워크플로(agentic workflow)는 마음에 들었지만, 한 회사의 모델에 저를 종속시키는 도구에 매달 100달러를 지불하는 것이 싫었습니다. Aider는 그 반대를 약속했습니다: 오픈 소스(Apache 2.0), 제가 원하는 어떤 LLM이든 사용 가능, 사용한 API 토큰에 대해서만 비용 지불, 그리고 모든 변경 사항이 자동으로 git에 커밋됩니다. 6주 후, 9개의 프로젝트(Python 5개, TypeScript 3개, Go 1개)와 6개의 서로 다른 언어 모델을 거치며, 저는 API 비용으로 총 47.30달러를 지출했습니다. 이는 주당 7.88달러, 실제 코딩을 하는 날에는 하루에 1.12달러 수준입니다.

요약(TL;DR): Aider는 AI 코딩 도구 중 최고의 가성비를 자랑하며, git을 사후 고려 사항이 아닌 일급 시민(first-class citizen)으로 취급하는 유일한 도구입니다. 하지만 터미널 전용 인터페이스와 초기 설정 오버헤드(configuration overhead) 때문에 진정으로 모든 사람을 위한 도구는 아닙니다. 만약 당신이 터미널 환경에서 생활하며 모델 제어권을 원한다면, Aider는 독보적입니다. 만약 세련된 GUI 경험을 원한다면, Cursor나 Windsurf가 당신을 더 행복하게 해줄 것입니다.

모든 것을 바꾸는 Git 네이티브 아키텍처

다른 모든 AI 코딩 도구는 버전 관리(version control)를 사후 고려 사항으로 취급합니다. Cursor에는 실행 취소(undo) 버튼이 있습니다. Copilot에는 차이점 보기(diff view)가 있습니다. Claude Code는 요청하면 커밋을 수행합니다. Aider는 git을 핵심 운영 체제(operating system)로 취급합니다.

AI가 생성한 모든 변경 사항은 설명이 포함된 원자적(atomic) git 커밋이 됩니다. 2주 동안 사용해 보기 전까지는 이것이 얼마나 다르게 느껴지는지 체감하지 못했습니다. AI가 생성한 리팩터링(refactor)이 인증 미들웨어(authentication middleware)를 망가뜨렸을 때(테스트 중에 두 번 발생했습니다), 저는 되돌리기(undo) 상태를 뒤지거나 전체 세션 기록을 다시 읽을 필요가 없었습니다. git log --oneline을 실행하여 어떤 커밋이 변경 사항을 도입했는지 정확히 확인한 뒤, git revert를 실행했습니다. 10초 만에 끝났습니다. git 감사 추적(audit trail)은 AI의 편집을 막연히 두려운 대상에서, 사람이 작성한 코드를 다루는 것과 동일하게 논리적으로 추론할 수 있는 대상으로 변화시킵니다.

저장소 맵(repository map)은 코드베이스 컨텍스트(context)를 위한 Aider의 비밀 병기입니다. Aider는 파일 구조, 함수 시그니처(function signatures), 클래스 계층 구조(class hierarchies), 임포트 그래프(import graphs) 등 프로젝트 전체의 압축된 표현을 구축하여 이를 컨텍스트로서 LLM에 전달합니다. 이는 AI가 모든 파일을 한 줄씩 읽지 않고도 프로젝트의 아키텍처(architecture)를 이해한다는 것을 의미합니다. 제가 가진 180개 파일 규모의 TypeScript 모노레포(monorepo)에서, Aider는 공유 유틸리티(shared utility)를 추출해 달라는 요청을 받았을 때 모듈 간 의존성을 정확히 식별하고 임포트 경로를 업데이트했습니다. 이 작업은 Claude Sonnet 4를 백엔드로 사용하여 단 한 번의 시도만에 성공했습니다.

또한 Aider는 피드백 루프(feedback loop) 내에서 자동 린팅(linting) 및 테스트를 실행합니다. 만약 AI가 생성한 코드가 린트(lint)를 통과하지 못하거나 테스트를 깨뜨리면, Aider는 해당 오류를 LLM에 다시 전달하여 수정을 요청합니다. 이는 Claude Code가 사용하는 것과 동일한 패턴이지만, Aider가 이를 먼저 구현했습니다. 이 도구는 Claude Code보다 2년 앞서 출시되었으며, 이후 표준이 된 여러 패턴을 개척했습니다.

Architect/Editor 모드: 두 개의 모델, 하나의 작업

Aider에서 가장 과소평가된 기능은 Architect/Editor 모드입니다. 일부 모델(OpenAI의 o3-mini 또는 DeepSeek R1 등)은 솔루션에 대한 추론 (Reasoning)에는 탁월하지만, 구조화된 파일 차이 (File diffs)를 생성하는 데는 약합니다. 다른 모델(Claude Sonnet 또는 GPT-4o 등)은 코드 편집 (Editing)은 빠르고 정확하지만, 계획 (Planning) 단계에서는 덜 철저합니다. Architect 모드는 이들을 결합합니다. 즉, 추론 모델이 솔루션을 설계하고, 편집 모델이 이를 구현합니다.

저는 8개의 다중 파일 리팩토링 (Multi-file refactoring) 작업 세트를 통해 5가지 Architect/Editor 조합을 테스트했습니다:

o3-mini (Architect) + Claude Sonnet (Editor): 8개 작업 중 7개 성공. 제가 테스트한 조합 중 최고였습니다. o3-mini의 계획은 철저했고, Sonnet의 차이 (Diffs)는 정밀했습니다.
DeepSeek R1 (Architect) + Claude Sonnet (Editor): 8개 중 6개 성공. R1의 추론은 훌륭했지만, 가끔 계획을 지나치게 복잡하게 만들어 정답은 맞지만 불필요하게 복잡한 솔루션을 내놓았습니다.
Claude Opus 단독 (분리 없음): 8개 중 5개 성공. Opus는 충분히 강력하여 Architect/Editor 분리가 큰 도움이 되지 않았습니다. 사고와 편집 모두 잘 수행하지만, 단일 모델 접근 방식은 별도의 계획가 (Planner)가 잡아낼 수 있는 구조적 문제를 가끔 놓친다는 것을 의미합니다.
GPT-4o (Architect) + GPT-4o (Editor): 8개 중 4개 성공. 동일 모델을 Architect/Editor로 사용하는 것은 단일 세션보다 나을 것이 없습니다.
DeepSeek V3 단독: 8개 중 3개 성공. 간단한 작업에는 충분하지만, 리팩토링에는 적합하지 않습니다.

비용 차이는 상당합니다. o3-mini + Claude Sonnet 조합은 8개 작업을 모두 합쳐 1.80달러가 들었습니다. Claude Opus 단독은 6.40달러가 들었습니다. 복잡한 리팩토링의 경우, Architect 모드는 더 정확하면서도 더 저렴합니다. 어려운 부분(계획)에는 비싼 추론 모델을 사용하고, 기계적인 부분(차이 작성)에는 빠른 편집기를 사용하기 때문입니다.

어떤 구독형 도구도 따라올 수 없는 모델 유연성

Aider는 LiteLLM을 통해 100개 이상의 LLM 제공업체와 연동됩니다. 저는 프로젝트 전반에 걸쳐 6개의 모델을 테스트했습니다:

Claude Sonnet 4: 최고의 올라운더 (all-rounder). 빠르고 diff (차이점) 생성 능력이 정확하며, 100만 토큰당 비용은 $3/$15입니다. 제가 일상적으로 사용하는 기본 모델입니다. 코딩 하루 기준 약 $2-4가 소요됩니다.
Claude Opus 4: 복잡한 아키텍처 추론 (architectural reasoning)에 가장 적합합니다. 100만 토큰당 비용은 $15/$75입니다. 저는 어려운 문제에만 사용하며, 작업량이 많은 날에는 $15-40 정도가 소요됩니다.
GPT-4o: Sonnet과 유사하지만, 제 테스트 결과 구조화된 diff 생성 능력은 약간 떨어졌습니다. 이미 OpenAI 구독을 사용 중이라면 포함할 만합니다. 코딩 하루 기준 약 $1-3가 소요됩니다.
DeepSeek V3: 가성비의 챔피언입니다. 100만 토큰당 비용은 $0.27/$1.10입니다. 일상적인 작업에서 Sonnet 성능의 약 70% 수준을 보여주면서 비용은 약 10%에 불과합니다. 저는 반복적인 코드(boilerplate) 생성과 간단한 편집에는 DeepSeek를 사용하고, 복잡한 작업에는 Sonnet을 남겨두었습니다. 매일 사용하더라도 월 $10 미만입니다.
o3-mini: architect/editor 모드에서 뛰어난 설계자 (architect) 역할을 합니다. 단독으로 diff를 생성하는 능력은 약합니다.
Ollama를 통한 Llama 4 (로컬): 36GB RAM을 탑재한 제 M3 Max MacBook에서 실행했습니다. 작은 작업에는 쓸만하지만, 클라우드 모델들에 비해 눈에 띄게 느리고 정확도가 떨어집니다. 기기를 절대 떠나서는 안 되는 코드를 다룰 때 유용합니다. 저는 코드를 외부 API로 보낼 수 없는 독점 데이터 파이프라인 작업에 이를 사용했습니다. 총비용은 전기세를 제외하면 $0입니다.

/model 명령어를 통해 세션 중간에 모델을 전환할 수 있는 기능은 정말 유용합니다. 저는 Sonnet으로 세션을 시작했다가, 복잡한 리팩터링 (refactoring) 문제에 부딪히면 architect/editor 조합(o3-mini + Sonnet)으로 전환한 뒤, 이어서 진행되는 일상적인 boilerplate 작업에는 DeepSeek로 전환하곤 했습니다. 다른 어떤 도구도 단일 워크플로 내에서 서로 다른 작업에 서로 다른 모델을 할당하도록 허용하지 않습니다.

Aider의 한계점

세 가지 한계점이 실재하며, 이는 개발자에 따라 중요도가 다를 수 있습니다.

첫째, 터미널 전용 인터페이스는 많은 개발자에게 결정적인 결격 사유(deal-breaker)가 됩니다. 수락/거절 버튼이 있는 인라인 디프(inline diffs)가 없습니다. 에디터에 나타나는 구문 강조(syntax-highlighted) 제안 기능도 없습니다. 터미널에서 AI가 생성한 디프를 읽고, git 커밋을 승인함으로써 이를 수락해야 합니다. Aider에는 VS Code 및 Neovim용 플러그인이 있지만

git 기반의 워크플로우 (git-native workflow)가 중요하다면 Aider를 사용하세요. 커밋 (commit) 단위로 사고하며, 모든 AI의 변경 사항이 git 히스토리에 감사 가능하고 되돌릴 수 있는 항목으로 기록되기를 원한다면, Aider의 접근 방식은 단순히 승인/거절 (accept/reject) 버튼을 누르는 것보다 진정으로 더 낫습니다.

비용을 고려한다면 Aider를 사용하세요. 9개의 프로젝트에 걸쳐 6주 동안 매일 사용했을 때 $47.30의 비용은 Claude Code Max 한 달 사용 비용의 절반도 되지 않습니다. 만약 DeepSeek을 주력 모델로 사용한다면, 월 비용은 $10 미만이 될 수도 있습니다.

세련된 GUI를 원한다면 Aider를 건너뛰세요. Cursor와 Windsurf는 인라인 디프 (inline diffs), 시각적 편집, 그리고 원클릭 설치를 제공합니다. Aider는 터미널 (terminal)과 설정 파일 (config file)을 제공합니다. 그 경험은 강력하지만 세련되지는 않았습니다.

모델 선택에 대해 고민하고 싶지 않다면 Aider를 건너뛰세요. Aider 가치의 일부는 모델 유연성 (model flexibility)에 있습니다. 동시에 그 비용의 일부는 이러한 유연성을 관리하는 데 드는 정신적 오버헤드 (mental overhead)입니다. 단 하나의 모델, 하나의 가격, 그리고 아무런 결정도 내리고 싶지 않다면 Claude Code나 Copilot이 더 간단합니다.

결론 (The Bottom Line)

Aider는 AI 코딩 환경에서 가장 과소평가된 도구입니다. 오픈 소스 (open source)이며, 모델 불가지론적 (model-agnostic)이고, git 기반 (git-native)이며, API 비용 외에는 추가 비용이 들지 않습니다. 터미널 전용 인터페이스는 GUI 우선 개발자들을 걸러내겠지만, 커맨드 라인 (command line)에서 생활하며 자신의 AI 스택을 직접 제어하고 싶어 하는 개발자 집단에게는 이와 경쟁할 만한 것이 없습니다.

6주가 지난 지금, Aider는 제 터미널 기반 AI 코딩의 약 70%를 Claude Code로부터 대체했습니다. 가장 복잡한 자율 리팩토링 (autonomous refactoring)에는 여전히 Claude Code를 사용하지만 (그것의 자기 검증 루프 (self-verification loop)가 더 뛰어나기 때문입니다), 일상적인 페어 프로그래밍 (pair programming)은 Aider가 처리합니다: "이 4개의 엔드포인트에 에러 핸들링 (error handling)을 추가해줘", "이 공유 로직을 유틸리티 (utility)로 추출해줘", "타입이 지정되지 않은 이 Python 모듈에 타입을 추가해줘" 같은 작업들 말이죠. 하루 $1.12라는 가격을 생각하면, 이는 AI 코딩 도구 중 최고의 거래입니다.