Claude Code 리뷰 — AI 에이전트와 함께한 30일간의 제품 출시 경험
요약
Anthropic의 터미널 기반 코딩 에이전트인 Claude Code를 30일간 실제 제품 개발에 사용한 경험담입니다. 리팩터링과 기능 구현에서의 압도적인 속도와, 복잡한 비즈니스 로직 구현 시 발생하는 의도 파악의 한계를 분석합니다.
핵심 포인트
- 터미널 기반 에이전트로 코드베이스 탐색 및 구현 자동화
- 단순 리팩터링 작업에서 인간 대비 압도적인 속도 제공
- 문서화되지 않은 암시적 비즈니스 로직 이해에는 한계 존재
- AI가 생성한 코드의 논리적 오류를 검토하는 역량이 필수적
한 달 동안 Claude Code를 매일 사용해 왔습니다. 사이드 프로젝트나 튜토리얼 용도가 아닙니다. 실제 제품 출시(shipping)를 위해서였습니다. ProdDraft의 기능을 구축하고, 운영 환경의 이슈를 디버깅(debugging)하며, AI 코딩 도구가 존재하기 전부터 유지 관리해 온 코드베이스를 리팩터링(refactoring)하는 작업에 사용했습니다.
AI 에이전트에게 운영 코드를 맡겼을 때의 30일이 실제로 어떤 모습이었는지 공유합니다.
Claude Code란 무엇인가
Claude Code는 Anthropic의 터미널 기반 코딩 에이전트(coding agent)입니다. 이것은 에디터(editor)가 아닙니다. 자동 완성(autocomplete) 도구도 아닙니다. 터미널에서 여러분의 코드베이스를 읽고, 문제를 이해하며, 변경 사항을 제안하고, 이를 구현하는 개발자입니다.
워크플로우는 다음과 같습니다: 여러분이 원하는 것을 설명하면, Claude가 코드베이스를 탐색하고, 명확히 하기 위한 질문을 던지며, 코드를 작성하고, 테스트를 실행하며, 작동할 때까지 반복합니다. 여러분은 차이점(diff)을 검토하고 승인하면 됩니다. 그게 전부입니다.
Max 플랜(무제한 사용)은 월 $200의 비용이 듭니다. 월 $20인 Pro 플랜은 매일 코딩하는 사람이라면 약 3일 안에 도달하게 될 사용량 제한(usage caps)이 있습니다.
1주 차: 허니문 기간
저의 첫 번째 작업은 FastAPI 코드베이스를 리팩터링하는 것이었습니다. 동기식(synchronous) SQLAlchemy에서 비동기식(async)으로 전환하고, 프로젝트 레이아웃을 재구성하며, 적절한 에러 핸들링(error handling)을 추가하는 작업이었습니다. 제가 집중해서 작업한다면 3~4시간 정도 걸릴 법한 종류의 작업이었습니다.
Claude Code는 이를 45분 만에 해냈습니다.
AI가 더 똑똑해서가 아닙니다. 주의가 산만해지지 않기 때문입니다. Claude는 모든 파일을 읽고, 의존성 그래프(dependency graph)를 이해하며, 계획을 세우고, 이를 실행합니다. Slack을 확인하지도 않고, 이 접근 방식이 맞는지 고민하지도 않습니다. 그저 완료될 때까지 코드를 읽고 쓸 뿐입니다.
28|
29|첫 주에는 모든 것을 다 던져주었습니다. 새로운 API 엔드포인트(API endpoint) 구축, 속도 제한(rate limiting) 추가, CI 파이프라인(CI pipelines) 설정, 문서 작성까지 말이죠. 모든 작업이 완료되었습니다. 모든 테스트도 통과했습니다. 저는 이제 제가 직접 코딩을 할 필요가 있는 것인지 의문이 들기 시작했습니다.
30|
31|## 2주 차: 현실
32|
33|그다음 저는 8개의 파일에 흩어져 있는 비즈니스 로직(business logic)을 이해해야 하는 기능을 추가해 달라고 요청했습니다. 그중 일부는 제가 6개월 전 밤 11시에 내렸던, 문서화되지 않은 결정들이었습니다.
34|
35|Claude는 코드베이스(codebase)를 탐색하는 데 20분을 소비했고, 3개의 명확화 질문(clarifying questions)을 던진 뒤 PR(Pull Request)을 생성했습니다. 코드는 깔끔하고 구조가 잘 잡혀 있었지만, 완전히 틀렸습니다. 한 파일의 주석에 기록되어 있고 다른 파일의 변수명으로 암시되어 있던 미묘한 비즈니스 규칙을 오해한 것입니다.
36|
37|교훈: Claude Code는 코드를 이해하는 데는 탁월합니다. 하지만 의도(intent)를 이해하는 데는 평범합니다. 의도가 명확하게 문서화되어 있다면 완벽하게 해냅니다. 하지만 의도가 머릿속에만 있거나 암시적인 패턴으로 흩어져 있다면, 그것을 추측합니다. 때로는 그 추측이 맞기도 하고, 때로는 틀리기도 합니다.
38|
39|이것이 AI 코딩 에이전트(AI coding agents)의 진짜 비용입니다. 월 200달러가 아니라, 맞게 작성된 것처럼 보이지만 미묘한 논리적 오류를 가진 코드를 검토하는 데 소비되는 시간 말입니다. 검토의 부담은 "이것을 올바르게 구현했는가?"에서 "이 구현이 내가 실제로 의도한 바와 일치하는가?"로 옮겨갑니다.
40|
41|## 3주 차: 최적의 지점 찾기
42|
43|저는 워크플로(workflow)를 변경했습니다. Claude에게 모호한 기능 요청을 보내는 대신, 마이크로 스펙(micro-specs)을 작성하기 시작했습니다. 기능이 정확히 무엇을 하는지, 엣지 케이스(edge cases)는 무엇인지, 그리고 테스트가 무엇을 다루어야 하는지를 설명하는 35문장 정도의 짧은 명세서입니다.5문장)
44|
45|차이는 즉각적이었습니다. 정확도가 약 70%에서 약 95%로 올라갔습니다. 마이크로 스펙을 작성하는 데 쓰는 시간은 오해된 구현을 수정하는 데 쓰던 시간보다 적었습니다.
46|
47|Claude Code를 위한 최적의 지점(sweet spot)은 다음과 같습니다:
48|
49|1. 마이크로 스펙 작성 (3
50|2. Claude가 코드베이스를 탐색하고 질문하게 두기
51|3.
코드가 작성되기 전에 **계획을 검토(Review the plan)**하세요
52|4. 테스트와 함께 Claude가 구현하도록 하기 (Let Claude implement)
53|5. 차이점(Diff) 검토 — 구문(Syntax)이 아닌 비즈니스 로직에 집중하세요
54|
55|이 워크플로우는 절대 지치지 않지만, 가끔 존재하지 않는 라이브러리 메서드를 환각(Hallucinate)하는 매우 빠른 주니어 개발자와 페어 프로그래밍(Pair programming)을 하는 듯한 기분을 줍니다.
56|
57|## 4주 차: 할 수 없는 것들
58|
59|4주 차에 접어들면서, 저는 Claude Code가 무엇을 잘하고 무엇이 부족한지에 대해 명확한 그림을 그릴 수 있었습니다.
60|
61|잘하는 것:
62|- 리팩터링 (Refactoring, 여러 파일에 걸친 구조적 변경)
63|- 그린필드 기능 개발 (Greenfield features, 명확한 스펙과 레거시 제약 사항이 없는 경우)
64|- 테스트 작성 (Test writing, 포괄적인 테스트 스위트 생성)
65|- 문서화 (Documentation, README, API 문서, 주석 생성)
66|- 보일러플레이트 (Boilerplate, CRUD 엔드포인트, 폼 유효성 검사, 설정 파일)
67|
68|보통인 것:
69|- 미묘한 로직 오류 디버깅 (Debugging, 버그 위치는 찾을 수 있지만 종종 잘못된 수정안을 제안함)
70|- 성능 최적화 (Performance optimization, 속도보다는 가독성을 지향하는 경향이 있음)
71|- 암시적인 비즈니스 규칙 이해 (Understanding implicit business rules, 이를 위해서는 마이크로 스펙이 필요함)
72|- 문서화가 제대로 되지 않은 레거시 코드 작업 (Working with poorly documented legacy code, 혼란에 함께 빠져듦)
73|
74|할 수 없는 것:
75|- 아키텍처 결정 (Architecture decisions, 옵션을 제안할 수는 있지만 트레이드오프(Tradeoffs)를 저울질할 수는 없음)
76|- 보안 검토 (Security review, 명백한 문제는 찾을 수 있지만 미묘한 문제는 놓침)
77|- 멈춰야 할 시점을 아는 것 (Know when to stop, 배포하라고 말하지 않으면 해결된 문제를 계속해서 최적화하려고 함)
78|
79|## 비용 방정식
80|
81|Max 플랜의 경우 월 200달러이므로
Claude의 결과물을 4시간 동안 검토하고 나면, 직접 8시간 동안 코드를 작성했을 때보다 정신적으로 더 지칩니다.
84|
85|저는 하나의 패턴을 정착시켰습니다. 오전 스프린트(기능 생성, 테스트 작성, 리팩터링 (Refactor))에는 Claude Code를 사용하고, 오후(차이점 (Diff) 검토, 엣지 케이스 (Edge cases) 수정, 아키텍처 결정)에는 수동 코딩을 하는 방식입니다. 이 조합은 어느 하나만 사용할 때보다 더 생산적입니다.
86|
87|## 사용해야 할까요?
88|
89|제품을 출시하는 1인 개발자라면, Claude Code는 월 200달러의 가치가 있습니다. 제가 사용해 본 코딩 에이전트 중 가장 유능하며, 그다음으로 좋은 옵션(Cursor의 에이전트 모드)과의 격차는 실재합니다.
90|
91|팀 단위로 일한다면, 그 가치는 팀의 리뷰 문화에 달려 있습니다. 팀이 이미 철저한 코드 리뷰 (Code review)를 수행하고 있다면, Claude Code는 자연스럽게 녹아들 것입니다. 그저 PR (Pull Request)에 대한 리뷰가 필요한 또 다른 기여자일 뿐이니까요. 만약 팀이 일단 머지 (Merge)부터 하고 나중에 질문을 던지는 방식이라면, AI 에이전트를 혼합하는 것은 위험합니다.
92|
93|코딩을 배우는 단계라면, Claude Code를 사용하지 마세요. 여러분이 이해하지 못하는 코드를 작성할 것이고, 원리를 모른 채 무언가를 만들어가게 될 것입니다. 학습에는 Cursor나 Copilot이 더 낫습니다. 이들은 대체하기보다는 보조하기 때문입니다.
94|
95|저는 Max 구독을 유지할 것입니다. 지난 한 달을 통해 AI 코딩 에이전트가 개발자를 대체하는 것이 아니라, 최고의 개발자들을 극적으로 더 생산적으로 만드는 동시에, 나쁜 코드를 그 어느 때보다 빠르게 출시하기 쉽게 만든다는 것을 배웠습니다. 여러분이 어떤 개발자가 될지는 여러분이 얼마나 잘 리뷰하느냐에 달려 있습니다.
96|
97|---
98|
99|Claude Code를 사용하여 제품을 만드시나요? FastAPI Pro Starter는 Docker, CI, 구조화된 로깅 (Structured logging), 그리고 Claude가 실제로 이해할 수 있는 프로젝트 구조를 포함한 프로덕션급 기반을 제공합니다. 29달러, 1회 결제.
100|
102|
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기