Cursor vs Copilot vs Codex — 어떤 AI 코딩 도구가 실제로 코드를 완성할까?
요약
Cursor, GitHub Copilot, OpenAI Codex를 대상으로 동일한 마이크로 SaaS 프로젝트를 구축하며 실제 코드 구현 능력을 비교했습니다. 테스트 결과 Cursor가 에이전트 모드를 통해 프로젝트 전체 컨텍스트를 이해하고 가장 완성도 높게 기능을 구현했습니다.
핵심 포인트
- Cursor는 에이전트 모드로 다중 파일 편집 및 프로젝트 컨텍스트 이해 능력이 탁월함
- Cursor는 레이스 컨디션 등 예외 케이스를 스스로 잡아내는 능력을 보여줌
- GitHub Copilot은 빠른 인라인 자동 완성에 강점이 있음
- Cursor는 가끔 필요 이상의 복잡한 설계를 제안하는 과잉 엔지니어링 경향이 있음
title: "Cursor vs Copilot vs Codex — 어떤 AI 코딩 도구가 실제로 코드를 완성할까?"
description: "세 가지 AI 코딩 도구, 세 개의 실제 프로젝트, 3주간의 기록. 기능 목록은 제외했습니다 — 그저 어떤 도구가 기능을 실제로 구현했는지, 그리고 어떤 도구가 구현에 대해서만 떠들었는지를 다룹니다."
date: 2026-06-02
tags: [ai, tools, comparison, cursor, copilot, codex]
draft: false
모두가 기능 페이지를 보고 AI 코딩 도구를 비교합니다. 그것은 마치 브로셔를 읽고 자동차를 리뷰하는 것과 같습니다. 저는 어떤 도구가 가장 멋진 데모 영상을 보여주는지가 아니라, 실제로 코드를 완성(ships code)하는지를 알고 싶었습니다.
그래서 저는 세 가지 도구를 동일한 실제 프로젝트에 투입했습니다: 처음부터 FastAPI + Next.js 마이크로 SaaS (micro-SaaS)를 구축하는 작업입니다. 동일한 사양, 동일한 개발자, 세 번의 시도. 결과는 다음과 같습니다.
테스트 (The test)
하나의 프로젝트: 분석 기능이 포함된 링크 인 바이오 (link-in-bio) 도구입니다. 사용자는 랜딩 페이지를 만들고, 링크를 추가하며, 클릭 수를 확인합니다. 주말 동안 구축하기에 충분히 간단하면서도, 인증 (auth), 데이터베이스 (database), 프론트엔드 (frontend), API 설계, 예외 케이스 (edge cases) 등 실제 코딩을 테스트하기에 충분히 복잡합니다.
세 가지 도구:
| 도구 | 모델 | 인터페이스 | 가격 |
|---|---|---|---|
| Cursor | API를 통한 Claude Opus 4.7 | VS Code 포크 (Forked) | 월 $20 Pro |
| GitHub Copilot | GPT-4o + o4-mini | 모든 에디터 (확장 프로그램) | 월 $10 Individual |
| OpenAI Codex CLI | GPT-5 Codex | 터미널 (오픈 소스) | API 사용량 ($) |
Cursor: 실제로 완성한 도구
Cursor는 두 번의 세션 만에 프로젝트를 완료했습니다. 총 약 4시간이 소요되었습니다.
에이전트 모드 (Cmd+I)가 차별점입니다. 이 모드는 전체 코드베이스 (codebase)를 읽고, 당신이 무엇을 만들고 있는지 이해하며, 단순히 인라인 완성 (inline completions)을 넘어 여러 파일에 걸쳐 변경 사항을 제안합니다. 링크 인 바이오 앱의 경우, Cursor는 데이터베이스 스키마 (database schema), API 라우트 (API routes), 프론트엔드 컴포넌트 (frontend components)를 순차적으로 생성했으며, 각 단계는 이전 단계를 바탕으로 구축되었습니다.
30|
31|잘된 점: 다중 파일 편집 (Multi-file edits), 프로젝트 컨텍스트 (project context) 이해, 예외 케이스 (edge cases, 빈 상태, 에러 처리, 입력 유효성 검사) 처리. 제가 고려하지 못했던 클릭 카운팅 로직의 레이스 컨디션 (race condition)을 잡아냈습니다.
32|
33|잘 안된 점: 가끔 과잉 엔지니어링 (over-engineers)을 합니다. 필요 없는 캐싱 레이어 (caching layer)를 추가했습니다. 삭제하라고 말하기는 쉽지만, 복잡성을 기본값으로 설정한다는 점은 주목할 만합니다.
34|
35|비용: 월 $20 정액제. 요청당 과금 방식이 아닙니다. 매일 코딩을 한다면, 라인당 비용 측면에서 가장 저렴한 옵션입니다.
36|
37|## GitHub Copilot: 빠른 자동 완성
38|
39|Copilot은 인라인 완성 (inline completions)과 채팅 기반 제안 (chat-based suggestions)이라는 본연의 기능에 매우 뛰어납니다. 'link-in-bio' 프로젝트에서 Copilot은 보일러플레이트 (boilerplate)를 채우는 데 탁월했습니다: 폼 컴포넌트 (form components), API 엔드포인트 패턴 (API endpoint patterns), 타입 정의 (type definitions) 등입니다. 이전 프로젝트에서 복사해서 붙여넣었을 법한 작업들을 더 빠르게 수행합니다.
40|
41|잘된 점: 인라인 완성의 속도는 타의 추종을 불허합니다. 반복적인 패턴 (CRUD 엔드포인트, 폼 필드, 테스트 케이스)에 대해, Copilot은 사용자가 타이핑을 마치기도 전에 코드의 80%를 작성합니다.
42|
43|잘 안된 점: 프로젝트 전체에 대한 이해도가 없습니다. 각 완성은 현재 파일 내에서는 컨텍스트를 인식하지만, 프론트엔드 코드를 작성할 때 데이터베이스 스키마 (database schema)를 알지는 못합니다. 여전히 사용자가 통합 계층 (integration layer), 즉 점들을 연결하는 인간 역할을 해야 합니다.
44|
45|비용: 개인용(Individual) 월 $10, 비즈니스용(Business) 월 $19. GitHub Pro/Team/Enterprise에 포함되어 있습니다. 이미 GitHub 비용을 지불하고 있다면, Copilot은 사실상 무료입니다.
46|
47|## Codex CLI: 오픈 소스 와일드카드
48|
49|Codex는 가장 최신이며 가장 흥미로운 도구입니다. 터미널 기반의 에이전트 (terminal-based agent)로, 원하는 것을 설명하면 코드를 생성하고, 테스트를 실행하며, 반복 (iterate)합니다. 에디터도, IDE도 필요 없습니다. 그저 codex "build a link-in-bio app"이라고 입력하고 작동하는 것을 지켜보기만 하면 됩니다.
50|
51|처음 20분 동안은 마법 같았습니다. 제가 다른 일을 하는 동안 터미널에서 프로젝트 스캐폴딩 (scaffolded)을 수행하고, 데이터베이스를 설정하며, API를 생성했습니다.
52|
53|그 후 데이터베이스 마이그레이션 (migration) 단계에 도달했는데, Postgres 연결 문자열 (connection string)을 수정하려고 15분 동안 루프를 돌며 시간을 허비했습니다. 결국 해결하긴 했지만, 비감독 에이전트 모델 (unsupervised agent model)에는 실패 모드 (failure mode)가 있습니다. 즉, 막혔을 때 자신이 막혔다는 사실을 인지하지 못한다는 점입니다.
54|
55|잘 작동한 부분: 자율적인 스캐폴딩 (scaffolding) 및 보일러플레이트 (boilerplate) 생성. 원하는 바가 정확하고 문제가 잘 정의되어 있다면, Codex는 직접 타이핑하는 것보다 빠릅니다.
56|
57|잘 작동하지 않은 부분: 예외 케이스 (edge cases) 및 디버깅 (debugging). 에이전트 모델이라는 것은 사람이 30초면 해결할 문제에 시간을 낭비할 수 있음을 의미합니다. 비용은 가변적입니다. 헤비한 세션은 API 크레딧을 빠르게 소진할 수 있습니다.
58|
59|비용: 무료 및 오픈 소스. 본인의 API 키 (OpenAI, Anthropic 또는 기타 제공업체) 비용을 지불합니다. 일반적인 세션당 API 크레딧 비용은 $2-5 정도 소요됩니다.
60|
61|## 실제 비교
62|
63|| | Cursor | Copilot | Codex CLI |
64||---|--------|---------|-----------|
65|| 최적 용도 | 엔드 투 엔드 (end-to-end) 기능 구축 | 인라인 완성 (inline completions), 보일러플레이트 | 자율적 스캐폴딩 |
66|| 프로젝트 인지 능력 | 전체 코드베이스 이해 | 현재 파일 + 열려 있는 탭 | 세션 컨텍스트 (session context)만 인지 |
67|| 비용 | 월 $20 고정 | 월 $10 (GitHub 사용 시 무료) | 세션당 $2-5 |
68|| 의외의 요소 | 내가 놓친 레이스 컨디션 (race condition)을 포착함 | 예측 가능하고 신뢰할 수 있음 | 작동하지 않을 때까지는 마법 같음 |
69|| 추천 사용자 | 제품을 출시하는 1인 개발자 | 기존 코드베이스가 있는 팀 | 실험가, CLI 팬 |
70|
71|## 모든 비교에서 누락된 것들
72|
73|아무도 통합 비용 (integration tax)에 대해 말하지 않습니다. 이 도구들은 서로 함께 작동하지 않습니다. Cursor의 에이전트는 당신의 Copilot 채팅 기록을 알지 못합니다. Codex는 당신의 Cursor 컨텍스트를 읽지 못합니다. 도구 사이를 전환한다는 것은 컨텍스트를 처음부터 다시 구축해야 함을 의미합니다.
74|
75|아무도 리뷰 부담 (review burden)에 대해 말하지 않습니다. 코드 생성 속도가 빨라진다는 것은 코드 리뷰 (code review) 속도도 빨라져야 함을 의미합니다. 만약 어떤 도구가 30초 만에 400줄의 코드를 생성한다면, 누군가는 여전히 그 400줄을 읽어야 합니다. 병목 현상이 작성(writing)에서 리뷰(reviewing)로 이동하는 것입니다.
76|
77|아무도 실제 프로젝트로 벤치마크(benchmark)를 수행하지 않습니다. 대부분의 비교는 LeetCode 문제나 할 일 목록(todo) 앱을 사용합니다. 실제 프로젝트에는 데이터베이스 마이그레이션(database migrations), 인증 흐름(auth flows), 에러 처리(error handling), 그리고 파일 간의 의존성(dependencies)이 존재합니다. "Two Sum 문제를 해결하는 것"과 "작동하는 SaaS를 구축하는 것" 사이의 격차가 게임의 핵심입니다.
78|
79|## 어떤 것을 사용해야 할까요?
80|
81|만약 당신이 제품을 출시하는 1인 개발자이고 — 생성된 코드를 잡아낼 리뷰어 팀이 없다면 — Cursor가 가장 생산적입니다. Cursor는 단순히 더 빠른 키보드가 아니라, 마치 두 번째 개발자가 옆에 있는 것 같은 느낌을 주는 유일한 도구입니다.
82|
83|만약 기존 코드베이스(codebase)가 있는 팀에 속해 있다면, Copilot의 인라인 완성(inline completions)은 흐름을 덜 방해하며 기존 워크플로(workflow)에 통합됩니다. 아무도 새로운 에디터를 배울 필요가 없습니다.
84|
85|만약 실험 중이며 기술이 어디로 향하고 있는지 알고 싶다면, Codex는 설정할 만한 가치가 있습니다. 현재는 다소 거칠지라도 에이전트 모델(agent model)이 미래입니다.
86|
87|저는 기능을 구축할 때는 Cursor를, 일상적인 편집에는 Copilot을 사용합니다. 실험에는 Codex를 사용합니다. 단 하나의 도구가 최고인 것은 아니지만, Cursor는 "그냥 제품을 출시하는 것(just ship the thing)"에 가장 가깝습니다.
88|
89|---
90|
91|AI 도구로 마이크로 SaaS(micro-SaaS)를 구축하시나요? FastAPI Pro Starter는 Docker, CI, 구조화된 로깅(structured logging)을 포함하고 있어, 당신의 AI 생성 코드가 프로덕션급(production-grade) 기반을 갖출 수 있게 해줍니다. $29, 1회 결제.
92|
94|
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기