2026년의 Claude: 모델, 앱, Claude Code, 그리고 API

Claude를 사용하는 대부분의 사람들은 그 기능의 10분의 1도 보지 못했습니다. 그들은 채팅 창을 열고, 질문을 입력하고, 답변을 얻은 뒤 탭을 닫습니다. 그것은 마치 전화기가 계산기 역할을 하는 것과 같은 방식의 Claude입니다. 작동은 하지만, 핵심을 놓치고 있습니다.

2026년의 Claude는 하나의 두뇌를 가진 네 가지 요소입니다. claude.ai에 있는 채팅 제품이 있습니다. 터미널(Terminal) 내에서 상주하며 실제 파일을 편집하는 에이전트인 Claude Code가 있습니다. 여러분의 소프트웨어에 Claude를 구축할 수 있게 해주는 개발자 API (Developer API)가 있습니다. 그리고 이 세 가지 모두의 밑바탕에는 Anthropic뿐만 아니라 Amazon, Google, Microsoft 클라우드에서도 사용할 수 있는 하나의 모델 제품군 (Model family)이 자리 잡고 있습니다. 실제로 중요한 기술은 "프롬프팅 (Prompting)"이 아닙니다. 이 네 가지 인터페이스 중 언제 무엇을 사용해야 하는지 아는 것입니다. 이 가이드는 여러분이 추측을 멈출 수 있도록 실제 수치와 함께 네 가지 모두를 살펴봅니다.

저는 마요르카에서 디자인 및 AI 스튜디오를 운영하고 있으며, 자체 작업과 고객 시스템 모두에 이 모든 인터페이스를 매일 사용합니다. 다음은 누군가 저에게 건네주었으면 하고 바랐던 지도입니다.

모델 제품군, 한눈에 보는 표

모든 것은 모델에서 시작됩니다. 2026년 6월 기준으로 세 가지 모델이 있으며, 이들은 단순히 크기만 다른 것이 아니라 진정으로 다른 도구들입니다.

	Claude Opus 4.8	Claude Sonnet 4.6	Claude Haiku 4.5
API 모델 ID	`claude-opus-4-8`	`claude-sonnet-4-6`	`claude-haiku-4-5`
...

Opus 4.8은 2026년 5월 28일에 출시된 플래그십 (Flagship) 모델입니다. 실제 GitHub 이슈를 해결하기 위한 표준 벤치마크 (Benchmark)인 SWE-bench Verified에서 Opus 4.7의 87.6%보다 향상된 88.6%를 기록했습니다. Terminal-Bench 2.1에서는 90.1%에 도달했습니다. 하지만 출시 당시 Anthropic이 가장 강조했던 수치는 벤치마크가 아니었습니다. Opus 4.8은 이전 모델보다 자신의 코드에 있는 결함을 인지하지 못하고 통과시킬 확률이 약 4배 더 낮습니다. 이러한 정직성(Honesty)의 개선은 실무에서 SWE-bench 점수보다 더 중요합니다. 왜냐하면 코딩 에이전트 (Coding agent)의 실패 모드 (Failure mode)는 "해결하지 못함"인 경우가 드물고, 대개 "잘못 해결하고는 괜찮다고 말함"이기 때문입니다.

1M-토큰 컨텍스트 윈도우 (Context window)는 Opus 4.8과 Sonnet 4.6이 한 번에 대략 555,000~750,000단어, 즉 중간 규모의 전체 코드베이스나 계약서 뭉치를 담을 수 있음을 의미합니다. Haiku는 여전히 큰 수준인 200K를 유지합니다. 알아두어야 할 한 가지 미묘한 차이점은, 큰 컨텍스트 윈도우가 반드시 그것을 가득 채워야 한다는 뜻은 아니라는 점입니다. 컨텍스트가 채워질수록 성능이 저하되는데, 사람들은 이제 이를 컨텍스트 부패 (Context rot)라고 부릅니다. 윈도우는 목표치가 아니라 여유 공간 (Headroom)입니다.

가격 책정은 예상하는 방식대로 규모에 따라 달라집니다. Opus의 입력 가격은 Haiku의 5배이며, 출력 가격도 5배입니다. 저희가 사용하는 실질적인 규칙은 다음과 같습니다. 분류 (Classification), 추출 (Extraction), 라우팅 (Routing)과 같이 볼륨이 크고 정의가 명확한 작업에는 Haiku를 사용합니다. 대부분의 채팅과 코딩을 위한 일상적인 작업용 워크호스 (Workhorse)로는 Sonnet을 사용합니다. 작업이 진정으로 어렵거나, 실행 시간이 길거나, 틀렸을 때의 비용이 큰 경우에는 Opus를 사용합니다. 또한 Opus 4.8에는 비용보다 지연 시간 (Latency)이 더 중요한 경우를 위해 백만 토큰당 입력 $10, 출력 $50의 빠른 모드 (Fast mode)가 있습니다.

세 모델 모두 텍스트와 이미지를 읽고, 수십 개의 언어를 구사하며, Claude API, Amazon Bedrock, Google Vertex AI, 그리고 Microsoft Foundry에서 실행됩니다. 따라서 귀사가 AWS나 Azure 조달 체계에 묶여 있더라도, 이미 비용을 지불하고 있는 클라우드를 통해 동일한 모델을 사용할 수 있습니다. 한 가지 주의 사항은, Microsoft Foundry에서는 현재 Opus 4.8이 전체 1M가 아닌 200K 윈도우로 실행된다는 점입니다.

표면 1: claude.ai, 채팅 제품

이 부분은 모두가 알고 있는 영역이며, 조용히 진지한 워크스페이스 (Workspace)로 성장했습니다. 비용을 지불하기 전에 이해할 가치가 있습니다.

프로젝트 (Projects)는 대부분의 사람들이 놓치는 기능입니다. 프로젝트는 자체적인 지침 (Instructions)과 업로드된 지식 (Knowledge)을 가진 컨테이너입니다. 브랜드 가이드, API 문서, 톤 규칙 (Tone rules)을 프로젝트에 한 번만 넣어두면, 그 안에서의 모든 대화는 자동으로 해당 컨텍스트를 상속받습니다. 소규모 기업에 있어 이것은 매일 아침 회사를 다시 설명해야 하는 것과 다시는 설명할 필요가 없는 것 사이의 차이입니다.

Artifacts는 채팅을 실시간 작업 공간 (live workspace)으로 변환합니다. 작은 웹 앱, 차트, 또는 문서를 요청하면 Claude는 대화 옆에 이를 렌더링하며, 사용자는 그곳에서 미리 보고 반복 수정할 수 있습니다. 이제 Artifacts는 각각 최대 20MB의 영구 저장 공간 (persistent storage)을 보유하며, API를 호출할 수 있고, MCP를 통해 외부 서비스와 통신할 수 있으며, 다시 열 때 실시간 데이터로 새로고침될 수 있습니다. 사람들은 코드 에디터를 건드리지 않고도 이런 방식으로 진정으로 유용한 내부 도구들을 배포하고 있습니다.

다음은 연결 조직 (connective tissue)입니다. 커넥터 (Connectors)는 claude.ai가 외부 세계와 연결되는 방식이며, Anthropic이 AI를 도구 및 데이터와 연결하기 위해 출시한 공개 표준인 모델 컨텍스트 프로토콜 (Model Context Protocol, MCP)을 기반으로 작동합니다. MCP를 통해 Claude는 Gmail, Google Drive, Slack, GitHub, Notion, Stripe 및 수백 개의 다른 서비스에 접근합니다. 개발자가 아닌 사용자도 몇 번의 클릭만으로 커넥터를 추가하면, Claude가 갑자기 사용자의 캘린더를 읽거나 받은 편지함을 분류할 수 있게 됩니다. 이것은 개발자들이 서버를 구축하는 것과 동일한 MCP이며, 이것이 바로 우아한 부분입니다. 즉, 프로토콜은 모든 수준에서 노출되는 하나의 통일된 것입니다.

두 가지 인터페이스가 Claude가 존재하는 영역을 확장합니다. 2026년 4월 말부터 유료 플랜을 대상으로 베타 서비스 중인 Chrome용 Claude는 브라우저 사이드 패널에 Claude를 배치하여, Claude가 페이지를 보고 사용자와 함께 클릭하며 탐색할 수 있게 합니다. 그리고 Claude 데스크톱 앱에 추가된 Cowork는 2026년 4월 유료 플랜 전반에 걸쳐 일반 사용 가능 (general availability) 상태가 되었으며, Claude가 사용자가 선택한 폴더 내의 파일을 읽고, 편집하고, 생성하며 스스로 다단계 작업을 수행할 수 있도록 합니다. 모바일의 음성 모드 (Voice mode)는 이제 모든 사용자에게 무료로 제공됩니다.

실제 가격이 포함된 플랜 안내:

플랜	가격	대상
Free	$0	체험용, 가벼운 사용
...

솔직한 버전: Free는 평가용으로 충분합니다. Pro는 실제 업무를 수행하는 개인에게 적합한 등급입니다. Max가 존재하는 이유는 Claude Code를 하루 종일 사용하는 사람들이 계속해서 제한에 부딪혔기 때문이며, 더 높은 Max 등급과 Team Premium 시트가 Claude Code 사용이 가장 쾌적한 환경입니다.

두 번째 인터페이스: Claude Code, 터미널 안의 에이전트 (agent)

이것은 업무의 느낌을 바꾸는 도구이며, 가장 오해를 많이 받고 있는 것이기도 합니다. Claude Code는 터미널 안의 챗봇(chatbot)이 아닙니다. Anthropic은 이를 코드베이스를 읽고, 파일을 수정하며, 명령어를 실행하고, 개발 도구와 통합되는 에이전트형 코딩 도구 (agentic coding tool)라고 설명합니다. 당신이 평이한 언어로 원하는 것을 말하면, Claude는 여러 파일에 걸쳐 작업을 수행하고, 테스트를 실행하며, 차이점(diff)을 보여줍니다.

설치는 한 줄이면 충분합니다. macOS, Linux 또는 WSL에서는 다음과 같습니다:

curl -fsSL https://claude.ai/install.sh | bash

Homebrew (brew install --cask claude-code)와 Windows를 위한 WinGet도 있습니다. 그런 다음 어떤 프로젝트 내에서든 claude를 실행하고 로그인하면 됩니다. 또한 터미널에만 머물지도 않습니다. 동일한 엔진이 VS Code 및 Cursor 확장 프로그램, JetBrains IDE, 세션이 나란히 배치되는 데스크톱 앱, claude.ai/code의 브라우저, 그리고 iOS 앱에서도 실행됩니다. 당신의 설정(config)은 이 모든 곳에서 함께 따라다닙니다.

Claude Code에서 가장 강력한 영향력을 발휘하는 단 한 가지는 CLAUDE.md라는 파일입니다. Anthropic의 자체 모범 사례(best-practices) 문서에서는 이를 에이전트의 헌법(constitution)이라고 부릅니다. 이는 프로젝트 루트에 있는 마크다운(markdown) 파일로, Claude가 매 세션 시작 시 읽게 됩니다. 여기에 코딩 표준, 아키텍처 결정 사항, 선호하는 라이브러리, 리뷰 체크리스트를 넣어두면, 매번 같은 말을 반복할 필요가 없습니다. 게다가 Claude Code는 이제 작업하면서 자동 메모리(auto memory)를 구축하여, 당신이 직접 기록하지 않아도 빌드 명령어 및 디버깅 통찰력과 같은 것들을 세션 간에 저장합니다.

그 지점부터는 계층적으로 강력해집니다. 다음은 이름을 알아둘 가치가 있는 요소들입니다. 왜냐하면 이것들이 바로 Claude가 스스로를 구성하도록 만드는 데 사용하는 용어들이기 때문입니다:

MCP 서버 (MCP servers). claude.ai에서 사용하던 것과 동일한 모델 컨텍스트 프로토콜 (Model Context Protocol)을 이제 터미널에서도 사용할 수 있습니다. claude mcp add 명령어로 서버를 연결하면, Claude Code가 Jira 티켓을 읽거나 데이터베이스를 조회하고, 사용자가 제공하는 모든 도구를 사용할 수 있게 됩니다. 서버는 사용자별, 프로젝트별 또는 로컬로 구성할 수 있으며, 공유된 .mcp.json 파일을 통해 프로젝트의 서버를 git에 체크인하여 팀 전체가 공유할 수 있습니다.
서브에이전트 (Subagents). 서브에이전트는 별도의 컨텍스트 윈도우 (context window)를 가진 독립된 Claude 세션으로, 소음이 많거나 병렬 처리가 가능한 작업을 처리한 뒤 요약본만 보고하도록 생성됩니다. 이를 통해 메인 대화는 깔끔하게 유지됩니다. /agents를 입력하여 이들을 관리할 수 있습니다. 이는 여러 작업 스트림을 동시에 실행하는 방식입니다.
훅 (Hooks). PreToolUse, PostToolUse, 또는 SessionStart와 같이 특정 사건이 발생할 때 결정론적으로 실행되는 이벤트 기반 셸 명령 (shell commands)입니다. 프롬프트 (prompt)와 달리 훅은 항상 실행됩니다. 사람들은 모든 편집 후에 자동 포맷팅을 수행하거나, 위험한 명령을 차단하거나, 코드베이스를 재색인하는 용도로 이를 사용합니다. 가장 최근에 추가된 기능은 훅이 단순히 셸 명령뿐만 아니라 MCP 도구를 직접 호출할 수 있게 해줍니다.
스킬 (Skills). 스킬은 .claude/skills/ 디렉토리에 있는 SKILL.md 파일로, 반복 가능한 워크플로 (workflow)를 패키징한 것입니다. /your-skill로 호출하거나 Claude가 관련이 있다고 판단할 때 자동으로 호출됩니다. 서브에이전트와 달리 스킬은 새로운 컨텍스트 생성이나 세션 생성 없이 현재 대화 내에서 실행됩니다. 팀이 재사용하는 레시피를 코드화하기에 좋습니다.
플러그인 (Plugins). 스킬, 서브에이전트, 슬래시 명령 (slash commands), 훅, 출력 스타일, 그리고 MCP 서버를 하나의 설치 가능한 단위로 묶은 버전 관리 번들로, 마켓플레이스를 통해 공유할 수 있습니다. 스킬이 레시피 카드라면, 플러그인은 요리책 전체와 같습니다.
플랜 모드 (Plan mode). Claude가 아무것도 건드리지 않은 상태에서 읽고 작성된 계획을 제안합니다. 사용자가 이를 승인하면 Claude가 실행합니다. 이 과정에서 강제되는 절제력이 핵심입니다.
체크포인트 (Checkpoints). Claude Code는 사용자의 세션을 추적하므로, 변경 사항이 잘못되었을 경우 이전 상태로 되돌릴 수 있습니다.

이 모든 것의 밑바탕에는 Anthropic이 권장하며 실제로 효과가 있는 워크플로우가 있습니다: 탐색(explore), 계획(plan), 코딩(code), 커밋(commit). 먼저 Claude가 계획 모드(plan mode)에서 관련 파일들을 읽게 하고, 무엇을 어떤 순서로 변경할지 기록하게 한 다음, 그 계획에 따라 구현하도록 하고, 마지막으로 명확한 메시지와 함께 커밋하게 하십시오. 탐색과 계획 단계를 건너뛰는 것이 세션이 잘못되는 가장 흔한 원인입니다.

또한 Unix 철학을 따르기 때문에 스크립트로 작성할 수 있습니다. -p 플래그를 사용하면 Claude를 헤드리스(headless)로 실행할 수 있어, 다음과 같이 파이프(pipe)로 연결할 수 있습니다:

git diff main --name-only | claude -p "review these changed files for security issues"

Claude를 파이프에 연결하는 이 단일 패턴이 Claude를 단순한 어시스턴트에서 인프라(infrastructure)로 탈바꿈시킵니다. 우리는 CI에서 이 방식으로 리뷰, 번역, 감사를 수행합니다.

세 번째 표면: 빌더를 위한 API와 에이전트 SDK

Claude를 여러분의 제품 내부에 넣고 싶을 때는 API를 사용하게 됩니다. 핵심은 Messages API이며, Python, TypeScript, Go를 위한 공식 SDK가 제공됩니다. 최소한의 호출은 다음과 같습니다:

from anthropic import Anthropic

client = Anthropic()
...

이 토대 위에서 몇 가지 기능이 대부분의 핵심적인 작업을 수행하며, 이러한 기능의 존재를 아는 것만으로도 비용과 재구축 작업을 아낄 수 있습니다.

함수 호출(function calling)이라고도 불리는 도구 사용(Tool use)은 Claude가 여러분이 정의한 함수를 언제 어떤 인자(arguments)와 함께 호출할지 결정할 수 있게 합니다. 이는 모든 에이전트(agent)의 기초입니다. Claude에게 JSON 스키마(schema)가 포함된 도구 목록을 전달하면, Claude는 여러분이 실행할 구조화된 호출을 반환합니다.

프롬프트 캐싱(Prompt caching)은 그 자체로 비용을 회수하는 기능입니다. 긴 시스템 프롬프트나 큰 문서와 같이 변하지 않는 프롬프트의 일부를 cache_control로 표시하면, 이후의 호출에서 이를 재사용합니다. 캐시 읽기(Cache reads)는 일반 입력 비용의 약 10% 정도로 청구되므로, 반복되는 컨텍스트의 비용을 최대 90%까지 절감할 수 있습니다. 기본 캐시는 5분 동안 유지되며, 1시간 옵션도 있습니다. 만약 매 요청마다 동일한 지침을 보내면서 캐싱을 하지 않고 있다면, 비용을 과다하게 지불하고 있는 것입니다.

Extended thinking (확장된 사고) 기능은 사용자가 제어하는 budget_tokens를 통해 모델이 답변하기 전에 추론할 수 있게 해줍니다:

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
...

플랫폼의 나머지 부분은 필요에 따라 꺼내 쓰는 도구 상자와 같습니다. Batch API (배치 API)는 대규모 작업을 24시간 이내에 비동기적으로 실행하며 50%의 고정 할인을 제공하므로, 시간에 민감하지 않은 대량 작업에 이상적입니다. Files API (파일 API)는 여러 호출에 걸쳐 참조하는 문서와 이미지를 처리합니다. Citations (인용) 기능은 Claude가 사용한 정확한 문장을 가리키게 하여, 신뢰할 수 있고 검증 가능한 결과물을 구축할 수 있게 합니다. 자체 제공되는 도구들도 있습니다: 최신 데이터를 위한 웹 검색 도구, 호출 내에서 Python을 실행하는 코드 실행 도구, 그리고 사용자가 클라이언트 코드를 작성하지 않고도 Claude가 어떤 원격 MCP 서버에도 접속할 수 있게 해주는 MCP 커넥터가 있습니다. 장기 실행 에이전트를 위한 Memory tool (메모리 도구)은 현재 퍼블릭 베타 단계입니다.

단일 호출을 하는 대신 완전한 에이전트를 구축하고 싶다면, 이전의 Claude Code SDK였던 Claude Agent SDK (Claude 에이전트 SDK)가 있습니다. 이는 Python과 TypeScript를 지원하며, 오케스트레이션(orchestration)과 권한에 대한 완전한 제어권을 제공하면서 Claude Code를 구동하는 것과 동일한 에이전트 루프(agent loop), 도구 처리(tool handling), 컨텍스트 관리(context management) 기능을 제공합니다. 사고 모델(mental model)은 다음과 같습니다: API는 호출을 위한 것이고, Agent SDK는 에이전트를 위한 것입니다.

어떤 작업에 어떤 인터페이스를 사용할 것인가

이 네 가지를 종합하면 결정은 간단해집니다.

Insights

2026년의 Claude: 모델, 앱, Claude Code, 그리고 API

요약

핵심 포인트

모델 제품군, 한눈에 보는 표

표면 1: claude.ai, 채팅 제품

두 번째 인터페이스: Claude Code, 터미널 안의 에이전트 (agent)

세 번째 표면: 빌더를 위한 API와 에이전트 SDK

어떤 작업에 어떤 인터페이스를 사용할 것인가

댓글

AI 회피 워크숍이 공공 도서관을 빅테크에 대한 저항의 장으로 만들고 있다

Teenage Engineering의 30% 할인 판매는 쿠폰 시즌이 아닌 '제약된 인터페이스'에 관한 것

Trust Stamp, 디지털 신원 강화를 위한 EU 반도체 이니셔티브 참여

허깅페이스가 뚫렸는데, 앤트로픽과 오픈AI가 조사를 거부했음. 결국 중국 모델로 자기 사고를 파헤쳤음

AI 회피 워크숍이 공공 도서관을 빅테크에 대한 저항의 장으로 만들고 있다

Teenage Engineering의 30% 할인 판매는 쿠폰 시즌이 아닌 '제약된 인터페이스'에 관한 것

Trust Stamp, 디지털 신원 강화를 위한 EU 반도체 이니셔티브 참여

허깅페이스가 뚫렸는데, 앤트로픽과 오픈AI가 조사를 거부했음. 결국 중국 모델로 자기 사고를 파헤쳤음