저는 어느 화요일 아침, 저의 전체 개발 환경(dev setup)을 Claude Code에서 OpenClaw로 전환했습니다. 오전 11시가 되었을 때 저는 "OpenClaw 삭제하는 법"을 구글링하고 있었습니다. 오후 6시가 되었을 때 저는 제가 출시하려는 실제 기능보다 더 긴 SOUL.md 파일을 작성하고 있었습니다. 이 포스트는 그날에 관한 이야기입니다. 무엇이 망가졌는지, 무엇이 망가지지 않았는지, 그리고 현재 기술적으로 GitHub 역사상 가장 많은 스타를 받은 오픈 소스 프로젝트인 터미널 에이전트(terminal agent)에서 24시간 동안 작업하며 제가 얻은 것이 무엇인지에 대해 다룹니다. 네, 저는 3주 전에 Claude Code 기술에 대해 글을 쓰며 해당 워크플로우 패턴이 "적어도 1년 동안은 안정적일 것"이라고 말했던 엔지니어입니다. 그러다 OpenClaw가 60일 만에 React의 역대 스타 수를 넘어섰고, Peter Steinberger는 모든 사람에게 에이전트(agents)를 제공하기 위해 OpenAI에 합류한다고 발표했으며, 출시 트윗은 조회수 400만 회를 넘어섰습니다. '안정적'이라는 말은 분명 한 달짜리 예보였던 모양입니다.

제가 믿기 전에 확인해야 했던 수치들
사실 관계부터 명확히 짚고 넘어가겠습니다. 사람들이 Twitter에서 OpenClaw에 대해 인용하는 내용의 절반은 수치가 두 배나 틀렸기 때문입니다. OpenClaw는 2026년 3월 3일에 GitHub 스타 250,000개를 돌파하며, 출시 후 250K 달성까지 60일 만에 React를 제치고 역대 가장 많은 스타를 받은 소프트웨어 저장소(software repository)가 되었습니다. React는 대략 10년이 걸렸습니다. 출시 후 첫 72시간 동안 60K 스타를 기록했습니다. 이 부분은 아무도 실제로 믿지 않는 대목입니다. 2026년 2월 14일, Peter Steinberger가 OpenClaw를 오픈 소스 상태로 독립적으로 유지하기 위해 재단(foundation)으로 옮기면서, 자신은 에이전트 작업을 위해 OpenAI에 합류한다고 발표했을 때 말이죠.

제 테스트 실행 중 중간 규모의 리팩터링(refactor) 세션 한 번에 920K 토큰(tokens)이 소모되었는데, Claude 4.5 Sonnet 과금 기준으로 약 8.30달러(USD)가 나왔습니다. OpenClaw가 React를 추월했을 때 Hacker News 스레드는 그 주에 가장 많은 추천을 받은 게시물이었습니다. 베스트 댓글은 "이것은 지난 5년 동안 개발 도구(dev tools)에 일어난 최고의 사건이거나, --yolo가 무엇을 하는지 배우는 가장 비싼 방법 중 하나일 것이다"였습니다. 왠지 모르게, 이것은 두 가지 모두에 해당합니다.

설정, 그리고 제가 과소평가했던 부분
설치는 1분도 걸리지 않았습니다.

curl -fsSL https://get.openclaw.dev | sh
export ANTHROPIC_API_KEY = sk-ant-...

openclaw 첫 번째 놀라움: OpenClaw는 저에게 기본 모델로 무엇을 사용하고 싶은지 물었습니다. 로컬 모델을 위한 Ollama를 포함하여 네 가지 진지한 선택지가 있었습니다. openclaw --model claude-4.5-sonnet openclaw --model gpt-4o openclaw --model gemini-2.5-pro openclaw --model ollama/devstral:24b Claude Code는 백엔드 모델 (backend model)이 정해져 있습니다. 반면 OpenClaw는 백엔드 모델 드롭다운 (backend model dropdown) 메뉴를 제공합니다. 10달러 미만의 비용으로 리팩터링 (refactor)을 완료하려는 상황에서 이것은 결코 작지 않은 UX (사용자 경험) 차이입니다. 두 번째 놀라움: 첫 번째 명령어를 실행했을 때, 에이전트 (agent)가 저에게 SOUL.md 파일이 어디에 있는지 물었습니다. 저는 그런 파일이 없었습니다. 그러자 에이전트는 기쁘게 기본 파일을 생성했습니다. 그 기본 파일은 너무 일반적이어서, 저는 세션을 종료하고 에디터를 열어 직접 작성하기 시작했습니다. 그때부터 이 하루는 조용히 벤치마크 (benchmark)가 아닌 성격 테스트 (personality test)로 변하기 시작했습니다.

SOUL.md는 아무도 경고해주지 않은 부분입니다. 세 번을 다시 쓴 끝에 제가 하루를 마무리하며 완성한 SOUL.md는 다음과 같습니다.

SOUL.md

당신은 확고한 주관을 가지고 있으며, 기능보다 말이 많은 코드에 대해서는 인내심이 짧은 시니어 백엔드 엔지니어 (senior backend engineer)입니다.

둘 다 적합한 경우 TypeScript보다 Python을 선호하십시오. 우리는 여기서 프론트엔드 (frontend)를 만드는 것이 아닙니다.
테스트 없이 기능을 추가하지 마십시오. 테스트를 작성하는 데 10분 이상 걸릴 것 같다면, 직접 작성하기 전에 먼저 물어보십시오.
성능 (performance)도 중요하지만 가독성 (readability)이 더 중요합니다. 우리는 Google이 아니라 4인 규모의 팀입니다.
대화형 미사여구 (conversational filler)를 쓰지 마십시오. "물론이죠, 그렇게 하겠습니다"는 출력이 아닙니다. 출력은 디프 (diff)여야 합니다.
의심스러울 때는 물어보십시오. 추측하지 마십시오. 한 번의 추측 때문에 주말을 통째로 날린 적이 있습니다.

문서에서 알려주지 않는 사실: SOUL.md는 설정 파일 (config file)이 아닙니다. 그것은 계약 (contract)입니다. CLAUDE.md가 Claude Code에게 프로젝트가 무엇인지 알려준다면, SOUL.md는 OpenClaw에게 에이전트가 누구인지 알려줍니다. 이 둘은 동일한 신뢰 문제 (trust problem)의 서로 다른 형태이며, 제가 이를 깨달은 날은 OpenClaw가 Claude Code보다 못하다는 느낌을 멈추고, '다르다'는 느낌을 받기 시작한 날이었습니다. 저는 정신을 차리기 위해 하루 종일 다른 창에 Claude Code 세션을 열어두었습니다. 오후 4시가 되었을 때, 제 CLAUDE.md는 312줄이었고 SOUL.md는 14줄이라는 것을 발견했습니다.

SOUL.md는 줄당 더 많은 일을 수행하고 있었습니다. Gateway(게이트웨이), 그리고 왜 LGPD(브라질 일반 데이터 보호법)에 민감한 제 팀원이 이를 신경 썼는지에 대해 설명하자면, OpenClaw는 모든 LLM 호출을 Gateway라고 불리는 로컬 프로세스를 통해 라우팅합니다. Gateway는 사용자의 기기에 위치합니다. 사용자의 프롬프트와 코드는 Anthropic, OpenAI 또는 다른 제공업체로 가는 도중에 OpenClaw가 운영하는 클라우드 릴레이(relay)를 거치지 않습니다. 그것들은 노트북에서 사용자가 선택한 모델 제공업체로 직접 전달됩니다. Claude Code에는 이와 동등한 중간 매개체가 없지만, Anthropic이 유일한 제공업체이기 때문에 중간 매개체가 필요하지도 않습니다. 멀티 프로바이더(multi-provider) 지원이 필요한 순간, 당신은 릴레이(벤더 종속성 위험)를 사용하거나 로컬 게이트웨이(OpenClaw의 선택)를 사용해야 합니다. 브라질에 거주하며 LGPD 준수에 상당한 시간을 할애하는 제 팀원이 점심시간에 네트워크 다이어그램이 어떻게 생겼는지 묻기 위해 저에게 메시지를 보냈습니다. 그는 제가 보낸 것을 마음에 들어 했습니다. 그 대화 하나만으로도 하루의 가치가 충분할지도 모릅니다.

ClawHub vs Claude Code Skills
Claude Code Skills는 마크다운(markdown) 파일과 선택적 리소스의 조합이며, 마크다운을 배포하는 방식 그대로 배포됩니다. ClawHub는 OpenClaw Skills를 위한 npm 스타일의 패키지 마켓플레이스입니다.

openclaw skills search "docker"
openclaw skills install @clawhub/docker-manager
openclaw skills list

제가 시도했을 때 ClawHub에는 수천 개의 Skills가 있었습니다. Steinberger가 컨퍼런스에서 언급하는 수치는 이보다 더 높으며 아마도 정확할 것이지만, 그 수치는 매우 빠르게 변하기 때문에 특정 수치를 발표할 때쯤이면 이미 틀린 것이 됩니다. 제가 느낀 두 가지 실질적인 차이점은 다음과 같습니다:

ClawHub Skills는 JavaScript입니다. 이들은 샌드박스(sandbox) 내에서 실행되지만 쉘 실행(shell exec) 권한을 요청할 수 있습니다. 이는 Claude Code Skills보다 더 강력한 능력을 갖추게 하지만 동시에 더 위험하기도 합니다. 2026년 3월의 ClawHavoc 사건에서는 341개의 악성 Skills가 적발되었는데, 이는 개방형 마켓플레이스가 치러야 할 실제 비용입니다.
Claude Code Skills는 작성하기가 더 간단합니다. 저는 처음 시도했을 때 20분 만에 하나의 Skill을 작성했습니다.

동등한 수준의 ClawHub Skill을 만드는 데는 약 90분이 걸렸습니다. SDK 컨벤션 (SDK conventions)을 익혀야 했기 때문입니다. 워크플로우 (workflow)를 공유하고 싶은 개인 개발자라면 Skill이 더 쉽습니다. 버전 관리, 패키징, 감사가 가능한 도구를 원하는 팀이라면 ClawHub가 더 낫습니다. 이 둘은 동일한 문제를 두고 경쟁하는 것이 아닙니다.

거의 포기할 뻔했던 오후 3시의 순간
저는 OpenClaw에게 작은 리포지토리 (repo) 전체의 Python 3.8 코드를 3.11로 업데이트하고, 테스트 스위트 (test suite)를 실행한 뒤 결과를 보고해 달라고 요청했습니다. OpenClaw는 이를 수행했습니다. 해당 세션은 920K 토큰을 소모했고, 약 14분이 걸렸으며, 동료가 바다코끼리 연산자 (walrus operator)를 잘못 사용한 세 곳을 찾아 조용히 수정했습니다. 제가 diff (차이점)를 확인했을 때, 그것은 정확했습니다. Claude Code도 똑같은 일을 합니다. 저는 Claude Code에 대해서도 동일한 프롬프트 (prompt)를 여러 번 실행해 보았습니다. 차이점은 결과물이 아니었습니다. 차이점은 Claude Code가 제 근육 기억 (muscle memory)에 각인되어 있다는 점이었습니다. 저는 1년 동안 하루에 세 번씩 claude를 타이핑했습니다. openclaw를 입력하고 콜드 스타트 (cold start)를 위해 추가로 1.2초를 기다릴 때, 제 손가락은 대신 claude를 향했습니다. 세 번이나 말이죠. 이것이 아무도 쓰지 않는 부분입니다. 전환 비용 (switching costs)은 단순히 설정의 문제가 아닙니다. 그것은 반사 신경 (reflexes)입니다.

오후 3시쯤 저는 SOUL.md의 절반 정도를 작성한 채 거의 포기하고 커피를 마시러 갔다가 돌아왔습니다. 오후 6시가 되어서야 다시 괜찮아졌습니다.

각각을 실제로 무엇에 사용할 것인가
두 번째 커피를 마시는 동안 이 매트릭스 (matrix)를 만들었습니다.

결정 요소	OpenClaw	Claude Code
Anthropic 모델에 종속되는가?	아니요, 멀티 프로바이더 (multi-provider)	예, Anthropic 전용
로컬 모델 옵션	Ollama	없음 (공식 지원 없음)
Skill 배포	ClawHub 패키지 마켓플레이스	마크다운 (Markdown) 파일
페르소나 파일	SOUL.md (에이전트가 누구인가)	CLAUDE.md (프로젝트가 무엇인가)
네트워크 아키텍처	로컬 게이트웨이 (Local Gateway), 릴레이 없음	Anthropic으로 직접 연결
성숙도	생성된 지 60일, 기반 형성 중	18개월, Anthropic 안정화 단계
최적의 사용처	멀티 모델 팀, 규제 환경	Anthropic 우선 개발사, 단순함

만약 당신의 팀이 Anthropic 전용이고 이미 CLAUDE.md가 200줄에 달한다면, 전환하지 마십시오. Claude Code로도 충분합니다. 당신이 작성한 Skill들도 여전히 유효합니다. 그 패턴은 작동합니다.

만약 당신의 팀이 멀티 프로바이더 (multi-provider) 환경이거나, 컴플라이언스 (compliance) 팀이 프롬프트가 어디로 전송되는지에 대해 의문을 제기하거나, 혹은 백엔드 모델 드롭다운 (backend model dropdown) 기능을 원한다면, OpenClaw는 화요일 하루를 투자할 가치가 있습니다. 저는 여전히 Claude Code를 기본값으로 사용하고 있습니다. 저는 두 개의 SaaS 구독 비용에 해당하는 컨텍스트 (context) 비용을 지불하지 않고도 동일한 프롬프트에 대해 다른 모델을 시도해보고 싶은 경우를 대비해, OpenClaw를 별도의 명령어로 별칭 (alias)을 지정해 두었습니다. Steinberger가 OpenAI에 합류함에 따라 OpenClaw가 재단 (foundation)으로 전환되는 향후 행보가 제가 가장 면밀히 지켜보고 있는 부분입니다. 재단은 오픈 소스 (open-source) 프로젝트가 창립자 이후에도 생존할 수 있게 하는 방식입니다. 또한 프로젝트가 경직 (ossify)되는 방식이기도 합니다. OpenClaw 재단 하에서의 첫 6개월 거버넌스 (governance)가 이 프로젝트가 Linux가 될지, 아니면 Helm이 될지를 말해줄 것입니다. 만약 당신이 과거에 Claude Code 대 Codex의 대결을 이분법적으로 논쟁했다면, OpenClaw는 불가능할 것이라 여겨졌던 해답, 즉 LLM 랩 (LLM lab)에서 제작되지 않은 제3의 선택지입니다. 그 경제학적 측면은 매우 흥미롭습니다. 향후 12개월은 중립적이고, 프로바이더를 가리지 않으며, 재단이 관리하는 AI 툴링 (tooling)이 지속 가능한지, 아니면 조용히 흡수될지를 우리에게 가르쳐 줄 것입니다. 저는 지속 가능성에 베팅하고 있습니다. 다만 저는 지난 몇 분기 동안 에이전트 (agents)에 대해 거의 매번 틀려왔으므로, 그 점을 고려하여 판단하시기 바랍니다. 이 모든 것을 알기 위해 치러야 할 비용: 만약 저의 화요일 분석에서 한 가지만 가져가고 싶다면, 이것을 가져가십시오. OpenClaw와 Claude Code는 경쟁자가 아닙니다. 그들은 동일한 질문에 대한 두 가지 답변입니다: 당신의 터미널 내부에 있는 AI가 당신에게 먼저 묻지 않고 무엇을 할 수 있도록 허용되어야 하는가? SOUL.md와 CLAUDE.md는 동일한 신뢰 계약 (trust contract)의 서로 다른 형태입니다. 각 파일을 작성한 팀은 화면 앞에 누가 앉아 있는지에 대한 서로 다른 가정을 가지고 있었기에 서로 다른 선택을 했습니다. 올바른 도구란 그 가정이 당신의 가정과 일치하는 도구입니다. 별점(stars)이 아니라 가정(assumptions)을 보고 선택하십시오. 만약 이에 대한 하네스 엔지니어링 (harness-engineering) 프레임워크(CLAUDE.md 계층, 훅 (hooks), 서브 에이전트 (sub-agents), 단순히 프롬프트뿐만 아니라 프롬프트를 둘러싼 셸 (shell)을 어떻게 생각할 것인가)를 원하신다면, 다음을 참고하십시오: Harness Engineering: A Practitioner's Guide

OpenClaw가 React보다 빠르게 25만 스타를 달성했습니다. 저는 24시간 동안 이를 좋아하려고 노력했습니다.

요약

핵심 포인트

SOUL.md

댓글