모든 OpenClaw 사용자가 알아야 할 비용 절약 팁

또 다른 AI 공포 이야기

많은 AI 공포 이야기와 비슷합니다. 다만 저는 1,000달러짜리 청구서를 받고 깨어나지는 않았다는 점이 다르죠.

지난주, 저는 갑자기 OpenAI로부터 잔액이 소진되었으니 충전이 필요하다는 이메일을 받았습니다. 깜짝 놀랐습니다. 제 OpenClaw는 OAuth를 통해 연결되어 있어 제 크레딧(Credits)에 접근해서는 안 되기 때문입니다. 하지만 OpenClaw의 토큰 소비량이 갑자기 급증하면서 제 크레딧 잔액에서 차감되기 시작했습니다. 이것이 OpenClaw의 폴백 전략 (fallback strategy) 때문인지, 아니면 OpenAI 자체의 폴백 메커니즘 (fallback mechanism) 때문인지는 확실하지 않습니다. 어찌 됐든, 그런 일이 발생했습니다.

제 첫 번째 본능은 패닉에 빠지는 것이었습니다. OpenClaw 앱 전체를 삭제하고 다시 설치한 다음, Discord에서 완전히 새로운 대화를 시작했습니다. 효과는 있었지만, 다소 과잉 대응이었습니다. 오늘 저는 모든 OpenClaw 사용자가 알아야 하지만, 대부분의 사람들은 결코 사용하지 않는 기술에 대해 안내해 드리겠습니다.

근본 원인

실제로 일어나고 있는 일은 다음과 같습니다. 모델 자체에는 메모리가 없습니다. 당신이 모델과 대화할 때마다, 모델은 당신이 누구인지, 자신이 누구인지, 또는 이전에 무엇을 논의했는지 전혀 알지 못합니다. 당신은 컨텍스트 (context)를 제공해야 합니다. 즉, 모델이 누구인지, 당신이 누구인지, 이전에 무엇에 대해 이야기했는지, 그리고 지금 당장 무엇을 해야 하는지를 알려주어야 합니다. 현재 메시지 이외의 모든 것은 "컨텍스트 (context)"라고 부를 수 있습니다. 이 컨텍스트는 일반적으로 하네스 (Harness)에 의해 유지됩니다. 일반적인 하네스 (Harness)로는 OpenClaw, Hermes Agent, Claude Code 등이 있습니다.

"하네스 (Harness)"는 상당히 기술적인 용어이므로, 대부분의 사람들은 이를 에이전트 (Agents)라고 부릅니다.

다층 컨텍스트 (Multi-layer Context)

컨텍스트 자체는 계층화되어 있습니다:

App layer (앱 계층): 이 계층은 당신이 누구인지, 그리고 이 앱이 무엇인지를 기록합니다. ChatGPT에게 "당신은 누구인가요?"라고 물으면 ChatGPT라고 답할 것입니다. OpenClaw에게 똑같이 물으면, 설령 OpenClaw가 내부적으로 OpenAI 모델 위에서 실행되고 있더라도 OpenClaw라고 답할 것입니다.
Session layer (세션 계층): 이것은 현재 채팅에 대한 컨텍스트 (Context)입니다. 이것이 바로 한 채팅에서 말한 내용이 다른 채팅에서는 반드시 인식되지 않는 이유입니다. 장점은 격리 (Isolation)입니다. 한 채팅에서는 변호사 역할을 수행하게 하고, 다른 채팅에서는 상담사 역할을 수행하게 할 수 있습니다.

앱 계층 (App layer)에서 OpenClaw는 당신을 대신하여 다음과 같은 것들을 포함하되 이에 국한되지 않는 방대한 양의 컨텍스트 (Context)를 주입합니다:

AGENTS.md
SOUL.md
USER.md
MEMORY.md

컨텍스트 압축 (Context Compression)

여기에 문제가 있습니다. 앱이 시간이 지남에 따라 사용되고 개별 채팅이 길어질수록, 컨텍스트 (Context)는 계속해서 커지며 결국 비용이 급증하기 시작합니다. 때때로 에이전트 (Agent)는 압박을 완화하기 위해 컨텍스트 압축 (Context Compression)을 실행합니다. 하지만 당신은 곧 에이전트가 더 멍청해진 것 같다는 사실을 눈치채게 될 것입니다. 에이전트가 당신의 지침을 완전히 잊어버린 것은 아닙니다. 단지 어떤 것은 기억하고 어떤 것은 놓치고 있을 뿐입니다. 이는 압축 과정에서 이전 지침의 세부 사항이 손실되기 때문입니다. 그리고 압축을 거친 후에도 컨텍스트 (Context)는 여전히 엄청날 수 있습니다.

그렇다면 압축만으로 충분하지 않다면, 우리는 무엇을 할 수 있을까요?

해결책 (Solutions)

좋은 습관 기르기 (Build Good Habits)

먼저, 반복적인 작업을 처리하기 위해 단 하나의 채팅에만 의존하고 있지는 않은지 스스로에게 물어보세요. 예를 들어, 하나의 채팅창을 열어두고 문서 번역을 요청하거나 특정 웹사이트를 정해진 일정에 따라 방문하도록 계속 요청하고 있을 수 있습니다. 시간이 흐르면, 그 채팅창을 다시 구축하는 것이 너무 많은 일처럼 느껴져서 해당 채팅을 닫는 것이 두려워지기도 합니다.

만약 이런 상황이 익숙하게 느껴진다면, 더 나은 습관을 기를 때입니다:

무언가가 세 번 이상 반복된다면, 그것을 하나의 스킬 (Skill)로 추출하세요.

이 과정이 너무 번거롭게 느껴진다면 Hermes Agent로 전환할 수도 있습니다. 왜 이것이 그렇게 인기를 끌게 되었는지 이제 이해하실 겁니다. 하지만 저는 여전히 OpenClaw에서 직접 수동으로 저만의 스킬 (Skills)을 만드는 것을 선호합니다.

또한, 장기적인 정보를 사전 로드된 컨텍스트 (context) 파일에 고정하는 습관을 들이세요. 예를 들어:

마음에 드는 페르소나 (persona)를 설계했다면, 해당 세부 사항이 SOUL.md에 포함되어 있는지 확인하세요.
주소나 전화번호와 같은 특정 개인 정보를 매번 반복하지 않고 장기적으로 기억하게 하고 싶다면, USER.md에 기록되어 있는지 확인하세요.

컨텍스트 리셋 (Reset Context)

이러한 습관을 기르고 나면, 비용이 다시 급증하기 시작할 때마다 자신 있게 컨텍스트 (context)를 리셋할 수 있습니다. 리셋은 두 단계로 이루어집니다:

앱 레이어 (App layer): MEMORY.md와 memory 폴더를 비웁니다. 이미 습관들이 스킬 (Skills)로 추출되었기 때문에, 이 메모리는 대개 결정적이지 않으며 안전하게 삭제할 수 있습니다.
세션 레이어 (Session layer): 주요 작업을 마쳤을 때, 또는 하나의 채팅이 일주일 이상 지속되었을 때, /new를 사용하여 새로운 채팅을 시작하세요.

이렇게 하면 컨텍스트 (context)의 가장 큰 두 가지 구성 요소를 정리할 수 있습니다.

이점 (Benefits)

이렇게 하면 두 가지 직접적인 이점이 있습니다:

토큰 소비 (token consumption)를 극적으로 줄여, 사용 비용을 낮춰줍니다.
OpenClaw의 오류율을 낮춰줍니다. 컨텍스트 (context)가 깨끗할수록 모델이 현재 작업에 집중하기 쉬워지며, 누락이나 오해를 줄일 수 있습니다. 재작업이 줄어든다는 것은 실질적인 생산성이 높아짐을 의미합니다.

저자 소개

저는 CodePlato입니다.

저는 인간의 창의성이 AI 코딩 (AI Coding)의 진정한 뿌리라고 믿습니다. 코드와 모델은 단지 동굴 벽에 투영된 그림자일 뿐입니다.

X: @codeplato2026
https://x.com/codeplato2026

Insights