IETF의 새로운 AI 에이전트용 메모리 프로토콜은 기묘해지고 있으며, 일본은 이미 이를 활용해 구축 중이다

터미널 출력창은 16진수(hex)의 벽이었습니다. a2 01 82 03 67 6f 6f 64... 저는 우리 에이전트의 컨텍스트 윈도우(context window)가 대화 도중에 왜 계속 초기화되는지 디버깅하려고 노력 중이었고, CBOR로 인코딩된 상태 동기화(state sync)의 진단 로그는 커스텀 디코더 없이는 완전히 읽을 수 없는 상태였습니다.

그것은 3주 전의 일이었습니다. 지난주, 저는 왜 이런 문제가 발생하는지를 정확히 설명하는 한 일본 개발자의 블로그 포스트를 발견했습니다. 그리고 알고 보니 IETF 워킹 그룹(working group)도 이 문제를 알고 있었습니다.

그 포스트는 일본 최대의 개발자 커뮤니티인 Qiita에 올라와 있었습니다. 저자는 2026년 5월에 발표된 CEP (Continuity Envelope Protocol) 3부작과 함께, 제가 직면했던 문제를 정확히 해결하기로 되어 있는 CBOR 진단 표기법(diagnostic notation) 사양을 분석하고 있었습니다.

다만, 해결책이 문제보다 더 복잡하다는 것이 문제입니다.

CEP 3부작의 실체 (그리고 그것이 중요한 이유)

잠시 뒤로 돌아가 보겠습니다. 세션 전반에 걸쳐 상태를 유지하거나 다른 에이전트와 컨텍스트를 공유해야 하는 AI 에이전트를 구축하고 있다면, 여러분은 아마도 메모리 연속성(memory continuity) 문제에 부딪혔을 것입니다. 즉, 복잡하고 중첩된 상태를 토큰 효율적인 전송이 가능할 만큼 압축적이면서도, 수신 측에서 정확하게 재구성할 수 있을 만큼 모호하지 않게 직렬화(serialize)하는 방법 말입니다.

IETF의 해답은 CEP 3부작입니다. 이는 에이전트가 연속성 엔벨로프(continuity envelopes)를 어떻게 교환할 수 있는지를 함께 정의하는 세 가지 관련 사양입니다. 핵심 아이디어는 다음과 같습니다. 가공되지 않은 LLM 컨텍스트(비싸고 취약함)를 전달하는 대신, 에이전트는 수신 시스템이 추론(inference)을 다시 실행하지 않고도 검증하고 복구할 수 있는 암호화된 상태 스냅샷(state snapshots)을 전달합니다.

세 가지 사양:

CEP-01은 엔벨로프 구조 자체를 정의합니다 — 어떤 필드가 존재해야 하는지, 버전 관리가 어떻게 작동하는지, 부분적 실패를 어떻게 처리하는지 등을 다룹니다.
CEP-02는 암호화 서명(cryptographic signing) 및 검증 계층을 처리합니다.
CEP-03 (상대적으로 주목을 덜 받은 부분)은 엔벨로프 본문에 대한 인코딩 프로필(encoding profile)을 정의합니다.

그리고 여기서 우리의 목적에 부합하는 흥미로운 지점이 등장합니다. CEP-03은 인코딩을 위해 JSON이나 Protobuf가 아닌, CBOR을 기본값으로 사용합니다. CBOR은 제약이 있는 IoT (Internet of Things) 기기를 위해 설계된 이진 형식(binary format)으로, 일반적인 중첩 구조(nested structures)에서 JSON 대비 약 40%의 크기 감소 효과를 제공합니다.

트레이드오프(trade-off)는 무엇일까요? CBOR은 사람이 읽을 수 있는 형식이 아니라 기기에 최적화되어 있다는 점입니다. 그리고 제가 겪었던 그 진단 표기(diagnostic notation) 문제 말인가요? 그것은 버그가 아닙니다. 하나의 설계 철학입니다.

CBOR (Concise Binary Object Representation): RFC 8949에 정의된 이진 직렬화 형식(binary serialization format)입니다. 제약이 있는 환경에서 극도로 압축된 인코딩을 하도록 설계되었습니다. JSON과 달리, CBOR은 읽기 위해 명시적인 디코딩(decoding)이 필요한 이진 출력을 생성하며, 기본적으로 "프리티 프린트(pretty print)"를 지원하지 않습니다.

아무도 이야기하지 않는 일본 특유의 관점

Qiita 포스트를 통해 드러난, 영어권 매체에서는 논의되지 않았던 사실이 있습니다. 일본 개발자들은 서구권 개발자들과는 매우 다르게 CEP 구현에 접근하고 있으며, 그 핵심은 툴링(tooling) 문화에 있습니다.

일본에는 프로토콜 구현과 함께 포괄적인 진단 툴(diagnostic tooling)을 구축하는 더 강력한 관습이 존재합니다. 이는 사후 고려 사항이 아닙니다. 포스트 작성자(tetsuko_room이라는 이름으로 Qiita에서 활동)는 인코딩 자체를 수정하지 않고도 표준 CBOR 진단에 사람이 읽을 수 있는 태깅(tagging)을 추가하는, 직접 구축한 커스텀 CBOR 진단 라이브러리에 대해 설명했습니다.

이것이 바로 중요한 지점입니다. 새벽 3시에 운영 환경의 장애를 디버깅하고 있는데 에이전트 연속성(agent continuity) 시스템이 소리 없이 실패하고 있다면, "여기 원시 헥스 덤프(raw hex dump)가 있습니다"와 "여기 의미론적 계층 주석(semantic layer annotations)이 포함된 헥스 데이터가 있습니다"의 차이는 15분과 3시간의 차이를 만듭니다.

일본식 접근 방식은 진단 표기를 '있으면 좋은 것'이 아니라 '일급 시민(first-class concern)'으로 취급합니다. 제가 본 서구권의 구현 방식은 프로토콜을 올바르게 작동시키는 '해피 패스(happy path)'에 집중하는 경향이 있으며, 진단은 "나중에" 추가할 무언가로 취급합니다. 하지만 운영 환경에서 그 "나중"은 좀처럼 오지 않습니다.

아무도 이야기하지 않는 트레이드오프 (Trade-off)

여기에 저의 회의적인 시각이 있습니다. IETF 워킹 그룹 (working group)을 존중하기에 이 글을 쓰는 것조차 마음이 불편합니다.

CEP 3부작은 대역폭 효율성 (bandwidth efficiency)과 암호학적 무결성 (cryptographic integrity)을 최적화하지만, 일급 요구사항 (first-class requirement)으로서의 인간의 디버깅 가능성 (human debuggability)은 최적화 과정에서 배제해 버립니다.

실패 모드가 "수신 에이전트가 손상된 상태를 복구한 후, 아무도 알아차리기 전까지 6시간 동안 미묘하게 잘못된 결정을 내리기 시작함"과 같은 분산 에이전트 시스템 (distributed agent system)을 디버깅할 때는, 인간의 속도에 맞춰 작동하는 진단 도구 (diagnostic tooling)가 필요합니다. CBOR의 이진 효율성 (binary efficiency)은 실재합니다. M2 Max에서의 로컬 테스트에서 38%의 크기 감소를 확인했습니다. 하지만 그 효율성에는 대가가 따릅니다. 여러분의 에러 메시지는 해석을 위해 전문 지식이 필요한 고고학적 유물이 되어버립니다.

명세서 (spec)에는 진단 표기법 (diagnostic notation) 가이드가 포함되어 있지만, "진단 표기법 옵션을 포함하라"는 것과 "개발 환경 이상에서는 진단 표기법을 기본값으로 설정하라"는 것은 매우 다른 설계 선택입니다. 현재의 명세서는 후자를 선택 사항 (optional)으로 남겨두고 있습니다.

그들이 왜 이런 선택을 했는지는 이해합니다. 제약이 있는 환경 (constrained environments), 대역폭 비용, IoT의 유산 때문입니다. 하지만 클라우드 인프라에서 실행되는 AI 에이전트들은 IoT 기기처럼 대역폭 제약을 받지 않습니다. 우리는 2015년의 문제에 대해 당시에는 타당했던 트레이드오프 (trade-off)를, 2026년의 다른 제약 조건 하에서 해결하려는 문제에 적용하고 있는 것입니다.

이것이 여러분의 아키텍처 결정에 의미하는 바

만약 여러분이 멀티 에이전트 시스템 (multi-agent systems)이나 에이전트 간 통신 프로토콜 (agent-to-agent communication protocols)을 구축하고 있다면, 실질적인 질문은 이것입니다: 여러분은 전송 효율성 (transmission efficiency)을 최적화하고 있습니까, 아니면 운영 탄력성 (operational resilience)을 최적화하고 있습니까?

이 둘은 같은 것이 아니며, CEP 명세(현재 설계된 대로라면)는 여러분에게 하나를 선택하도록 강요합니다. 강력한 암호학적 보증을 갖춘 컴팩트한 이진 엔벨로프 (binary envelopes)를 얻을 수도 있고, 운영 환경의 디버깅을 감당 가능하게 만드는 인간이 읽을 수 있는 진단 정보 (human-readable diagnostics)를 얻을 수도 있습니다. 두 가지를 모두 얻으려면 명세서가 기본적으로 제공하지 않는 커스텀 도구 (custom tooling)가 필요합니다.

3주간의 고통스러운 디버깅(debugging)을 통해 얻은 저의 경험칙은 다음과 같습니다. 만약 여러분의 팀이 프로토콜 구현(protocol implementation)과 병행하여 진단 도구(diagnostic tooling)를 구축할 역량이 없다면, 차라리 에이전트 상태 인코딩(agent state encoding)을 위해 JSON을 그대로 사용하고 40%의 토큰 오버헤드(token overhead)를 감수하는 것이 낫습니다. 여러분이 보존하게 될 디버깅의 안정성(sanity)은 절약한 대역폭(bandwidth)보다 훨씬 더 가치 있기 때문입니다.

만약 CBOR 경로를 선택한다면, 사전에 진단 도구 구축을 위한 시간을 할당하십시오. 이를 "2단계"로 취급해서는 안 됩니다. 제가 발견한 Qiita 포스트도 정확히 이 점을 지적하고 있으며, 일본의 도구(tooling) 커뮤니티는 이미 이 공백을 메우고 있습니다. 즉, 도구는 이미 존재하며, 여러분은 단지 어디를 찾아봐야 하는지만 알면 된다는 뜻입니다.

향후 6개월 동안 다가올 변화

IETF의 현재 궤적과 이러한 명세(specs)에 대한 일본 개발자 커뮤니티의 참여도를 바탕으로, 저는 다음과 같은 변화를 예상합니다:

진단 표기법 도구(Diagnostic notation tooling)의 성숙 — CBOR 진단 라이브러리들이 Qiita 포스트에서 설명한 것과 유사한 의미론적 태깅(semantic tagging) 기능을 추가할 것으로 예상됩니다.
하이브리드 인코딩 프로필(Hybrid encoding profiles) — 작업 그룹(working group)은 디버깅 가능성(debuggability)의 격차를 인지하고 있습니다. 크기가 약 15% 증가하는 대신 사람이 읽을 수 있는 태그를 추가하는 "디버깅 친화적 CBOR" 프로필이 나올 것으로 예상됩니다.
에이전트 상태 직렬화(Agent state serialization)의 표준화 — 그것이 CEP이든 다른 무엇이든, 오늘날 대부분의 팀이 에이전트 메모리(agent memory)를 위해 사용하는 임시적인(ad-hoc) JSON 블롭(blob) 방식은 18개월 이내에 공식 명세로 통합될 것입니다.

이 명세들을 형성할 수 있는 기회의 창은 아직 열려 있습니다. 만약 여러분이 에이전트 시스템을 구축하고 있고 인코딩 형식에 대한 의견이 있다면, IETF 작업 그룹 회의는 공개되어 있습니다. 일본 개발자 커뮤니티는 이미 참여하고 있습니다. 서구권 커뮤니티도 마찬가지여야 합니다.

퇴보 방지를 위한 생존 체크리스트 (Anti-Atrophy Survival Checklist)

매달 하나의 IETF 초안(draft) 읽기 — 구현하기 위해서가 아니라, 사양이 귀하의 도메인과 관련이 생길 때를 대비해 패턴 인식 능력을 기르기 위함입니다. CEP 삼부작(trilogy)이 좋은 시작점이 될 것입니다.
필요해지기 전에 자신만의 프로토콜을 위한 진단 도구(diagnostic tooling) 구축하기 — "새벽 3시에 이것을 어떻게 디버깅할 것인가"라는 사고 모델은 "정상 경로(happy path)에서 이것이 작동할 것인가"와는 다릅니다. 초기에 도구를 구축하는 것은 나중에 엄청난 고통을 줄여줍니다.
인코딩 형식(encoding format) 결정 사항 추적하기 — 텍스트 대신 바이너리(binary)를 선택할 때마다 그 이유를 기록하세요. 이러한 결정 사항들을 분기별로 재검토하십시오. 제약 조건은 변합니다. 귀하의 아키텍처가 2024년에 머물러 있어서는 안 됩니다.

당신의 의견은 어떠신가요?

귀하의 에이전트 시스템에서 CBOR 디버깅 가능성(debuggability) 문제에 직면한 적이 있나요? 아니면 이를 더 잘 처리할 수 있는 에이전트 상태 직렬화(agent state serialization)의 다른 접근 방식을 사용하고 계신가요? 무엇이 효과적인지 듣고 싶습니다. 아래에 댓글을 남겨주세요. 모든 댓글에 답변해 드립니다.

일본 개발자 커뮤니티는 이미 몇 달 전부터 이 흐름보다 앞서 나가고 있었습니다. 영어권 보도에서 빠져 있다고 느낀 점은 무엇인가요?

Qiita — 日刊IETF (2026-05-18) by tetsuko_room

토론: 프로덕션 환경에서 바이너리로 인코딩된 에이전트 상태를 디버깅하는 귀하의 접근 방식은 무엇인가요? 새벽 3시에 CBOR 또는 유사한 형식을 다루기 쉽게 만들어주는 도구를 찾으셨나요?