Claude Code 에 자신의 버릇을 고치게 하기 — Hook 및 대화 로그 마이닝으로 N=1 정렬
요약
이 가이드는 Claude Code와 같은 LLM의 반복적인 규칙 위반을 수정해야 하는 사용자들을 위해 설계되었습니다. 핵심은 대화 로그(jsonl)에서 특정 패턴('사용자가 수정하기 직전의 Claude 발화')을 추출하고, 이를 '훅(hook)'이라는 구조적 레일로 컨텍스트에 주입하는 것입니다. 이 기법을 통해 모델이 다음에 같은 오류를 범할 순간에 스스로 교정(self-correct)하도록 유도하여, 행동적 기억의 한계를 우회하는 배포 시 정렬 방법을 제시합니다.
핵심 포인트
- LLM의 반복적인 규칙 위반 문제를 해결하기 위한 실용적인 가이드입니다.
- 대화 로그 마이닝을 통해 모델의 오류 패턴(사용자 수정 직전 발화)을 추출하는 것이 핵심 단계입니다.
- 추출된 패턴을 '훅(hook)'이라는 구조적 레일로 컨텍스트에 주입하여 자기 교정 메커니즘을 구현합니다.
- 이 방법은 행동적 기억의 한계를 우회하며, 배포 시점에 모델 정렬(alignment)을 수행하는 고급 기법입니다.
TL;DR Claude Code 가 규칙 위반 → 사용자가 수정하는 과정을 매일 반복하는 분들을 위한 가이드입니다. 대화 로그 (jsonl) 에서 '사용자가 수정하기 직전의 Claude 발화'를 패턴으로 추출한 후, hook 을 통해 컨텍스트에 주입하면, 다음에 같은 패턴이 나올 순간에 자기 교정 (self-correct) 이 이루어집니다. 이는 행동적 기억 (behavioral remember/memory file) 의 한계를 구조적 레일 (structural rail/hook) 로 우회하는 배포 시 정렬 (deployment-time alignment) 기법입니다.
필요한 것: bash + jq + ~/.claude...
AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기