r/ClaudeAI분석2026. 06. 26. 06:40

Claude Code를 위한 재미있는 성과 검토 도구를 만들었습니다. 저도 성적을 받았는데 B를 받았네요

요약

Claude Code 사용 기록을 분석하여 사용자와 에이전트 간의 상호작용을 평가하는 'skiplevel' 도구를 소개합니다. 로컬 대화 기록을 기반으로 HTML 리뷰를 생성하며, 중복 읽기나 보안 위험 요소 등 유용한 통계도 제공합니다.

핵심 포인트

Claude Code 세션 기록을 분석해 360도 리뷰 생성
LLM 없이 결정론적 방식으로 명확성, 인내심 등 평가
중복 파일 읽기, 보안 경로 접근 등 유용한 분석 레이어 포함
로컬에서 실행되어 데이터 업로드 없이 독립적 HTML 생성

제 에이전트(agent)는 계속해서 "당신이 전적으로 옳습니다"라고 말했고, 저는 ~/.claude/projects에 모든 대화 기록(transcripts)을 보관하고 있었습니다. 그래서 저는 이 미팅을 공식화하기로 했습니다.

skiplevel은 해당 기록들을 로컬에서 읽어 당신과 당신의 에이전트 사이의 360도 리뷰를 생성합니다. 별도의 업로드 없이 독립적인 HTML 파일을 생성합니다.
제 632개의 세션과 16만 줄의 기록을 처리하는 데 약 2초가 걸렸습니다.

uvx skiplevel

제 결과는 다음과 같습니다:

Claude는 31일 동안 "당신이 전적으로 옳습니다"라고 56번 말했습니다.
단일 세션에서 동일한 파일을 30번 읽었습니다. 전체로는 151번입니다.
제가 339번 말을 끊었고, 모두 대문자(ALL CAPS)로 3,025단어를 입력했습니다.
한 번은 감독 없이 299개의 도구 호출(tool calls)을 연속으로 실행했습니다.
판결: 에이전트 A-, 저 B. 저는 언어 모델(language model)에게 7번 사과했고, 에이전트가 이를 기록했습니다.

당신은 명확성(clarity), 인내심(patience), 예의(civility), 신뢰(trust) 항목으로 평가받습니다. 에이전트는 효율성(efficiency), 신뢰성(reliability), 안전성(safety), 침착함(composure) 항목으로 평가받습니다. 모든 과정은 결정론적(deterministic)이며, 기본적으로 LLM을 사용하지 않습니다. 전체 평가 기준(rubric)은 리포지토리(repo)에 있습니다.

농담 뒤에는 유용한 레이어도 있습니다: 중복 읽기(redundant reads), 재시도 폭풍(retry storms), 타임스탬프가 포함된 민감한 파일 접근, 세션당 비용 등입니다. 에이전트가 .env 또는 .ssh 경로 근처에 접근할 때마다 플래그를 표시했습니다.

Codex CLI 및 opencode 기록에서도 작동합니다. 선택 사항인 --roast 플래그를 사용하면 당신의 통계(숫자만 전송하며, 프롬프트나 코드는 절대 전송하지 않음)를 당신의 Claude CLI로 보내 맞춤형 코멘트를 받을 수 있습니다.

Fable이 사용 가능했을 때 그것으로 이 도구를 만들었기에, Claude가 Claude를 검토하는 도구를 작성했습니다. Claude는 스스로에게 A-를 주었습니다.

MIT: https://github.com/repowise-dev/skiplevel

여러분은 어떤 성적을 받는지 보고 싶네요.

AI 자동 생성 콘텐츠

원문 바로가기

Claude Code를 위한 재미있는 성과 검토 도구를 만들었습니다. 저도 성적을 받았는데 B를 받았네요

요약

핵심 포인트

댓글