본문으로 건너뛰기

© 2026 Molayo

r/ClaudeAI분석2026. 06. 14. 11:04

LLM 주변을 자동 최적화하는 Claude 코드 스킬

요약

이 글은 LLM 주변의 코드를 자동 최적화하는 'Claude Code 스킬'을 소개합니다. 기존 논문 방식과 달리, 이 스킬은 외부 루프를 활용하여 사용자가 이미 지불하는 Claude 구독 내에서 실행됩니다. 순수 Python으로 구현된 스코러가 품질과 토큰 비용을 기준으로 반복적으로 최적의 설정을 유지합니다.

핵심 포인트

  • LLM 주변 코드를 자동 최적화하는 방법론 제시
  • 외부 루프를 활용하여 Claude 구독 내에서 실행 가능
  • 순수 Python 기반 스코러로 빠르고 결정론적인 테스트 수행

2026년 논문인 Meta-Harness는 고정된 LLM(대규모 언어 모델) 주변의 하네스(harness)를 최적화하는 것에 관한 것입니다. 여기서 최적화 대상은 가중치(weights)가 아니라 메모리/검색/컨텍스트/프롬프트 코드입니다. 여러 변형을 제안하고, 비용 효율적으로 점수를 매긴 다음, 가장 좋은 것을 유지하고 반복합니다.

원래 논문의 문제점은 그 코드의 대부분(~1,260줄)이 Claude를 헤드리스(headlessly)로 구동하는 방식을 단순히 재구현한다는 것입니다. Claude Code 내부에서는 그것이 필요하지 않습니다. Agent/Workflow//loop가 이미 런타임 역할을 하기 때문입니다. 그래서 저는 이 방법을 스킬로 변환했습니다: 외부 루프는 약 75줄이며, 제안자는 사용자가 이미 지불하는 Claude 구독을 통해 실행되고, 스코어러(scorer)는 순수 Python($0, API 키나 두 번째 모델 필요 없음)으로 구현되었습니다.

쉽게 말해, 이 스킬은 '모델이 기억하거나/검색하거나/보는 것'의 새로운 버전을 계속 시도하고, 각 버전에 대해 빠르고 결정론적인 테스트로 등급을 매긴 다음, 품질 대 토큰 비용 측면에서 승리하는 것을 유지합니다.

주의할 점: 이것은 마법이 아니며 벤치마크도 아닙니다. 포함된 예시는 작은 합성 데모입니다. 또한 명확한 실패 모드(만약 고정되거나 캐시된 실행을 기준으로 점수를 매긴다면, 검색 과정에서 컨텍스트를 비우는 방식으로 속임수가 될 수 있음)를 제시하고 이를 피하는 방법을 알려줍니다.

제출자: /u/proteus-design
[링크] [댓글]

AI 자동 생성 콘텐츠

본 콘텐츠는 r/ClaudeAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0