NeoLabHQ/context-engineering-kit
요약
NeoLabHQ에서 공개한 context-engineering-kit은 Claude Code, Cursor 등 AI 코딩 도구의 성능을 극대화하기 위한 고급 컨텍스트 엔지니어링 기술 및 패턴 모음입니다. 에이전트 결과의 품질과 예측 가능성을 높이면서도 토큰 사용량을 최소화하도록 설계되었으며, 검증된 논문과 실무 프롬프트를 기반으로 합니다.
핵심 포인트
- 토큰 효율성을 위해 서브 에이전트(sub-agents) 중심의 명령형 아키텍처를 지향함
- 의존성 없이 설치 가능한 플러그인 구조로 필요한 기술만 선택적으로 로드 가능
- SDD(Spec-Driven Development) 및 DDD(Domain-Driven Design) 등 과학적이고 검증된 패턴 적용
- Claude Code에서 명령어를 통해 마켓플레이스 형태로 간편하게 추가 및 사용 가능
Claude Code, OpenCode, Cursor, Antigravity 등을 위한 고급 컨텍스트 엔지니어링 (context engineering) 기술 및 패턴.
빠른 시작 (Quick Start) · 플러그인 (Plugins) · Github Action · 참고 자료 (Reference) · 문서 (Docs)
에이전트 (agent) 결과의 품질과 예측 가능성을 향상하는 데 중점을 두며, 토큰 사용량 (token footprint)을 최소화하도록 설계된 고급 컨텍스트 엔지니어링 기술 및 패턴의 수제 컬렉션입니다.
이 마켓플레이스는 당사 개발자들이 오랫동안 매일 사용해 온 프롬프트 (prompts)를 기반으로 하며, 벤치마크 (benchmarked)된 논문과 고품질 프로젝트의 플러그인들을 통해 보완되었습니다.
사용하기 쉬움 (Simple to Use)- 의존성 (dependencies) 없이 쉽게 설치하고 사용할 수 있습니다. 자동으로 사용되는 기술 (skills)과 설명이 명확한 명령 (commands)을 포함합니다.
토큰 효율성 (Token-Efficient)- 불필요한 정보로 컨텍스트 (context)가 채워지는 것을 최소화하기 위해, 가능한 경우 일반 정보 기술보다는 서브 에이전트 (sub-agents)를 활용한 명령 중심의 기술을 선호하도록 정교하게 설계된 프롬프트와 아키텍처 (architecture)를 제공합니다.
품질 중심 (Quality-Focused)- 각 플러그인은 특정 영역에서 에이전트 결과를 의미 있게 개선하는 데 집중합니다.
세분화됨 (Granular)- 필요한 플러그인만 설치하세요. 각 플러그인은 중복되거나 불필요한 기술 없이 각자의 특정 에이전트, 명령, 기술만을 로드합니다.
과학적으로 입증됨 (Scientifically proven)- 플러그인은 신뢰할 수 있는 벤치마크와 연구를 통해 검증된 기술 및 패턴을 기반으로 합니다.
개방형 표준 (Open-Standards)- 기술은 agentskills.io 사양을 기반으로 합니다. SDD 플러그인은 소프트웨어 개발 문서화를 위한 Arc42 사양 표준을 기반으로 합니다.
주요 릴리스 업데이트:
v3.0.0: AMP 및 Hermes 에이전트 지원이 추가되었습니다. Tech Stack 플러그인은 이제 에이전트가 TypeScript 파일을 읽거나 쓸 때 TypeScript 베스트 프랙티스 (best practices)를 자동으로 주입합니다.
v2.2.0: Subagent-Driven Development (SDD) 플러그인이 이제 SDD 플러그인의 정제된 버전으로서 작동하며, 구현과 병렬적으로 사양 (specification) 생성을 위해 meta-judge 및 judge 서브 에이전트 (sub-agents)를 사용합니다. DDD 플러그인은 이제 Clean Architecture, DDD, SOLID, 함수형 프로그래밍 (Functional Programming) 및 기타 패턴 예시를 코드 작성 중 컨텍스트 (context)에 자동으로 추가되는 규칙으로 포함합니다.
v2.1.0: Spec-Driven Development (SDD) 플러그인 에이전트에 DDD 플러그인의 상위 수준 코드 품질 가이드라인이 포함되었습니다.
v2.0.0: Spec-Driven Development (SDD) 플러그인이 처음부터 완전히 다시 작성되었습니다. 이제 실제 운영 프로젝트의 99% 사례에서 작동하는 코드를 생성할 수 있습니다!
Open Claude Code를 열고 Context Engineering Kit 마켓플레이스 (marketplace)를 추가하세요.
/plugin marketplace add NeoLabHQ/context-engineering-kit
이렇게 하면 모든 플러그인을 설치할 수 있는 상태가 되지만, 에이전트 (agents)나 스킬 (skills)이 컨텍스트 (context)에 로드되지는 않습니다.
임의의 플러그인을 설치하세요 (예: reflexion):
/plugin install reflexion@NeoLabHQ/context-engineering-kit
설치된 각 플러그인은 Claude의 컨텍스트 (context)에 해당 플러그인 고유의 에이전트 (agents), 명령어 (commands), 스킬 (skills)만을 로드합니다.
터미널에서 vercel-labs/skills 명령어를 실행하세요:
npx skills add NeoLabHQ/context-engineering-kit
설치할 스킬 (skills)과 에이전트 (agents)를 선택할 수 있습니다.
대안 설치 방법
다음 명령어를 실행하여 OpenSkills를 통해 스킬 (skills)을 설치할 수 있습니다:
npx openskills install NeoLabHQ/context-engineering-kit
npx openskills sync
> claude "implement user authentication"
# Claude가 사용자 인증 (user authentication)을 구현합니다. 그 후 구현 내용에 대해 성찰 (reflect)하도록 요청할 수 있습니다.
> /reflexion:reflect
...
또는, 초기 프롬프트 (initial prompt)에서 reflect라는 단어를 사용할 수도 있습니다:
> claude "사용자 인증을 구현하고, 그 다음 reflect 하세요"
# Claude가 사용자 인증을 구현합니다.
# 그 다음 hook이 자동으로 /reflexion:reflect를 실행합니다.
이 hook을 사용하려면 bun이 설치되어 있어야 합니다.
하지만 전체 명령어를 실행하는 데 반드시 필요한 것은 아닙니다.
Context Engineering Kit의 전체 문서는 여기에서 확인할 수 있습니다.
다만, 저희가 시작 단계에서 추천하는 주요 플러그인은 Subagent-Driven Development (하위 에이전트 주도 개발)와 Spec-Driven Development (사양 주도 개발)입니다.
이 마켓플레이스에 있는 세 가지 플러그인은 에이전트가 제공된 지침을 얼마나 정확하고 일관되게 따르는지를 개선하고, 환각 (hallucinations) 및 잘못된 솔루션에 대한 편향 (bias)의 수를 줄이도록 설계되었습니다. 이들은 서로 경쟁 관계가 아니라 상호 보완적인 관계입니다. 왜냐하면 신뢰성 (reliability) 대 토큰 비용 (token cost) 사이의 균형을 맞출 수 있게 해주기 때문입니다. 다음은 작업 복잡도에 따라 완전히 정확하고 환각이 없는 결과를 받을 확률과 다양한 에이전트 사용 방식에 대한 상위 수준의 비교입니다:
| 방식 | 변경된 파일 수(p)에 대해 완전히 정확한 결과를 받을 확률 | 토큰 오버헤드 (Tokens Overhead) | 실제 적용 시 의미 |
|---|---|---|---|
| 1-3 | 4-10 | 10-20 | 20+ |
| ... |
신뢰성 지표 (Reliability metrics)는 6개월 이상 실제 프로덕션 프로젝트에서의 실제 개발 사용 사례를 기반으로 합니다.
사용 가능한 모든 플러그인을 보려면:
/plugin
-
Reflexion - 출력 품질을 향상시키기 위해 피드백 및 개선 루프 (feedback and refinement loops)를 도입합니다.
-
Spec-Driven Development (명세 기반 개발) - 지속적 학습 (Continuous Learning) + LLM-as-Judge + 에이전트 군집 (Agent Swarm)을 기반으로 명세 기반 개발을 위한 명령어를 도입합니다. 신뢰할 수 있는 코드 생성을 통해 **컴파일로서의 개발 (development as compilation)**을 달성합니다.
-
Review - 영향도/신뢰도 필터링 (impact/confidence filtering)을 갖춘 여러 전문화된 에이전트를 사용하여 코드 및 PR 리뷰 명령과 기술을 도입합니다.
-
Git - 커밋 및 PR 생성을 위한 명령어를 도입합니다.
-
Test-Driven Development (테스트 주도 개발) - 테스트 주도 개발을 위한 명령어, 일반적인 안티 패턴 (anti-patterns), 그리고 서브 에이전트 (subagents)를 사용한 테스트 기술을 도입합니다.
-
Subagent-Driven Development (서브 에이전트 주도 개발) - 각 작업마다 새로운 서브 에이전트를 할당하고 작업 사이에 코드 리뷰를 수행하여, 품질 게이트 (quality gates)와 함께 빠른 반복 (iteration)을 가능하게 하는 서브 에이전트 주도 개발 기술을 도입합니다.
-
Domain-Driven Development (도메인 주도 개발) - 코드 품질에 집중하는 도메인 주도 개발의 베스트 프랙티스(best practices)로 CLAUDE.md를 업데이트하는 명령어를 도입하며, 클린 아키텍처 (Clean Architecture), SOLID 원칙 및 기타 디자인 패턴을 포함합니다.
-
FPF - First Principles Framework (제1원리 프레임워크) - 지식 계층 진행과 함께 ADI 사이클 (Abduction-Deduction-Induction, 가추-연역-귀납)을 사용하는 구조화된 추론을 도입합니다. 가설 생성, 검증 및 감사 가능한 의사결정을 위해 fpf-agent와 함께 워크플로 명령 패턴 (workflow command pattern)을 사용합니다.
-
Kaizen (카이젠) - 일본의 지속적 개선 철학, 애자일 (Agile) 및 린 (Lean) 개발 관행에서 영감을 얻었습니다. 5 Whys, 인과관계 분석 (Cause and Effect Analysis) 및 기타 기술을 포함하여 문제의 근본 원인을 분석하기 위한 명령어를 도입합니다.
-
Customize Agent - Claude Code를 위한 명령어, 훅 (hooks) 및 기술을 작성하고 개선하기 위한 명령어와 기술을 제공합니다. 서브 에이전트 워크플로에 유용할 수 있는 Anthropic 베스트 프랙티스 및 에이전트 설득 원칙 (Agent Persuasion Principles)을 포함합니다.
-
Docs - 프로젝트 분석, 문서 작성 및 개선을 위한 명령어를 제공합니다.
-
Tech Stack - 언어별 베스트 프랙티스 규칙을 제공하며, 일치하는 파일 유형에서 작업할 때 자동으로 적용됩니다.
-
MCP - 필요한 경우 잘 알려진 MCP 서버 통합을 설정하고, 현재 프로젝트에서 이 MCP 서버를 사용하기 위한 요구 사항을 CLAUDE.md 파일에 업데이트하는 명령어를 제공합니다.
개발을 지원하고 새로운 기능 및 업데이트 소식을 받으려면 GitHub에서 NeoLabHQ/context-engineering-kit를 Star 해주세요.
LLM이 이전 응답과 출력을 스스로 되돌아보도록(reflect) 강제하는 명령어 모음입니다. 프롬프트에 "reflect"를 포함할 때 트리거되는 **자동 성찰 훅 (automatic reflection hooks)**이 포함되어 있습니다.
설치 방법
/plugin install reflexion@NeoLabHQ/context-engineering-kit
명령어
- /reflexion:reflect - 복잡도 분류(complexity triage) 및 검증을 통한 반복적 개선을 위해 Self-refinement 프레임워크를 기반으로 이전 응답과 출력을 성찰합니다.
- /reflexion:memorize - 성찰을 통해 얻은 통찰을 기억하고 이 지식을 CLAUDE.md 파일에 업데이트합니다. 에이전트 기반 컨텍스트 엔지니어링 (Agentic Context Engineering)을 사용하여 성찰 및 비판 내용에서 얻은 통찰을 CLAUDE.md로 큐레이션합니다.
- /reflexion:critique - 토론 및 합의 형성을 수행하는 전문 심사위원(specialized judges)을 사용하여 다각도에서 종합적인 검토를 수행합니다.
훅 (Hooks)
자동 성찰 훅 (Automatic Reflection Hook) - 프롬프트에 "reflect"가 나타나면 자동으로 /reflexion:reflect를 트리거합니다.
이론적 토대
이 플러그인은 Self-Refine 및 Reflexion과 같은 논문을 기반으로 합니다. 이러한 기술은 피드백 및 개선 루프(refinement loops)를 도입하여 대규모 언어 모델 (LLM)의 출력을 향상시킵니다.
이 기술들은 대화 생성, 코딩, 수학적 추론을 포함한 7가지 다양한 작업에서 자동 지표와 인간의 선호도를 모두 기준으로 측정했을 때, 표준적인 단일 단계(one-step) 모델 출력과 비교하여 출력 품질을 8~21% 향상시키는 것으로 증명되었습니다.
게다가, 이 플러그인은 성찰 후 메모리 업데이트를 사용하는 Agentic Context Engineering 논문을 기반으로 하며, 에이전트 성능 면에서 강력한 베이스라인 (strong baselines)보다 일관되게 10.6% 더 높은 성능을 보여줍니다.
영향력/신뢰도 필터링 (impact/confidence filtering)을 통해 철저한 코드 품질 평가를 수행하며, 여러 전문 에이전트를 사용하는 종합적인 코드 및 PR 리뷰 명령어를 제공합니다.
설치 방법 (How to install)
/plugin install review@NeoLabHQ/context-engineering-kit
명령어 (Commands)
- /review-local-changes - 코드 개선 제안을 포함하여 전문 에이전트(specialized agents)를 사용해 커밋되지 않은 로컬 변경 사항을 종합적으로 리뷰합니다.
- /review-pr - 전문 에이전트(specialized agents)를 사용하여 풀 리퀘스트 (Pull Request, PR)를 종합적으로 리뷰합니다.
에이전트 (Agents)
이 플러그인은 종합적인 코드 품질 분석을 위해 여러 전문 에이전트(specialized agents)를 사용합니다:
bug-hunter - 잠재적인 버그, 엣지 케이스 (edge cases), 오류 발생 가능성이 높은 패턴을 식별합니다.
code-quality-reviewer - 코드 구조, 가독성 및 유지보수성 (maintainability)을 평가합니다.
contracts-reviewer - 인터페이스, API 계약 (contracts) 및 데이터 모델을 리뷰합니다.
historical-context-reviewer - 코드베이스 (codebase) 이력 및 패턴과 관련하여 변경 사항을 분석합니다.
security-auditor - 보안 취약점 및 잠재적인 공격 벡터 (attack vectors)를 식별합니다.
test-coverage-reviewer - 테스트 커버리지 (test coverage)를 평가하고 누락된 테스트 케이스를 제안합니다.
GitHub Actions에서 코드를 리뷰하는 데 이 플러그인을 사용할 수 있습니다. 이를 위해서는 이 가이드를 따르십시오.
커밋 (commits), 풀 리퀘스트 (pull request) 생성 및 고급 워크플로 패턴 (workflow patterns)을 포함하여 효율적인 Git 작업을 위한 명령어와 스킬 (skills)입니다.
설치 방법 (How to install)
/plugin install git@NeoLabHQ/context-engineering-kit
명령어 (Commands)
- /commit - 컨벤셔널 커밋 메시지 (conventional commit messages)와 이모지를 사용하여 잘 정돈된 커밋을 생성합니다.
- /create-pr - 적절한 템플릿과 포맷팅을 사용하여 GitHub CLI를 통해 풀 리퀘스트 (pull requests)를 생성합니다.
- /analyze-issue - GitHub 이슈 (issue)를 분석하고 상세한 기술 사양 (technical specification)을 작성합니다.
- /load-issues - GitHub의 모든 오픈 이슈 (open issues)를 로드하여 마크다운 (markdown) 파일로 저장합니다.
- /worktree - 병렬 개발을 위해 git 워크트리 (worktrees)를 생성, 비교 및 병합하며 자동 의존성 설치를 수행합니다.
스킬 (Skills)
- notes - 이력을 변경하지 않고 커밋에 메타데이터 (metadata)를 추가하기 위해 git notes를 사용하는 스킬입니다.
안티 패턴 (anti-pattern) 탐지를 포함한 테스트 주도 개발 (Test-Driven Development, TDD)을 위한 명령어와 스킬입니다.
설치 방법 (How to install)
/plugin install tdd@NeoLabHQ/context-engineering-kit
명령어 (Commands)
- /write-tests - 전문화된 리뷰 및 개발 에이전트 (agents)를 사용하여 로컬 코드 변경 사항에 대한 테스트 커버리지 (test coverage)를 체계적으로 추가합니다.
- /fix-tests - 비즈니스 로직 변경 또는 리팩터링 (refactoring) 후 오케스트레이션된 에이전트 (orchestrated agents)를 사용하여 실패하는 테스트를 수정합니다.
기술 (Skills)
test-driven-development - 서브에이전트 (subagents)를 사용한 테스트 방법론, 베스트 프랙티스 (best practices) 및 테스트 기술을 도입합니다.
경쟁적 생성 (competitive generation), 멀티 에이전트 평가 (multi-agent evaluation), 그리고 품질 게이트 (quality gates)를 갖춘 서브에이전트 주도 개발 (subagent-driven development)을 위한 실행 프레임워크 (execution framework)입니다.
설치 방법 (How to install)
/plugin install sadd@NeoLabHQ/context-engineering-kit
명령어 (Commands)
- /launch-sub-agent - 지능형 모델 선택, Zero-shot CoT 추론 (reasoning), 그리고 자기 비판 검증 (self-critique verification)을 통해 집중된 서브에이전트 (sub-agents)를 실행합니다.
- /do-and-judge - 구현 서브에이전트 (implementation sub-agent), 독립적인 판사 검증 (independent judge verification), 그리고 통과할 때까지의 자동 재시도 루프 (automatic retry loop)를 통해 단일 작업을 실행합니다.
- /do-in-parallel - 컨텍스트 격리 (context isolation)를 유지하며 여러 독립적인 대상에 대해 동일한 작업을 병렬로 실행합니다.
- /do-in-steps - 자동 분해 (automatic decomposition) 및 컨텍스트 전달 (context passing)을 포함한 순차적 서브에이전트 오케스트레이션 (sequential sub-agent orchestration)을 통해 복잡한 작업을 실행합니다.
- /do-competitively - 경쟁적 생성 (competitive generation), 멀티 판사 평가 (multi-judge evaluation), 그리고 증거 기반 합성 (evidence-based synthesis)을 통해 작업을 실행하여 우수한 결과를 생성합니다.
- /tree-of-thoughts - 솔루션 공간 (solution space)의 체계적인 탐색, 유망하지 않은 가지치기 (pruning), 그리고 최적의 솔루션 합성을 통해 복잡한 추론 (complex reasoning)을 실행합니다.
- /judge-with-debate - 합의 형성 (consensus building) 또는 불일치 보고 (disagreement reporting)를 포함한 반복적인 멀티 판사 토론 (multi-judge debate)을 통해 솔루션을 평가합니다.
- /judge - 구조화된 루브릭 (structured rubrics)과 증거 기반 점수 산정 (evidence-based scoring)을 사용하는 LLM-as-Judge 방식을 사용하여 완료된 작업을 평가합니다.
기술 (Skills)
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub Claude Ecosystem의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기