AI 에이전트에게 필요한 것은 프롬프트가 아니라 기술(Skills)입니다 — 2026년 에이전트 하네스(Agent Harnesses)의 부상 - Insights | Molayo

여전히 AI 코딩 에이전트를 위해 시스템 프롬프트(System Prompts)를 작성하고 계신가요? 그것은 컴파일러가 있는데 어셈블리(Assembly) 언어를 작성하는 것과 같습니다.

솔직히 말씀드리면, 저도 이런 변화가 올 줄 몰랐습니다. 8개월 전만 해도 저는 모든 채팅창에 "당신은 전문 개발자입니다"라는 서문을 복사해서 붙여넣고 있었습니다. 오늘날 그것은 플로피 디스크만큼이나 구식처럼 느껴집니다. AI 코딩 세계는 조용히 완전히 새로운 레이어(Layer)를 구축했으며, 만약 당신이 이를 사용하지 않고 있다면 기회를 놓치고 있는 것입니다.

지금 어떤 일이 일어나고 있는지 보여드리겠습니다.

기술 혁명 (155K 개의 별은 틀리지 않습니다)

The Skills Revolution (155K Stars Can't Be Wrong)

가장 큰 변화는 **에이전트 기술 (Agent Skills)**라고 불리는 것입니다. 이것을 AI 코딩 어시스턴트를 위한 재사용 가능한 플러그인이라고 생각하세요. 에이전트가 특정 작업을 처리하는 방법을 가르치는 구조화된 지침(Structured Instructions)입니다. 이것은 프롬프트(Prompts)가 아닙니다 (언뜻 보기에는 그렇게 보일 수 있지만 말이죠). 이것은 에이전트 행동을 위한 마이크로 API (Micro-APIs)에 더 가깝습니다.

Matt Pocock의 skills repository는 155,818개의 별을 보유하고 있으며 계속 늘어나고 있습니다. 이것은 말 그대로 그가 프로덕션(Production)에서 사용하는 .claude 파일들의 디렉토리입니다. 개념은 매우 간단합니다. 에이전트에게 매번 어떻게 행동해야 하는지 말하는 대신, 기술 파일(Skill file)을 한 번 작성하면 에이전트가 이를 자동으로 로드합니다.

Garry Tan의 gstack은 이를 한 단계 더 발전시켰습니다. Claude Code에 23개의 뚜렷한 역할(Roles)을 부여하는 툴셋으로 119,264개의 별을 받았습니다. CEO 모드, 디자이너 모드, 엔지니어링 매니저(Eng Manager) 모드 등 각각 고유한 행동 패턴을 가지고 있습니다. Tan의 주장은 단일 AI 에이전트가 모든 것에 능숙할 수는 없지만, 전문화된 페르소나(Personas)의 군집(Swarm)은 가능하다는 것입니다.

하네스 레이어 (Harness Layer): 진짜 마법이 일어나는 곳

The Harness Layer: Where the Real Magic Happens

기술(Skills)은 시작일 뿐입니다. 정말 흥미로운 것은 바로 하네스(harness) — 즉, 사용자와 코딩 에이전트 사이에서 실행되는 인프라 계층(infrastructure layer)입니다.

obra/superpowers는 245,702개의 스타를 보유한 이 분야의 독보적인 프로젝트입니다. 이는 서로 다른 기술들이 어떻게 상호작용하는지, 언제 활성화되는지, 그리고 서로 어떻게 컨텍스트(context)를 전달하는지를 관리하는 "에이전트 기술 프레임워크(agentic skills framework)"입니다. 여러분의 코딩 에이전트를 위한 운영체제(operating system)라고 생각하면 됩니다.

이것이 해결하는 문제는 매우 실질적입니다. AI 코딩 어시스턴트를 집중적으로 사용해 본 사람이라면 누구나 다음과 같은 고통을 알고 있습니다: 에이전트가 컨텍스트를 잊어버리거나, API를 환각(hallucinate)하거나, 엉뚱한 방향으로 빠지는 현상입니다. 하네스는 구조를 강제함으로써 이를 해결합니다. 즉, 에이전트는 계획(planning), 테스트(testing), 리뷰(review) 단계를 포함한 개발 방법론(development methodology)을 반드시 따라야 합니다.

# 예시: 간단한 에이전트 하네스 패턴 (의사 코드)
class Harness:
 def __init__(self, skills):
...

이것은 가설이 아닙니다. 이러한 시스템들은 현재 실제 프로덕션 환경에서 사용되고 있습니다.

메모리(Memory): 모든 것을 바꾸는 잃어버린 조각

Memory: The Missing Piece That Changes Everything

AI 도구 산업이 2년 내내 잘못 범해온 실수가 하나 있습니다: 모든 세션(session)을 마치 처음인 것처럼 취급했다는 점입니다.

claude-mem (85,725 stars)은 에이전트에게 세션을 관통하는 지속적인 컨텍스트(persistent context)를 제공함으로써 이 문제를 해결합니다. 이 도구는 에이전트가 수행하는 모든 것을 포착하고, AI를 통해 이를 압축하며, 향후 세션에 관련 컨텍스트를 주입합니다. 그 결과는 어떨까요? 여러분의 에이전트가 프로젝트 구조, 선호도, 그리고 패턴을 실제로 기억하게 됩니다.

저는 몇 주 전에 이것을 시도해 보았고 그 차이는 극명했습니다. 이전에는 "React 컴포넌트를 작성해줘"라고 하면 → 일반적인 버튼을 만들었습니다. 하지만 적용 후에는 "React 컴포넌트를 작성해줘"라고 하면 → 기존 코드베이스 스타일과 일치하고, 제가 선호하는 테스트 라이브러리를 사용하며, 저희 팀의 컨벤션(conventions)을 따르는 결과물을 만들어냈습니다. 기억하고 있었던 것입니다.

원시인 모드(Caveman Mode)와 토큰 경제(Token Economy)

놀랍게도 매우 유용한, 조금 이상한 사례가 하나 있습니다. caveman (별 83,154개)은 Claude Code 기술(skill)로, ... 원시인처럼 말함으로써 토큰 사용량을 65%까지 줄여줍니다.

❌ "이제 잠재적인 개선 사항을 위해 코드베이스를 분석하겠습니다."
✅ "코드 확인. 느린 부분 찾기. 수정."

말도 안 되는 소리처럼 들리겠지만, 실제로 작동합니다. 경제적 측면은 냉혹합니다. 규모가 커질수록 토큰을 65% 절감한다는 것은 API 비용도 동일한 비율로 떨어진다는 것을 의미합니다. AI 코딩 도구에 매달 200달러 이상을 지출하는 헤비 유저들에게 이는 실제적인 비용 절감입니다.

더 깊은 핵심은 토큰 효율성(token efficiency)이 에이전트 세계에서 일급 과제(first-class concern)가 되고 있다는 점입니다. 우리는 "AI가 이해하게 만들기"에서 "최소한의 토큰으로 AI가 이해하게 만들기"로 이동하고 있습니다. 이는 근본적인 사고방식의 전환입니다.

DESIGN.md: 아무도 예상치 못한 프론트엔드 혁명

VoltAgent/awesome-design-md (별 95,550개)는 아마도 이 모든 세계에서 가장 놀라운 프로젝트일 것입니다. 이것은 DESIGN.md 파일들의 모음으로, 코딩 에이전트가 일치하는 UI를 생성할 수 있도록 프로젝트에 투입하는 구조화된 디자인 시스템 문서입니다.

개념은 이렇습니다. 디자인 토큰(design tokens, 색상, 타이포그래피, 간격)과 컴포넌트 패턴을 설명하는 DESIGN.md를 작성합니다. 그러면 코딩 에이전트가 이를 읽고 실제로 일관성 있게 보이는 UI를 생성합니다. 더 이상 "버튼이 다른 행성에서 온 것 같다"는 문제는 발생하지 않습니다.

## 디자인 토큰 (Design Tokens)
- 기본(Primary): #3B82F6 (blue-500)
- 표면(Surface): #1E293B (slate-800)
...

이것을 프로젝트에 넣기만 하면 에이전트가 픽셀 단위로 일관된 컴포넌트를 만들어내는 것을 볼 수 있습니다. 정말 놀라운 일입니다.

빠른 비교: 에이전트 스택(The Agent Stack)

계층 (Layer)	도구 (Tool)	스타 (Stars)	역할 (What It Does)	필요한 이유 (Why You Need It)
기술 (Skills)	mattpocock/skills	155K	재사용 가능한 에이전트 행동 (Reusable agent behaviors)	반복 작업을 중단하기 위해
...

이 도구들을 결합하면 각 부분의 합보다 더 강력한 AI 코딩 환경을 구축할 수 있습니다. 그리고 이 모든 것은 무료입니다.

이것이 개발자에게 의미하는 바 (현실적인 이야기)

이 생태계를 살펴본 후의 저의 솔직한 견해는 다음과 같습니다:

소프트웨어를 출시하는 데 드는 진입 장벽이 거의 제로(0)에 수렴할 것입니다. AI가 모든 코드를 작성하기 때문이 아닙니다. AI 코딩을 둘러싼 인프라가 훌륭한 개발의 '구조(structure)'를 자동화할 수 있는 수준까지 성숙했기 때문입니다.

기술 (Skills)은 에이전트에게 도메인 전문 지식 (domain expertise)을 부여합니다. 하네스 (Harnesses)는 프로세스를 강제합니다. 메모리 (Memory)는 연속성을 제공합니다.

DESIGN.md는 설계와 코드를 연결합니다. Caveman은 비용을 절감합니다. 각 구성 요소는 가공되지 않은 LLM 코딩의 특정 실패 모드 (failure mode)를 해결합니다.

2026년에 번창할 개발자는 최고의 프롬프트를 작성할 수 있는 사람이 아닙니다. 이 스택 (stack)을 이해하는 사람, 즉 하네스를 구성하고, 자신의 도메인을 위한 기술을 작성하며, 에이전트가 실제로 학습할 수 있도록 지속성 (persistence)을 연결할 수 있는 사람입니다.

결론

에이전트 세계는 대부분의 사람들이 인식하는 것보다 훨씬 빠르게 움직이고 있습니다. 두 달 전만 해도 "에이전트 기술 (agent skills)"은 하나의 카테고리조차 아니었습니다. 이제 상위 리포지토리들은 25만 개의 스타를 보유하고 있습니다. 제가 여기서 언급한 프로젝트들은 대부분의 웹 프레임워크보다 더 많은 GitHub 트래픽을 생성하고 있습니다.

만약 여러분이 여전히 AI 코딩 도구를 단순한 채팅 인터페이스로만 취급하고 있다면, 가능한 기능의 90%를 놓치고 있는 것입니다. 하네스를 설치하세요. 기술을 작성하세요. 에이전트에게 메모리를 부여하세요. 그 차이는 밤과 낮만큼이나 큽니다.

도구들은 무료이며 오픈 소스입니다. 무엇이 여러분을 망설이게 합니까?

Developer configuring Claude Code skills

이 분석이 마음에 드셨나요? 직접 다음 저장소들을 확인해 보세요: superpowers, skills, gstack, claude-mem, awesome-design-md, caveman

Insights

AI 에이전트에게 필요한 것은 프롬프트가 아니라 기술(Skills)입니다 — 2026년 에이전트 하네스(Agent Harnesses)의 부상

요약

핵심 포인트