본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 31. 12:06

Hermes Agent를 사용하여 인지적 위협 사냥꾼(Cognitive Threat Hunter)을 구축했습니다 — 제가 이를 구축한 세션을

요약

Hermes Agent를 활용하여 '바이브 코딩' 세션 중 발생하는 인지적 오류를 분석하는 'ECHO Hunt'를 구축했습니다. 사용자가 AI의 결과물을 무비판적으로 수용하거나 원리를 이해하지 못한 채 넘어가는 인지적 위협을 탐지하고 분석합니다.

핵심 포인트

  • Hermes Agent 기반의 커스텀 스킬 'echo-hunt' 구현
  • 바이브 코딩 중 발생하는 4가지 인지적 TTPs 정의
  • 세션 로그 분석을 통한 인지적 포렌식 수행
  • Node.js 및 Express 기반의 기술 스택 활용

이 글은 Hermes Agent Challenge: Build With Hermes Agent를 위한 제출물입니다.

내가 만든 것

ECHO Hunt — Hermes Agent를 기반으로 구축된 바이브 코딩 (vibe coding) 세션을 위한 인지적 위협 사냥꾼 (cognitive threat hunter)입니다.

바이브 코딩 (vibe coding)은 오늘날 대부분의 사람들이 AI를 활용해 개발하는 방식입니다. 원하는 것을 설명하면 AI가 이를 생성하고, 사용자는 이를 실행하고, 오류를 수정하며, 반복합니다. 효과적인 방식이죠. 하지만 당신은 실제로 무언가를 배웠을까요, 아니면 AI가 단순히 당신을 이끌어준 것뿐일까요?

ECHO Hunt가 이를 밝혀냅니다. 세션 로그를 붙여넣고, 증거가 나오기 전에 자신의 사각지대 (blind spots)를 선언한 다음, Hermes가 실제로 찾아낸 결과와 마주하십시오.

이것은 단순한 보고서 생성기가 아닙니다. 당신이 직접 참여하는 조사 (investigation)입니다.

데모

🎥 전체 데모 보기

코드

🔗 github.com/FlowArchitect895/echo-hunt

나의 기술 스택 (Tech Stack)

  • Hermes Agent + echo-hunt 스킬 (skill)
  • Node.js + Express
  • Vanilla HTML/CSS/JS

Hermes Agent를 사용한 방법

echo-hunt 스킬

Hermes Agent는 echo-hunt라는 커스텀 스킬 (custom skill)을 실행합니다. 이 스킬은 바이브 코딩 (vibe coding) 세션 로그를 가져와 인지적 포렌식 사냥 (cognitive forensic hunt)을 수행합니다. 즉, 무엇인가를 분석하기 전에 가설을 세우고, 증거를 바탕으로 각 가설을 추적하며, 발견된 내용을 네 가지 인지적 TTPs (cognitive TTPs)에 매핑합니다:

  • 빌려온 자신감 (Borrowed Confidence) — 검증 없이 AI의 출력을 수용함
  • 피상적 해결 (Shallow Resolution) — 오류는 수정했지만, 왜 발생했는지는 이해하지 못함
  • 패턴 맹목 (Pattern Blindness) — 인지하지 못한 채 동일한 유형의 오류를 반복함
  • 성급한 종료 (Premature Exit) — 이해가 확고해지기 전에 다음 단계로 넘어감

아키텍처 (Architecture)

ECHO Hunt는 echo-hunt 스킬 프롬프트와 함께 hermes -z를 호출합니다. 단 한 번의 호출입니다. Hermes는 가설(hypotheses), 발견 사항(findings), TTP 분류(TTP classifications), 정답 및 그럴듯한 오답(distractors)이 고정된 귀속 문제(attribution challenges)를 포함한 전체 조사 과정을 미리 계산합니다. 게임 플레이 중에는 API 호출이 전혀 발생하지 않습니다. 모든 것은 캐시된 데이터(cached data) 위에서 실행됩니다.

선언 레이어 (The declaration layer)

Hermes가 사냥을 시작하기 전, 여러분은 자신의 사각지대(blind spots)를 선언합니다. 세 가지 질문이 주어집니다. 증거가 도착하기 전에 여러분은 답변을 확정합니다. 이것이 적대적 레이어(adversarial layer)입니다. 즉, 발생한 사건에 대한 여러분의 인지(perception)와 실제 사건 사이의 대결입니다.

대면 레이어 (The confrontation layer)

여러분의 선언은 Hermes가 찾아낸 결과와 마주하게 됩니다. 세 가지 결과가 있습니다:

  • 시그널 (Signal) — Hermes가 포착한 것을 여러분도 포착함
  • 고스트 (Ghost) — Hermes는 찾아냈으나 여러분은 완전히 놓친 무언가
  • 노이즈 (Noise) — 여러분은 표시했으나 Hermes는 표시하지 않은 무언가

챌린지 레이어 (The challenge layer)

확인된 각 발견 사항은 TTP 귀속 문제(TTP attribution challenge)가 됩니다. 4개의 옵션과 20초의 타이머가 주어집니다. 오답을 선택하면 무결성(integrity)이 10% 하락합니다. 정답을 맞히면 점수를 얻습니다. 타이머는 압박 요소입니다. 포렌식 결정(forensic decisions)은 기다려주지 않습니다.

판결 (The verdict)

Evidence Integrity 점수는 실제 플레이어 행동에서 계산됩니다 — 신호 대 유령, 올바른 대 잘못된 TTP(전술, 기술 및 절차) 귀속을 통해 말입니다. Hermes가 이 숫자를 생성하는 것이 아닙니다. 당신이 만들어냅니다.

Hermes가 저에 대해 발견한 것 (What Hermes found about me)

저는 ECHO Hunt를 ECHO Hunt를 구축했던 세션에서 실행했습니다. 발견된 내용은 다음과 같습니다:

  • 피상적 해결(Shallow Resolution) [중간 수준(MODERATE)] — 구성 문제들은 특정 설정이 왜 실패했는지 분석하기보다는 파일을 반복적으로 교체하는 방식으로 처리되었습니다.
  • 빌린 자신감(Borrowed Confidence) [높음(HIGH)] — 사소한 스킬 업데이트 직후에 대규모 UI 재작성을 수용하면서, 테스트 없이 로직이 정확하다고 가정했습니다.
  • 조기 종료(Premature Exit) [낮음(LOW)] — 적절한 준비 상태 확인(readiness check)을 구현하는 대신, 로딩 화면 문제를 해결하기 위해 대기 시간 휴리스틱(wait-time heuristic)을 사용했습니다.

가장 크게 와닿았던 확정된 발견은 다음과 같습니다: _

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0