모든 AI 인프라 엔지니어가 북마크해야 할 11가지 오픈 소스 저장소

이번 주말에 AI 에이전트를 만드셨나요? 그 에이전트의 인프라에 대해 생각해 보셨나요?

당신은 이번 주말에 AI 에이전트를 만들었습니다.

코드를 작성하고.

웹을 브라우징하며.

MCP 도구를 사용합니다.

어쩌면 프로덕션 데이터에 접근할지도 모릅니다.

이제 스스로에게 물어보세요:

호스트로부터 에이전트를 격리하는 것은 무엇인가?
자격 증명 유출을 막는 것은 무엇인가?
도구 권한을 누가 제어하는가?
프롬프트 인젝션 (Prompt Injection) 이후에는 어떤 일이 발생하는가?
감사 추적 (Audit Trail)은 어디에 있는가?

대부분의 AI 엔지니어들은 첫 번째 사고가 발생한 후에야 이 질문들에 답하게 됩니다.

그동안 오픈 소스는 AI 에이전트를 위한 전체 인프라 및 보안 스택을 조용히 구축해 왔습니다.

모든 AI 인프라 엔지니어가 북마크해야 할 11가지 저장소를 소개합니다:

각 저장소는 프레임워크가 채워주지 못하는 공백을 다룹니다.

오픈 소스 AI 에이전트 인프라 및 보안 (Open Source AI Agent Infrastructure & Security)

1. ProjectRecon/awesome-ai-agents-security

AI 에이전트 보안 생태계의 살아있는 지도

기능: 보안 라이프사이클(레드팀 (Red Teaming), 런타임 보호 (Runtime Protection), 샌드박싱 (Sandboxing), 거버넌스 (Governance), 미들웨어 (Middleware))에 따라 정리된 AI 에이전트 보안 생태계의 큐레이션 및 유지 관리되는 인덱스입니다.

모든 것이 분류되고, 링크되어 있으며, 최신 상태로 유지됩니다. 전체 지형을 이해하거나 특정 보안 문제에 대한 도구를 찾아야 할 때 시작점이 되는 곳입니다.

AI 인프라에 중요한 이유: 이 분야는 그 어떤 단일 기사보다 빠르게 움직입니다. 이 저장소는 지속 가능한 인덱스입니다. 지켜보세요. 마지막 커밋과 오늘 사이의 차이가 바로 당신의 읽기 목록입니다.

🔗: https://github.com/ProjectRecon/awesome-ai-agents-security

2. promptfoo/promptfoo

LLM 애플리케이션을 위한 자동화된 레드팀 테스트(Red Teaming) 및 평가(Evals)

기능: 자동화된 LLM 레드팀 테스트(Red Teaming), 보안 테스트 및 모델 평가를 위한 표준 프레임워크입니다.

프롬프트 인젝션 (Prompt Injection), 탈옥 (Jailbreaks), 개인정보(PII) 유출, 모델 회귀 (Model Regression)를 다루며, GPT, Claude, Gemini, Llama 등 다양한 모델 간의 성능 비교를 지원합니다. 선언적인 YAML 설정을 사용하며, 네이티브 CI/CD 통합이 가능합니다. OpenAI와 Anthropic에서도 내부적으로 사용 중입니다. MIT 라이선스이며 완전한 오픈 소스입니다.

AI 인프라에 중요한 이유: 코드를 배포하기 전에 테스트하듯, 프롬프트와 에이전트(Agent)의 보안 경계도 테스트해야 합니다. Promptfoo는 레드팀 테스트를 체계적이고 스크립트화할 수 있게 하며, 기존 CI 파이프라인에 통합할 수 있게 해줍니다. 자동화된 보안 평가(Evals) 없이 에이전트 기능을 배포하는 것은 테스트 없이 코드를 배포하는 것과 같습니다.

🔗: https://github.com/promptfoo/promptfoo

3. aquasecurity/trivy

AI 인프라를 위한 공급망 취약점 스캐너 (Supply Chain Vulnerability Scanner)

기능: 컨테이너 이미지, Git 저장소 및 파일 시스템을 위한 올인원(All-in-one) 취약점 스캐너입니다.

이 도구 하나로 취약한 베이스 이미지, 잘못 설정된 Terraform, 보안에 취약한 Kubernetes 매니페스트(Manifests), Git 히스토리에 유출된 비밀값(Secrets), 취약한 애플리케이션 의존성(Dependencies)을 모두 잡아낼 수 있습니다. SARIF 출력 결과는 GitHub 보안(Security) 탭으로 직접 연동됩니다. GitHub Actions 통합을 위해 단 10줄의 YAML만 필요합니다.

AI 인프라에 중요한 이유: 완벽한 에이전트 코드를 작성하더라도 취약한 베이스 이미지(base image)를 배포하거나 잘못 설정된 인프라 모듈(infrastructure module)을 출시할 수 있습니다. 현재 공급망 공격(Supply chain attacks)이 지배적인 공격 벡터입니다. Trivy는 이러한 공격을 프로덕션(production)에 도달하기 전 CI 단계에서 포착합니다. 수동 검토 오버헤드 없이 자동화되어 있습니다.

🔗: https://github.com/aquasecurity/trivy

4. open-policy-agent/opa

AI 에이전트 인프라를 위한 코드형 정책 (Policy-as-Code)

기능: 전체 스택을 위한 범용 정책 엔진(policy engine)입니다. 보안 정책을 읽기 쉽고 테스트 가능한 Rego 코드로 표현합니다.

Kubernetes admission control, API 권한 부여(authorization), 인프라 구성 검증(infrastructure configuration validation)을 하나의 엔진으로 처리합니다. 보안 정책을 애플리케이션 코드로부터 분리(Decouple)하세요. 한 번 작성하여 어디에서나 적용할 수 있습니다. AI 에이전트가 도구(tool)를 호출하거나, API를 호출하거나, 리소스를 요청할 때 OPA가 허용 여부를 결정합니다.

AI 인프라에 중요한 이유: OPA는 에이전트 전용이 아니며, 바로 그 점 때문에 여기에 포함되었습니다. 여러분의 에이전트 인프라는 기존 클라우드 스택 내에 위치합니다. OPA는 두 개의 별도 보안 시스템을 유지할 필요 없이, 전통적인 인프라와 에이전트 워크로드(agentic workloads) 모두를 아우르는 일관되고 감사 가능한(auditable) 정책 계층을 제공합니다.

🔗: https://github.com/open-policy-agent/opa

5. AgentGateway (Linux Foundation)

MCP 및 A2A 에이전트 프로토콜을 위한 RBAC 프록시

기능: A2A 및 MCP 프로토콜 트래픽을 위한 AI 네이티브 프록시(proxy)입니다. 에이전트와 도구 간의 상호작용에 대해 RBAC(역할 기반 액세스 제어), 관찰 가능성(observability), 정책 강제(policy enforcement)를 제공합니다.

Linux Foundation에 기부되었습니다. 에이전트와 도구 사이에 위치합니다. 오직 적절한 권한을 가진 올바른 에이전트만이 적절한 도구를 호출할 수 있습니다. 프로토콜 계층에서 완전한 관찰 가능성을 제공합니다.

AI 인프라에 중요한 이유: MCP는 에이전트-도구 연결성 (agent-tool connectivity)을 위한 신흥 표준입니다. 대부분의 팀은 액세스 제어 계층 (access control layer) 없이 MCP를 직접 연결하며, 이는 중대하고 점점 커지는 공격 표면 (attack surface)이 됩니다. AgentGateway는 이를 위해 특화된 솔루션입니다. Linux Foundation의 관리 (stewardship)를 받는다는 것은 프로덕션급 안정성과 장기적인 유지보수를 의미합니다.

🔗: https://github.com/agentgateway/agentgateway

AlphaSignal을 읽어주셔서 감사합니다! 이 포스트는 공개되어 있으니 자유롭게 공유해 주세요.

AI 에이전트를 위한 런타임 보안 미들웨어 (Runtime Security Middleware)

기능: OWASP Agentic AI Top 10에 직접 매핑된 런타임 정책 엔진 (runtime policy engine).

OWASP가 목표 하이재킹 (goal hijacking), 도구 오용 (tool misuse), 신원 남용 (identity abuse), 로그 에이전트 (rogue agents)를 나열한 에이전트 AI 위험에 대한 첫 번째 공식 분류 체계를 발표했을 때, Microsoft는 이 모든 문제를 해결하는 툴킷을 출시했습니다. 밀리초 미만의 거버넌스 지연 시간 (sub-millisecond governance latency, <0.1ms p99)을 제공합니다. 사이드카 컨테이너 (sidecar container) 또는 미들웨어 계층 (middleware layer)으로 배포됩니다.

목표 하이재킹 (Goal hijacking) → 의미론적 의도 분류기 (semantic intent classifier)
도구 오용 (Tool misuse) → 기능 샌드박싱 (capability sandboxing) + MCP 보안 게이트웨이 (security gateway)
메모리 포이즈닝 (Memory poisoning) → 다수결 투표를 이용한 교차 모델 검증 커널 (Cross-Model Verification Kernel)
로그 에이전트 (Rogue agents) → 링 격리 (ring isolation), 신뢰 저하 (trust decay), 자동 킬 스위치 (automated kill switch)

AI 인프라에 중요한 이유: EU AI Act(EU AI 법)의 고위험 AI 의무 사항은 2026년 8월부터 효력이 발생합니다. Colorado AI Act는 2027년 1월에 시행됩니다. 에이전트형 AI 거버넌스 (Agentic AI governance)는 이제 권장 사항(best practice)을 넘어 법적 요구 사항으로 이동하고 있습니다. 이 저장소는 공식적인 위험 분류 체계 (risk taxonomy)에 맞춘 가장 포괄적인 오픈 소스 구현체입니다.

🔗: https://github.com/microsoft/agent-governance-toolkit

7. anthropics/claude-code-security-review

AI 기반 PR 보안 리뷰 (AI-Powered PR Security Review)

기능: 모든 풀 리퀘스트 (Pull Request, PR)에서 Claude Code를 실행하고, 보안 발견 사항을 인라인 리뷰 댓글로 게시하는 GitHub Action입니다.

차이점 인식 (Diff-aware): 변경된 파일만 분석합니다. 패턴 매칭이 아닌 의미론적 추론 (Semantic reasoning)을 사용하여 신뢰도가 높고 악용 가능한 취약점을 식기합니다. 정밀하게 조정된 오탐 (False positive) 필터링: 이론적인 문제나 속도 제한 (rate-limiting)으로 인한 노이즈를 배제합니다. 시니어 보안 엔지니어가 리뷰 시 지적할 법한 취약점만을 다룹니다.

어떠한 저장소에도 추가할 수 있는 단 하나의 YAML 파일로 구성됩니다.

AI 인프라에 중요한 이유: 보안 리뷰는 비용이 많이 들고 느리기 때문에 대부분의 팀이 건너뛰는 단계입니다. 이 도구는 모든 PR에서 이를 자동화하고 무료로 제공합니다. 정규 표현식 (regex) 대신 실제 LLM 추론을 사용하는 의미론적 분석 (semantic analysis) 품질 덕분에, 정적 분석 도구 (static analysis tools)가 완전히 놓치는 로직 수준의 보안 문제를 잡아냅니다.

🔗: github.com/anthropics/claude-code-security-review

8. vercel-labs/deepsec

에이전트 기반 취약점 스캐너 (Agent Powered Vulnerability Scanner)

기능: 코드베이스 전체를 스캔하여 수년간 방치되어 온 취약점을 찾아내는 AI 에이전트입니다.

빠른 정규식 매처 (regex matchers)가 후보를 찾아내면, Claude/Codex가 최대 사고 수준 (thinking levels)에서 조사합니다. 대규모 단일 저장소의 경우 작업이 병렬 워커 (parallel workers)를 통해 분산됩니다. 작업을 중단하거나 재시작할 수 있으며, 중단된 지점부터 다시 시작합니다.

AI 인프라에 중요한 이유: 이 목록에 있는 다른 모든 도구들은 런타임 (runtime) 시의 에이전트를 보호합니다. Deepsec은 한 단계 더 앞서 나갑니다. 에이전트가 읽고, 수정하고, 배포하게 될 코드베이스에 이미 존재하는 취약점들을 제거합니다.

🔗: https://github.com/vercel-labs/deepsec

9. dagger/container-use

코딩 에이전트를 위한 컨테이너화된 환경 (Containerized Environments)

기능: 코딩 에이전트를 위한 지속적이고 격리된 컨테이너 환경을 제공합니다.

Dagger 팀에서 제작했습니다. 각 코딩 에이전트는 자신만의 컨테이너를 가집니다. 여러 에이전트가 충돌 없이 병렬로 실행됩니다. 환경은 세션 간에 지속됩니다. 기존 환경 ID (env ID)를 사용하여 진행 중인 어떤 작업이든 중간부터 재개할 수 있습니다.

차별점: 모든 에이전트 실행에 대한 **전체 OpenTelemetry 인스트루멘테이션 (instrumentation)**을 지원합니다. 모든 LLM의 결정, 도구 호출 (tool call), 오류 및 재시도 (retry)가 빌드 트레이스 (build trace)에 나타납니다. 문제가 발생했을 때 추측할 필요 없이, 직접 확인할 수 있습니다.