FuzzingBrain V2: 자동화된 취약점 발견 및 재현을 위한 멀티 에이전트 LLM 시스템
요약
FuzzingBrain V2는 멀티 에이전트 LLM을 활용하여 소프트웨어 취약점을 자동으로 탐지하고 재현하는 시스템입니다. 높은 오탐률과 컨텍스트 부족 문제를 해결하기 위해 제어 흐름 기반 추상화와 이중 계층 퍼징 기술을 도입했습니다. AIxCC 2025 데이터셋에서 90%의 탐지율을 기록하며 실제 제로 데이 취약점 발견 능력을 입증했습니다.
핵심 포인트
- 멀티 에이전트 시스템을 통한 취약점 탐지 및 자동 재현
- 의심 지점(Suspicious Point) 개념을 통한 정밀한 위치 파악
- 이중 계층 퍼징을 활용한 함수 커버리지 향상
- 실제 오픈 소스 프로젝트에서 29개의 제로 데이 취약점 발견
소프트웨어 취약점은 심각한 보안 위협을 초래하며, 2025년에는 거의 50,000개의 CVE가 보고되었습니다. 거대 언어 모델 (LLMs)이 자동화된 취약점 탐지 측면에서 가능성을 보여주고 있지만, 세 가지 주요 과제가 남아 있습니다. 첫째, LLM이 생성한 취약점 보고서는 높은 오탐률 (false positive rates)을 보이며 재현 가능한 검증이 부족합니다. 둘째, 기존의 LLM 기반 접근 방식은 취약점 위치 파악 (vulnerability localization)을 위해 최적화되지 않은 입도 (granularities)를 사용합니다. 함수 수준 (function-level) 분석은 컨텍스트가 방대해지면 버그를 간과하는 반면, 라인 수준 (line-level) 분석은 충분한 컨텍스트가 부족합니다. 셋째, 기존 방식은 복잡한 함수 간 의존성 (cross-function dependencies) 및 트리거 조건 (triggering conditions)을 가진 취약점에 대해 추론하는 데 어려움을 겪습니다. 우리는 이러한 격차를 네 가지 핵심 기여를 통해 해결하는 멀티 에이전트 시스템인 FuzzingBrain V2를 제시합니다: (1) Google의 OSS-Fuzz를 기반으로 구축되어 보고된 모든 취약점이 퍼저 (fuzzer)로 재현 가능함을 보장하는 완전 자동화된 취약점 분석; (2) 최적의 입도에서 정밀한 취약점 위치 파악을 위한 새로운 제어 흐름 기반 추상화인 의심 지점 (Suspicious Point); (3) 자원 제약 하에서 함수 커버리지를 향상시키는 이중 계층 퍼징 (dual-layer fuzzing)을 포함한 논리 주도형 계층적 함수 분석; (4) 복잡한 취약점 추론을 강화하는 컨텍스트 엔지니어링 (context engineering)이 적용된 MCP 기반 정적 및 동적 분석 도구. AIxCC 2025 결선 대회 C/C++ 데이터셋에서 FuzzingBrain V2는 90%의 탐지율 (40개 취약점 중 36개)을 달성했습니다. 실제 배포 환경에서 FuzzingBrain V2는 12개의 오픈 소스 프로젝트에서 29개의 제로 데이 (zero-day) 취약점을 발견했으며, 이들은 모두 유지 관리자에 의해 확인 및 수정되었고 2개의 CVE ID가 할당되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기