FuzzingBrain V2: 자동화된 취약점 발견 및 재현을 위한 멀티 에이전트 LLM 시스템

소프트웨어 취약점은 심각한 보안 위협을 초래하며, 2025년에는 거의 50,000개의 CVE가 보고되었습니다. 거대 언어 모델 (LLMs)이 자동화된 취약점 탐지 측면에서 가능성을 보여주고 있지만, 세 가지 주요 과제가 남아 있습니다. 첫째, LLM이 생성한 취약점 보고서는 높은 오탐률 (false positive rates)을 보이며 재현 가능한 검증이 부족합니다. 둘째, 기존의 LLM 기반 접근 방식은 취약점 위치 파악 (vulnerability localization)을 위해 최적화되지 않은 입도 (granularities)를 사용합니다. 함수 수준 (function-level) 분석은 컨텍스트가 방대해지면 버그를 간과하는 반면, 라인 수준 (line-level) 분석은 충분한 컨텍스트가 부족합니다. 셋째, 기존 방식은 복잡한 함수 간 의존성 (cross-function dependencies) 및 트리거 조건 (triggering conditions)을 가진 취약점에 대해 추론하는 데 어려움을 겪습니다. 우리는 이러한 격차를 네 가지 핵심 기여를 통해 해결하는 멀티 에이전트 시스템인 FuzzingBrain V2를 제시합니다: (1) Google의 OSS-Fuzz를 기반으로 구축되어 보고된 모든 취약점이 퍼저 (fuzzer)로 재현 가능함을 보장하는 완전 자동화된 취약점 분석; (2) 최적의 입도에서 정밀한 취약점 위치 파악을 위한 새로운 제어 흐름 기반 추상화인 의심 지점 (Suspicious Point); (3) 자원 제약 하에서 함수 커버리지를 향상시키는 이중 계층 퍼징 (dual-layer fuzzing)을 포함한 논리 주도형 계층적 함수 분석; (4) 복잡한 취약점 추론을 강화하는 컨텍스트 엔지니어링 (context engineering)이 적용된 MCP 기반 정적 및 동적 분석 도구. AIxCC 2025 결선 대회 C/C++ 데이터셋에서 FuzzingBrain V2는 90%의 탐지율 (40개 취약점 중 36개)을 달성했습니다. 실제 배포 환경에서 FuzzingBrain V2는 12개의 오픈 소스 프로젝트에서 29개의 제로 데이 (zero-day) 취약점을 발견했으며, 이들은 모두 유지 관리자에 의해 확인 및 수정되었고 2개의 CVE ID가 할당되었습니다.

Insights

FuzzingBrain V2: 자동화된 취약점 발견 및 재현을 위한 멀티 에이전트 LLM 시스템

요약

핵심 포인트

댓글

NPU가 LLMs를 처리할 준비가 되었는가? 모바일 LLM 추론의 숨겨진 효율성 병목 현상 분석

WristMimic: 손목 가이드를 이용한 전신 휴머노이드 제어 및 조작

NEMESIS: 역변환 인지 SPICE 앵커링을 통한 NEtlist 기반 모델링 및 방정식 합성

ArtisanCAD: 전문가 지식 증류를 활용한 산업 수준 CAD 에이전트

NPU가 LLMs를 처리할 준비가 되었는가? 모바일 LLM 추론의 숨겨진 효율성 병목 현상 분석

WristMimic: 손목 가이드를 이용한 전신 휴머노이드 제어 및 조작

NEMESIS: 역변환 인지 SPICE 앵커링을 통한 NEtlist 기반 모델링 및 방정식 합성

ArtisanCAD: 전문가 지식 증류를 활용한 산업 수준 CAD 에이전트