워크플로 내의 보안: 취약점 처리를 위한 역할 기반 에이전트 아키텍처 탐색
요약
본 논문은 취약점 분석, 수정, 검증을 포함하는 다단계 보안 워크플로를 위한 역할 기반 에이전트 아키텍처를 제안합니다. Planner, Analyzer, Fixer, Verifier로 구성된 워크플로를 통해 실제 소프트웨어 보안 실무의 간극을 메우고자 합니다.
핵심 포인트
- Planner, Analyzer, Fixer, Verifier로 구성된 역할 기반 에이전트 워크플로 제안
- Analyzer 에이전트에 CodeQL 정적 분석 도구 통합
- nemotron, qwen3-coder, gpt-oss 등 다양한 모델 활용 및 평가
- 실제 C/C++ 취약점 대상 44% 탐지 및 19% 수정 정확도 달성
실무에서의 보안 소프트웨어 공학 (Secure software engineering)은 취약점 분석 (vulnerability analysis), 수정 (remediation), 그리고 수정 검증 (fix verification)을 포함하는 다단계 워크플로 (workflow)입니다. 그러나 현재의 LLM 기반 소프트웨어 보안 접근 방식은 탐지 (detection) 또는 패치 생성 (patch generation)과 같은 고립된 작업에 집중하는 경우가 많으며, 산업적 워크플로를 반영하는 에이전트 아키텍처 (agentic architectures)에는 주의를 거의 기울이지 않습니다. 이는 기존의 LLM 기반 취약점 처리 방법과 실제 실무 사이에 간극을 만듭니다. 본 논문에서 우리는 Planner, Analyzer, Fixer, Verifier 역할로 구성된 취약점 분석 및 완화를 위한 역할 기반 에이전트 워크플로 (role-based agentic workflow)를 연구합니다. 정적 분석 도구 (static analysis tool)의 효과를 탐색하기 위해, 워크플로 중 하나에서 Analyzer 에이전트를 CodeQL과 통합하였습니다. 사용된 모델에는 nemotron-cascade-2:30b, qwen3-coder-next, 그리고 gpt-oss:120b가 포함됩니다. 우리의 평가는 25개의 실제 C/C++ 취약점을 사용합니다. 연구 결과, GPT 5.5와 유사한 44%의 취약점 탐지 정확도와 19%의 수정 정확도를 보고합니다. 또한 우리는 소프트웨어 보안 실무자들의 관점에서 본 연구의 시사점을 나열합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기