Acoda: LLM 기반 분석에 대응하기 위한 적대적 코드 난독화
요약
LLM의 코드 분석 능력으로 인한 지적 재산 유출 위험을 방어하기 위해 유전 알고리즘 기반의 적대적 코드 난독화 프레임워크인 Acoda를 제안합니다. Acoda는 코드의 의미를 유지하면서도 LLM이 코드를 오해하거나 분석을 거부하도록 유도하여 보안을 강화합니다.
핵심 포인트
- LLM의 코드 역공학 및 지적 재산 유출 위험 방어
- 유전 알고리즘을 활용한 의미 보존형 난독화 최적화
- GPT-4o, Llama 등 주요 LLM 대상 높은 공격 성공률 달성
- 모델 간 교차 전이성 및 최소한의 런타임 오버헤드 확보
코드 이해, 디버깅, 취약점 탐지(vulnerability detection)와 같은 소프트웨어 공학 (SE) 작업에서 대규모 언어 모델 (LLMs)의 광범위한 채택과 함께, 이들의 강력한 의미론적 추론 (semantic reasoning) 능력은 새로운 보안 및 개인정보 보호 위험을 초래했습니다. LLMs는 소스 코드 로직을 분석, 재구성 또는 역공학 (reverse-engineer)할 수 있으며, 이는 잠재적으로 지적 재산의 유출로 이어질 수 있습니다. 이 문제를 해결하기 위해, 우리는 LLM 기반 코드 분석에 방어하는 유전 알고리즘 (genetic algorithm) 기반의 적대적 코드 난독화 (adversarial code obfuscation) 프레임워크인 Acoda를 제안합니다. Acoda는 LLMs의 두 가지 핵심 메커니즘인 안전 정렬 (safety alignment)과 토큰 기반 정보 처리 (token-based information processing)를 활용하여 8가지 의미 보존 (semantics-preserving) 난독화 방법을 설계합니다. 이는 유전 알고리즘을 통해 난독화 전략을 반복적으로 최적화하여 방어 효과를 극대화하는 적대적 샘플을 생성합니다. 또한, 우리는 대상 LLM이 난독화된 코드를 얼마나 종합적으로 분석하는지 평가하기 위해 보조 LLM과 4가지 평가 지표를 결합한 LLM 응답 기반의 정량적 평가 프레임워크를 제안합니다. 실험 결과에 따르면, Acoda는 LLMs가 코드 분석을 거부하거나 오해하도록 효과적으로 유도할 수 있음을 보여줍니다. GPT-4o, DeepSeek, Qwen, Llama, Gemma를 포함한 7개의 최첨단 (state-of-the-art) LLMs에 대해, Acoda는 원본 코드의 의미를 변경하지 않으면서도 강력한 교차 모델 전이성 (cross-model transferability)과 최소한의 런타임 오버헤드 (runtime overhead)를 유지하며 최대 70%의 공격 성공률 (ASR)을 달성합니다. 전반적으로, 본 연구는 LLM 시대의 코드 보호 및 LLM 보안 방어에 대한 새로운 관점을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기