소프트웨어 역공학 AI 에이전트에 대한 프롬프트 주입 공격(Prompt Injection Attacks)의 탐지 및 난독화 조사
요약
에이전트 기반 소프트웨어 역공학 시스템을 대상으로 하는 프롬프트 주입 공격의 취약성을 분석한 연구입니다. 디컴파일러 출력물 내 공격 문자열 탐지 전략과 공격 난독화 및 이에 대한 방어 방법을 제안합니다.
핵심 포인트
- 에이전트 기반 역공학 시스템의 프롬프트 주입 취약성 확인
- 디컴파일러 출력물 내 적대적 프롬프트 탐지 방어 전략 입증
- 공격 난독화 기법 및 이에 대응하는 방어 방법 탐구
- 사이버 워크플로우 내 AI 에이전트 배치를 위한 보안 가이드 제공
에이전트 기반(Agentic) 소프트웨어 역공학 시스템은 실행 가능한 바이너리 파일의 소스 코드에 삽입된 프롬프트 주입 공격(Prompt Injection Attacks)에 취약합니다. 본 연구는 적대적 예시 프로그램(Adversarial example programs)의 디컴파일러(Decompiler) 출력물 내에 존재하는 프롬프트 주입 문자열의 존재를 탐지하기 위한 방어 전략을 입증합니다. 이러한 공격을 난독화(Obfuscating)하는 방법과 그에 따른 난독화 방어 방법 또한 탐구합니다. 본 연구는 에이전트 기반 소프트웨어 분석 시스템을 프로덕션 수준의 사이버 워크플로우(Cyber workflows)에 배치하는 데 필수적인 위험 및 보안에 대한 이해를 증진시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기