arXiv논문2026. 06. 01. 11:55

소프트웨어 역공학 AI 에이전트에 대한 프롬프트 주입 공격(Prompt Injection Attacks)의 탐지 및 난독화 조사

요약

에이전트 기반 소프트웨어 역공학 시스템을 대상으로 하는 프롬프트 주입 공격의 취약성을 분석한 연구입니다. 디컴파일러 출력물 내 공격 문자열 탐지 전략과 공격 난독화 및 이에 대한 방어 방법을 제안합니다.

핵심 포인트

에이전트 기반 역공학 시스템의 프롬프트 주입 취약성 확인
디컴파일러 출력물 내 적대적 프롬프트 탐지 방어 전략 입증
공격 난독화 기법 및 이에 대응하는 방어 방법 탐구
사이버 워크플로우 내 AI 에이전트 배치를 위한 보안 가이드 제공

에이전트 기반(Agentic) 소프트웨어 역공학 시스템은 실행 가능한 바이너리 파일의 소스 코드에 삽입된 프롬프트 주입 공격(Prompt Injection Attacks)에 취약합니다. 본 연구는 적대적 예시 프로그램(Adversarial example programs)의 디컴파일러(Decompiler) 출력물 내에 존재하는 프롬프트 주입 문자열의 존재를 탐지하기 위한 방어 전략을 입증합니다. 이러한 공격을 난독화(Obfuscating)하는 방법과 그에 따른 난독화 방어 방법 또한 탐구합니다. 본 연구는 에이전트 기반 소프트웨어 분석 시스템을 프로덕션 수준의 사이버 워크플로우(Cyber workflows)에 배치하는 데 필수적인 위험 및 보안에 대한 이해를 증진시킵니다.

AI 자동 생성 콘텐츠

원문 바로가기

소프트웨어 역공학 AI 에이전트에 대한 프롬프트 주입 공격(Prompt Injection Attacks)의 탐지 및 난독화 조사

요약

핵심 포인트

댓글