LLM 지원 심볼릭 실행 (Symbolic Execution)을 통한 TEE 내 누락된 입력 검증 탐지
요약
SymTEE는 TEE 애플리케이션의 입력 검증 누락 문제를 탐지하기 위한 LLM 지원 심볼릭 실행 프레임워크입니다. AST 분석과 GPT-5를 결합하여 KLEE 호환 하네스를 자동 생성함으로써, 복잡한 환경 설정 없이도 높은 정밀도로 보안 취약점을 찾아냅니다.
핵심 포인트
- LLM을 활용한 심볼릭 실행용 모의 환경 자동 생성
- 실제 TEE 환경 없이도 취약점 분석 가능
- 평균 분석 비용 0.05달러의 높은 경제성
- 정밀도 100%, 재현율 92.3%의 우수한 성능 달성
신뢰 실행 환경 (Trusted Execution Environments, TEEs)은 신뢰할 수 없는 소프트웨어로부터 민감한 코드와 데이터를 보호하기 위해 하드웨어로 강제되는 격리 (isolation)를 제공합니다. 강력한 보안 보장에도 불구하고, 완전한 TEE 빌드 및 런타임 환경을 구성하는 데 드는 높은 비용과 복잡성, 그리고 하드웨어 격리로 인해 발생하는 제한된 관찰 가능성 (observability) 때문에 TEE 애플리케이션을 분석하는 것은 여전히 어려운 과제로 남아 있습니다. 본 논문은 실제 TEE 설정 없이도 TEE 애플리케이션에서 누락된 입력 검증 (input validation) 문제를 탐지하기 위한 새로운 대규모 언어 모델 (Large Language Model, LLM) 지원 심볼릭 실행 (Symbolic Execution) 프레임워크인 SymTEE를 제시합니다. SymTEE는 먼저 추상 구문 트리 (Abstract Syntax Tree, AST) 분석을 활용하여 충분한 입력 검증이 부족할 수 있는 TEE 코드 슬라이스 (code slices)를 추출한 다음, LLM (본 연구에서는 GPT-5 사용)을 사용하여 추출된 슬라이스를 심볼릭 분석을 위한 경량 모의 실행 환경 (mock execution environments)을 포함하는 KLEE 호환 하네스 (harness) 프로그램으로 자동 변환합니다. 26개의 취약점 (실제 사례 11개 및 합성 사례 15개)에 대한 평가 결과, SymTEE는 평균 분석 비용을 단 0.05달러로 유지하면서 누락된 입력 검증 취약점 탐지에서 100%의 정밀도 (precision)와 92.3%의 재현율 (recall)을 달성했습니다. 이러한 결과는 LLM이 자율적으로 모의 환경을 생성하여 복잡한 설정 없이 자동화된 보안 분석을 가능하게 하는 SymTEE의 선구적인 LLM 지원 심볼릭 실행 패러다임의 효과성과 실용성을 입증하며, 신뢰 컴퓨팅 시스템을 위한 더욱 접근 가능하고 확장 가능한 프레임워크를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기