중간 표현(Intermediate Representation)을 통한 실제 바이너리의 교차 플랫폼 소프트웨어 버스마킹 (Software
요약
본 논문은 Ghidra P-code를 중간 표현(IR)으로 활용하여 서로 다른 플랫폼 간의 소프트웨어 버스마킹 성능을 평가합니다. 실험 결과, ISA와 무관하게 높은 일관성을 입증했으며 Windows 바이너리에서의 희석 효과를 식별했습니다.
핵심 포인트
- Ghidra P-code를 통한 통합된 IR 리프팅 방식 제안
- 다양한 CPU 아키텍처 전반에서 높은 일관성($r=0.9846$) 입증
- Windows 바이너리 내 라이브러리 함수로 인한 희석 효과 식별
- 심슨 지수를 활용한 우수한 판별력 확인
소프트웨어 버스마킹 (Software birthmarking)은 프로그램의 특징적인 기능을 통해 표절을 탐지하지만, 교차 플랫폼에서의 회복력 (resilience)은 여전히 충분히 평가되지 않은 상태입니다. 본 논문은 Ghidra P-code를 통해 서로 다른 포맷들을 공통된 중간 표현 (Intermediate Representation, IR)으로 리프팅 (lifting) 함으로써, 실제 바이너리에 대한 통합된 버스마킹 접근 방식을 제안합니다. 다양한 플랫폼과 언어에 걸친 실험 결과, 명령어 집합 아키텍처 (ISA, Instruction Set Architecture)의 세부 사항과 무관하게 CPU 아키텍처 전반에서 뛰어난 일관성 ($r=0.9846$)을 입증했습니다. 또한 본 연구는 Windows 바이너리에서 라이브러리 유래 함수들의 확산으로 인해 유사도 점수가 저하되는 "희석 효과 (dilution effect)"를 식별했습니다. 이러한 노이즈에도 불구하고, 심슨 지수 (Simpson index)는 우수한 판별력을 보여주었습니다. 이러한 발견은 견고한 교차 플랫폼 버스마킹을 위한 실질적인 능력과 필수 요구 사항을 명확히 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기