본문으로 건너뛰기

© 2026 Molayo

arXiv중요논문2026. 04. 24. 21:50

TraceScope: 상호작용형 URL 분석을 위한 새로운 프레임워크

요약

기존의 정적(static) URL 분류기가 놓치던, 인터랙티브한 피싱 공격에 대응하기 위해 'TraceScope'를 제안합니다. TraceScope는 샌드박스 환경에서 GUI 브라우저를 구동하는 오퍼레이터 에이전트가 페이지 행동을 기록하고, 별도의 어드저커 에이전트가 MITRE ATT&CK 체크리스트 기반으로 증거를 검증하여 보고서를 생성합니다. 이 시스템은 기존 대비 높은 재현성(reproducible)과 정확도를 보여주며, 실제 피싱 환경에서도 우수한 성능을 입증했습니다.

핵심 포인트

  • TraceScope는 정적 분석의 한계를 극복하고, 상호작용형 포렌식 작업으로 URL 분류를 전환합니다.
  • 샌드박스 오퍼레이터 에이전트가 GUI 브라우저를 구동하여 페이지 행동을 기록함으로써 '관찰자 효과(observer effect)'와 런타임 익스플로잇 위험을 방지합니다.
  • 어드저커 에이전트는 LLM의 컨텍스트 한계를 우회하며, MITRE ATT&CK 체크리스트 기반으로 증거를 검증하고 IOCs를 추출합니다.
  • 기존 시스템 대비 높은 재현성과 성능을 보여주었으며, 실제 수집된 피싱 이메일 데이터셋에서도 뛰어난 탐지 능력을 입증했습니다.

Modern phishing campaigns increasingly evade snapshot-based URL classifiers using interaction gates (e.g., checkbox/slider challenges), delayed content rendering, and logo-less credential harvesters. This shifts URL triage from static classification toward an interactive forensics task: an analyst must actively navigate the page while isolating themselves from potential runtime exploits. We present TraceScope, a decoupled triage pipeline that operationalizes this workflow at scale. To prevent the observer effect and ensure safety, a sandboxed operator agent drives a real GUI browser guided by visual motivation to elicit page behavior, freezing the session into an immutable evidence bundle. Separately, an adjudicator agent circumvents LLM context limitations by querying evidence on demand to verify a MITRE ATT&CK checklist, and generates an audit-ready report with extracted indicators of compromise (IOCs) and a final verdict. Evaluated on 708 reachable URLs from existing dataset (241 verified phishing from PhishTank and 467 benign from Tranco-derived crawling), TraceScope achieves 0.94 precision and 0.78 recall, substantially improving recall over three prior visual/reference-based classifiers while producing reproducible, analyst-grade evidence suitable for review. More importantly, we manually curated a dataset of real-world phishing emails to evaluate our system in a practical setting. Our evaluation reveals that TraceScope demonstrates superior performance in a real-world scenario as well, successfully detecting sophisticated phishing attempts that current state-of-the-art defenses fail to identify.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0