arXiv중요논문2026. 04. 24. 21:50

TraceScope: 분리된 체크리스트 판정을 통한 인터랙티브 URL 분류

요약

기존의 정적(static) URL 분류기가 놓치던, 인터랙티브한 피싱 공격에 대응하기 위해 'TraceScope'를 제안합니다. TraceScope는 샌드박스 환경에서 GUI 브라우저를 구동하는 오퍼레이터 에이전트가 페이지 행동을 기록하고, 별도의 어드저커 에이전트가 MITRE ATT&CK 체크리스트 기반으로 증거를 검증하여 보고서를 생성합니다. 이 시스템은 기존 대비 높은 재현성(reproducible)과 정확도를 보여주며, 실제 피싱 환경에서도 우수한 성능을 입증했습니다.

핵심 포인트

TraceScope는 정적 분석의 한계를 극복하고, 상호작용형 포렌식 작업으로 URL 분류를 전환합니다.
샌드박스 오퍼레이터 에이전트가 GUI 브라우저를 구동하여 페이지 행동을 기록함으로써 '관찰자 효과(observer effect)'와 런타임 익스플로잇 위험을 방지합니다.
어드저커 에이전트는 LLM의 컨텍스트 한계를 우회하며, MITRE ATT&CK 체크리스트 기반으로 증거를 검증하고 IOCs를 추출합니다.
기존 시스템 대비 높은 재현성과 성능을 보여주었으며, 실제 수집된 피싱 이메일 데이터셋에서도 뛰어난 탐지 능력을 입증했습니다.

현대의 피싱 캠페인은 상호작용 게이트(interaction gates)(예: 체크박스/슬라이더 챌린지), 지연 콘텐츠 렌더링, 로고 없는 자격 증명 수집기 등을 사용하여 스냅샷 기반 URL 분류기를 점점 더 회피하고 있습니다. 이는 URL 분류를 정적 분류에서 인터랙티브 포렌식(forensics) 작업으로 전환시킵니다: 분석가는 잠재적인 런타임 익스플로잇(runtime exploits)으로부터 자신을 격리하면서 페이지를 능동적으로 탐색해야 합니다. 본 논문에서는 이러한 워크플로우를 대규모로 구현하는 분리된 분류 파이프라인인 TraceScope를 제시합니다. 관찰자 효과(observer effect)를 방지하고 안전성을 확보하기 위해, 샌드박스화된 오퍼레이터 에이전트(operator agent)가 시각적 동기 부여(visual motivation)에 의해 안내되는 실제 GUI 브라우저를 구동하여 페이지 동작을 유도하고, 이를 불변의 증거 번들(immutable evidence bundle)로 고정합니다. 별도로, 판정자 에이전트(adjudicator agent)는 온디맨드(on demand)로 증거를 쿼리하여 MITRE ATT&CK 체크리스트를 검증함으로써 LLM 컨텍스트 제한을 우회하고, 추출된 침해 지표(indicators of compromise, IOCs)와 최종 판결이 포함된 감사 준비가 된 보고서(audit-ready report)를 생성합니다. 기존 데이터셋에서 가져온 708개의 도달 가능한 URL(PhishTank에서 검증된 피싱 241개 및 Tranco 기반 크롤링에서 가져온 정상 467개)을 대상으로 평가한 결과, TraceScope는 0.94의 정밀도(precision)와 0.78의 재현율(recall)을 달성하여, 이전 세 가지 시각/참조 기반 분류기보다 재현율을 크게 향상시켰으며 검토에 적합한 재현 가능한, 분석가급 증거를 생성합니다. 더욱 중요하게도, 저희는 실제 환경에서 시스템을 평가하기 위해 실제 피싱 이메일 데이터셋을 수동으로 큐레이션(curated)했습니다. 우리의 평가는 TraceScope가 실세계 시나리오에서도 우수한 성능을 입증하며, 현재 최첨단 방어 체계가 식별하지 못하는 정교한 피싱 시도를 성공적으로 탐지함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

TraceScope: 분리된 체크리스트 판정을 통한 인터랙티브 URL 분류

요약

핵심 포인트

댓글