arXiv논문2026. 06. 16. 12:10

Reddit 자기 공개 서사(Self-Disclosure Narratives)를 통한 사기 트렌드 및 경로 분석 이해

요약

Reddit의 자기 공개 서사를 활용하여 2023~2025년 사이의 사기 트렌드와 경로를 분석한 연구입니다. LLM 지원 방식을 통해 사기 체인을 라벨링하고, 사기 프로세스가 다중 경로 형태를 띠며 연도별로 변화함을 밝혀냈습니다.

핵심 포인트

Reddit 데이터를 활용한 사기 경로 및 트렌드 분석 데이터셋 구축
LLM 지원 방식을 통한 사기 체인(scam chains) 라벨링 및 검증
사기 프로세스는 주로 다중 경로(multi-rail) 형태를 보임
연도별로 사기 유형과 경로 구성 요소가 체계적으로 변화함
합성 사기 체인 시뮬레이션 및 AI 기반 사기 위험 평가 지원

온라인 사기 행위는 본질적으로 다단계적이며, 그 생애주기(lifecycle)는 고립된 신호들이 아닌 시간적으로 순서가 정해진 경로(rails)와 이벤트들을 포함합니다. 기존 연구들은 사기 유형과 경로의 특성을 분석하지만, 수년에 걸친 사기 트렌드를 추적하지는 않습니다. 또한, 주석(annotations)이 달린 오픈 소스 데이터셋의 부족과 다양한 사기 유형에 대한 커버리지 부족으로 인해 경로 간의 관계에 대한 연구가 저해되고 있습니다. 이러한 격차를 해소하기 위해, 우리는 2023년부터 2025년까지의 Reddit 자기 공개 서사(self-disclosure narratives)를 사용하여 사기 특성 및 경로(rail paths)의 연간 트렌드를 분석하기 위한 데이터셋을 구축합니다. 우리는 트렌드 분석을 위해 휴리스틱 주석(heuristic annotation) 방식을 사용하여 신원(identity), 통신(communication), 플랫폼(platform), 결제(payment) 중 적어도 하나의 경로를 포함하는 사기 관련 서브레딧(subreddits)으로부터 21,304개의 게시물을 수집했습니다. 그 다음, 사기 경로(scam path) 분석을 위해 LLM 지원 방식(LLM-assisted method)을 사용하여 명시적이거나 복구 가능한 사기 체인(scam chains)을 포함하는 1,800개의 게시물에 라벨을 지정했습니다. 이 방법은 인간 주석(human annotation)을 통해 평가되었습니다. 마지막으로, 커뮤니티 지원 행동을 분석하기 위해 게시물의 댓글에 토픽 모델(topic model)을 실행했습니다. 결과에 따르면 사기 프로세스는 지배적으로 다중 경로(multi-rail) 형태를 띱니다. 연도에 따라 서로 다른 사기 유형과 경로 구성 요소가 주를 이룹니다. 서로 다른 사기 유형은 경로 복잡성(path complexity) 면에서 체계적으로 차이를 보입니다. Reddit의 지원 행동은 시간이 지남에 따라 더욱 상세해졌습니다. 본 연구는 합성 사기 체인 데이터 시뮬레이션과 AI 관련 사기 위험 평가를 지원하지만, 그 결과가 다른 플랫폼으로 일반화되지 않을 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기