본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 18. 20:02

기계 생성 텍스트 탐지를 위한 다층적 문맥 토큰 관계 모델링

요약

기계 생성 텍스트(MGT) 탐지 시 발생하는 토큰 수준 점수의 무작위성 편향 문제를 해결하기 위한 새로운 프레임워크를 제안합니다. 마르코프 정보 보정 모듈을 통한 국소적 관계 모델링과 논리 규칙 기반의 전역적 관계 추론을 결합하여 탐지 성능을 높였습니다. 실험 결과, 낮은 계산 비용으로도 다양한 LLM 및 도메인 환경에서 뛰어난 탐지 성능을 입증했습니다.

핵심 포인트

  • 기존 지표 기반 방식의 한계인 토큰 수준의 무작위성 편향 문제를 식별함
  • 경량 마르코프 정보 보정(Markov-informed calibration)을 통한 국소적 토큰 관계 정제
  • 문맥 점수 통계와 명시적 논리 규칙을 활용한 전역적 규칙 지원 추론(Rule-support reasoning) 도입
  • 낮은 계산 오버헤드로 Cross-LLM 및 Cross-domain 환경에서 높은 범용성 확보

기계 생성 텍스트 (Machine-generated texts, MGTs)는 허위 정보 및 피싱과 같은 위험을 초래하며, 이는 신뢰할 수 있는 탐지의 필요성을 강조합니다. MGTs의 통계적으로 구별 가능한 특징을 추출하는 지표 기반 (Metric-based) 방식은 과적합 (Overfitting)되기 쉬운 복잡한 모델 기반 (Model-based) 방식보다 종종 더 실용적입니다. 다양한 설계 방식을 고려하여, 우리는 먼저 대표적인 지표 기반 방식들을 통합된 프레임워크 내에 배치하여 이들의 장점과 한계를 명확하게 평가할 수 있도록 했습니다. 우리의 분석은 이러한 방식 전반에 걸친 핵심 과제를 식별했습니다. 즉, 토큰 수준 (Token-level)의 탐지 점수는 MGTs 생성 과정의 내재된 무작위성에 의해 쉽게 편향될 수 있다는 점입니다. 그 후, 우리는 토큰 수준 탐지 점수의 다중 홉 전이 (Multi-hop transitions)를 이론적으로 도출하고, 이들의 국소적 (Local) 및 전역적 (Global) 관계를 탐구합니다. 이러한 발견을 바탕으로, 우리는 MGT 탐지를 위한 다층적 문맥 토큰 관계 모델링 (Multi-level contextual token relation modeling) 프레임워크를 제안합니다. 구체적으로, 국소적 관계의 경우, 집계 전 토큰 수준의 증거를 정제하는 경량 마르코프 정보 보정 (Markov-informed calibration) 모듈을 통해 이를 모델링합니다. 전역적 관계의 경우, 문맥 점수 통계로부터 도출된 명시적인 논리 규칙을 사용하는 규칙 지원 추론 (Rule-support reasoning) 모듈을 도입합니다. 마지막으로, 국소 보정 점수와 전역 규칙 지원 추론 신호를 결합된 다층 추론 프레임워크 내에서 결합합니다. 광범위한 실험을 통해 낮은 계산 오버헤드(Computational overhead)로 교차 LLM (Cross-LLM) 및 교차 도메인 (Cross-domain) 설정을 포함한 다양한 실제 시나리오에서 폭넓고 상당한 개선을 보여주었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0