arXiv논문2026. 05. 25. 16:47

기계 생성 텍스트의 숨겨진 인간 유사성: 이론 및 탐지 강화

요약

LLM이 생성한 텍스트 내에 존재하는 인간 유사 구간이 탐지를 어렵게 만든다는 점을 이론적으로 분석했습니다. 이를 해결하기 위해 하드 EM 알고리즘 기반의 모델 불가지론적 스택 강화 프레임워크를 제안하여 탐지 성능을 개선했습니다.

핵심 포인트

기계 생성 텍스트 내 인간 유사 구간의 존재 확인
문장 복잡도 증가로 인한 탐지 난이도 상승 분석
하드 EM 기반의 구간 수준 유지 결정 모델링
훈련이 필요 없는(training-free) 유연한 프레임워크 제안

대규모 언어 모델 (LLMs)에 의해 생성된 기계 생성 텍스트 (MGTs)는 다양한 애플리케이션에서 점점 더 널리 퍼지고 있으며, 가짜 뉴스 전파 및 피싱에서의 잠재적 오용은 심각한 우려를 불러일으켜 MGT 탐지의 필요성을 강조하고 있습니다. 기존의 문단 수준 탐지 방법들은 일반적으로 MGT를 완전히 기계적인 것으로 취급하며, 기계 생성 텍스트의 숨겨진 인간 유사성 (human-like nature)을 간과합니다. 즉, 완전히 기계에 의해 생성된 텍스트라 할지라도 인간의 글쓰기와 매우 일치하는 구간 (spans)을 포함할 수 있습니다. 이를 위해, 본 연구에서는 먼저 이러한 숨겨진 인간 유사 구간의 존재를 밝히고, 탐지에 미치는 영향을 이론적으로 분석합니다. 우리의 분석에 따르면, 이러한 구간들은 탐지를 위한 문장 복잡성 (sentence complexity)을 증가시켜 MGT 탐지를 본질적으로 더 어렵게 만듭니다. 이러한 발견을 바탕으로, 우리는 숨겨진 인간 유사 구간의 영향을 줄임으로써 기존 탐지기를 개선하는 모델 불가지론적 (model-agnostic) 스택 강화 프레임워크를 제안합니다. 구체적으로, 우리는 구간 수준의 유지 결정 (span-level retention decisions)을 잠재 변수 문제 (latent-variable problem)로 모델링하고, 하드 EM (hard-EM)에서 영감을 얻은 절차를 통해 최적화를 구현합니다. 여기서 탐지기는 확신 있게 인간과 유사한 하위 시퀀스 (subsequences)를 반복적으로 필터링하고 남은 텍스트를 바탕으로 스스로를 정교화합니다. 다양한 LLMs 및 실제 시나리오에 걸친 광범위한 실험을 통해 제안된 프레임워크가 기존 탐지기를 일관되게 향상시킨다는 것을 입증했습니다. 특히, 이 프레임워크는 훈련이 필요 없는 (training-free) 방식으로도 작동할 수 있어, 실제 배포를 위한 유연성과 확장성을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

기계 생성 텍스트의 숨겨진 인간 유사성: 이론 및 탐지 강화

요약

핵심 포인트

댓글