arXiv논문2026. 06. 18. 10:59

SenFlow: 하이브리드 문서 내 AI 생성 텍스트 탐지를 위한 문장 간 흐름 모델링

요약

하이브리드 문서 내 AI 생성 텍스트를 탐지하기 위한 새로운 모델 SenFlow와 벤치마크 MOSAIC를 제안합니다. 문장 간의 의존성을 고려한 그래프 기반 전파와 CRF 디코딩을 통해 문장 수준 탐지 성능을 극대화했습니다.

핵심 포인트

문장 간 의존성을 무시하는 기존 탐지 방식의 한계 극복
DeepSeek-V3.2 등을 활용한 고품질 하이브리드 벤치마크 MOSAIC 구축
SenFlow 모델을 통한 문장 그래프 기반의 구조적 예측 구현
교차 도메인 전이 성능에서 SOTA 달성 및 성능 향상 입증

인간과 LLM(Large Language Models)이 하나의 텍스트를 공동 집필하는 하이브리드 문서(hybrid documents)를 대상으로 하는 문장 수준 AI 생성 텍스트 탐지(S-AGTD)는 두 가지 격차에 직면해 있습니다. 기존 방법들은 각 문장을 고립된 상태로 분류하여 문장 간 의존성(inter-sentence dependencies)을 무시하며, 기존 벤치마크들은 최신 세대의 생성기(generators)를 누락하고 있습니다. 우리는 이전 벤치마크에는 없었던 당혹도 일관성 필터(perplexity-consistency filter)를 포함한 엄격한 품질 관리를 거쳐, DeepSeek-V3.2와 Kimi K2로 생성된 PubMed 및 XSum 기반의 16,000개 하이브리드 문서 벤치마크인 MOSAIC를 구축합니다. 우리는 S-AGTD를 문서 문장 시퀀스에 대한 구조적 예측(structured prediction)으로 재정의하고, 이를 SenFlow로 구현하였습니다. SenFlow는 문장 그래프(sentence graph)에 대한 단일 문서 수준 패스(single document-level pass) 내에서 그래프 기반의 문장 간 전파(inter-sentence propagation)와 선형 체인 CRF(linear-chain CRF) 디코딩을 통합합니다. SenFlow는 MOSAIC에서 최첨단(state-of-the-art) 성능을 달성하였으며, 난이도가 점진적으로 높아지는 세 가지 프로토콜 중 가장 어려운 교차 도메인 전이(cross-domain transfer)에서 평균 Macro-F1 기준 +4.15 pp의 마진을 기록했습니다. 나아가 우리는 당혹도 필터가 명백한 단서들을 균등하게 만든 후에도, AI 삽입 문구들이 생성기에 의존적인 문장 길이 격차(sentence-length gap)를 유지하며 문장 수준 탐지기들이 여전히 이를 활용한다는 점을 발견했습니다. 코드 및 데이터: https://github.com/luojingkun22/SenFlow

AI 자동 생성 콘텐츠

원문 바로가기

SenFlow: 하이브리드 문서 내 AI 생성 텍스트 탐지를 위한 문장 간 흐름 모델링

요약

핵심 포인트

댓글