변화점 탐지를 통한 인간-LLM 공동 작성 텍스트 분할
요약
LLM 발전으로 인해 인간과 LLM이 공동 작성한 텍스트에서 각 부분을 정확히 분리하는 것이 중요해졌습니다. 본 논문은 이러한 문제를 해결하기 위해, 텍스트를 인간 작성 부분과 LLM 작성 부분으로 분할하는 알고리즘을 제안합니다. 이 접근 방식은 시간계열 분석의 변화점 탐지(change point detection) 개념을 차용하여, 공동 작성 텍스트 내에서 출처가 바뀌는 지점을 효과적으로 식별하고 성능을 입증했습니다.
핵심 포인트
- LLM 생성 콘텐츠 증가로 인해 인간-LLM 공동 작성 텍스트의 진위성 구분이 필수적임.
- 기존 탐지기는 전체 패스지에 대한 이진 분류만 제공하여, 공동 작성 텍스트 분석에 한계가 있음.
- 제안된 알고리즘은 텍스트를 인간 및 LLM 작성 부분으로 분할하는 것을 목표로 함.
- 이 문제는 시간계열 분석의 변화점 탐지(change point detection)와 개념적으로 유사하며, 이를 활용하여 가중치 및 일반화 알고리즘을 개발함.
- 제안된 방법론은 미니맥 최적성(minimax optimality)을 확립하고 기존 베이스라인 대비 우수한 성능을 보임.
대형 언어 모델 (LLMs) 의 급속한 발전은 텍스트의 진정성을 보장하고 사회적 신뢰를 유지하기 위해 인간이 작성한 텍스트와 LLM 이 생성한 텍스트를 구별하는 데 대한 긴급한 필요성을 창출했습니다. 기존 탐지기는 일반적으로 전체 패스지에 대한 이진 분류를 제공하지만, 이는 인간과 LLM 이 공동으로 작성한 텍스트의 경우 특정 부분을 인간 또는 LLM 이 작성했는지 위치를 파악해야 한다는 목표에 불충분합니다. 이러한 격차를 해소하기 위해 우리는 텍스트를 인간 작성 부분과 LLM 작성 부분으로 분할하는 알고리즘을 제안했습니다. 우리의 핵심 관찰은 이러한 분할 작업이 시간계열 분석에서의 고전적인 변화점 탐지 (change point detection) 와 개념적으로 유사하다는 것입니다. 이러한 비유를 활용하여, 우리는 변화점 탐지를 LLM 생성 텍스트 탐지에 적용하고, 이질적인 탐지 점수 변동성을 수용하기 위해 가중치 알고리즘과 일반화 알고리즘을 개발했으며, 우리의 절차의 미니맥 최적성 (minimax optimality) 을 확립했습니다. 경험적으로, 우리는 기존 베이스라인 대비 우리 접근법의 강력한 성능을 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기