'당신의 AI 텍스트는 나의 것이 아니다': 현실적인 가정을 바탕으로 한 AI 생성 텍스트 탐지의 재정의 및 평가
요약
본 연구는 AI 생성 텍스트 탐지 분야의 모호한 유해성 정의를 재정의하고, 인간과 AI의 공동 구성 과정을 담은 새로운 벤치마크 AITDNA를 제안합니다. 기존 탐지기들이 실제 세계의 복잡한 생성 맥락을 충분히 반영하지 못함을 증명하며 코드와 데이터를 공개합니다.
핵심 포인트
- AI 생성 텍스트 탐지의 유해성 개념 체계적 재정의
- 인간-기계 공동 구성 텍스트 벤치마크 AITDNA 구축
- 기존 탐지기들의 광범위한 탐지 성능 한계 지적
- 상세 생성 정보(genesis information) 기반의 평가 방식 도입
AI 생성 텍스트가 광범위한 사회적 위험을 초래한다는 점에는 일반적으로 동의가 이루어지고 있지만, AI 생성 텍스트 탐지 (AI-generated text detection) 문헌에서는 무엇이 유해한 사용을 구성하는지에 대한 공통된 이해가 부족합니다. 오히려 기존의 데이터셋과 접근 방식들은 종종 자신들만의 기준을 정의하고 스스로의 가정을 세우며, 이는 때때로 암묵적으로 이루어지고 실제 세계의 필요 및 응용 분야와는 느슨하게만 연결되어 있는 경우가 많습니다. 이러한 격차를 해소하기 위해, 본 연구에서는 AI 생성 텍스트의 다양한 개념과 그 특성을 체계적으로 정의합니다. 이를 연구하기 위해, 우리는 전체 편집 및 AI 상호작용 이력과 같은 상세한 생성 정보 (genesis information)가 주석 처리된 인간-기계 공동 구성 텍스트의 새로운 벤치마크인 AITDNA를 수집합니다. 우리는 다양한 기계 생성 텍스트 탐지기 (machine-generated text detectors)를 벤치마킹하였으며, 이들이 특정 개념에 대해서는 성능이 좋을 수 있으나 광범위한 탐지기로서의 성능은 그렇지 않다는 것을 발견했습니다. 우리는 코드와 데이터를 공개적으로 배포합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기