본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 18:13

TextSeal: 출처 증명 및 지식 정제 보호를 위한 국소화된 LLM 워터마크

요약

TextSeal은 대규모 언어 모델(LLM)의 출처 증명 및 지식 정제 보호를 위한 최첨단 워터마크입니다. Gumbel-max 샘플링 기반으로 이중 키 생성, 엔트로피 가중치 점수화, 다중 영역 국소화를 도입하여 출력 다양성을 복원합니다. TextSeal은 추론 오버헤드 없이 기존 방식보다 강력한 탐지 강도와 희석 저항성을 제공합니다.

핵심 포인트

  • TextSeal은 LLM 출처 증명 및 지식 보호를 위한 워터마크 기술이다.
  • Gumbel-max 샘플링을 기반으로 이중 키 생성, 엔트로피 가중치 점수화 등을 활용한다.
  • 추측 디코딩 등 서비스 최적화를 지원하며 추가적인 추론 오버헤드가 없다.
  • 기존 방식(예: SynthID-text)보다 강력한 탐지 강도와 희석 저항성을 갖는다.

우리는 대규모 언어 모델(LLM)을 위한 최첨단 워터마크인 TextSeal을 소개합니다. Gumbel-max 샘플링에 기반하여, TextSeal은 출력 다양성을 복원하기 위해 이중 키 생성(dual-key generation), 엔트로피 가중치 점수화(entropy-weighted scoring), 그리고 향상된 탐지를 위한 다중 영역 국소화(multi-region localization)를 도입합니다. 이는 추측 디코딩(speculative decoding) 및 다중 토큰 예측과 같은 서비스 제공 최적화를 지원하며, 어떠한 추론 오버헤드도 추가하지 않습니다. TextSeal은 탐지 강도 면에서 SynthID-text와 같은 기존 방식들을 엄격하게 능가하며 희석에 강합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0