본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 08. 16:44

Algospeak, Hiding in the Open: The Trade-off Between Legible Meaning and

요약

본 연구는 LLM 시대에 나타나는 '알고스피크(Algospeak)'라는 언어적 회피 전략의 근본적인 역동성을 공동 행동 모델로 공식화합니다. 핵심적으로, 알고스피크가 증가할수록 콘텐츠의 감지 가능성과 이해 가능성은 동시에 감소하는 트레이드오프 관계를 보여줍니다. 연구진은 '다수 이해 가능한 변조(MUM)' 개념을 도입하여, 회피적 변형이 감지를 피하더라도 대중에게는 의미 전달에 어려움을 겪게 되는 임계점을 정의합니다. 이를 검증하기 위해 COVID-19 가짜 뉴스 데이터셋을 구축하고, 다양한 언어 모델을 사용하여 해석 및 분류 테스트를 수행함으로써 이 역동성을 경험적으로 입증하는 재현 가능한 프레임워크를 제시했습니다.

핵심 포인트

  • 알고스피크는 회피자(evaders)와 감지자(detectors) 간의 공진화적 상호작용이다.
  • Algospeak가 증가할수록 콘텐츠의 '감지 가능성'과 '이해 가능성'은 반비례 관계를 보인다 (Trade-off).
  • 새로운 개념인 '다수 이해 가능한 변조(MUM)'는 회피와 대중적 이해 사이의 임계점을 정의한다.
  • 연구진은 COVID-19 가짜 뉴스 데이터셋을 구축하고, 의미 복원 및 분류 테스트를 통해 이 역동성을 경험적으로 검증하는 프레임워크를 제공했다.

대규모 언어 모델 (LLMs) 이 콘텐츠 생성과 검열을 점점 더 중재함에 따라, Algospeak(알고스피크) 라는 언어적 회피 전략은 회피자 (evaders) 와 감지자 (detectors) 사이의 공진화 (coevolution) 를 강화했다. 본 연구는 공동 행동 모델 (joint action model) 에 기반한 근본적인 역동성을 공식화한다: Algospeak 이 증가할수록 감지 가능성 (detectability) 과 이해 가능성 (understandability) 은 감소한다. 또한, 다수 이해 가능한 변조 (Majority Understandable Modulation, MUM) 개념을 도입하고 정의한다. 이는 추가 회피적 변형이 감지자 회피를 증가시키지만 대다수 수신자에게 이해성을 잃는 변조 수준이다. 이를 경험적으로 탐구하기 위해, 기존 분류법과 조정 가능한 변조 수준을 기반으로 의미 보존성 (meaning-preserving) Algospeak 스타일 변형을 생성할 수 있는 재현 가능한 프레임워크를 소개한다. COVID-19 가짜 뉴스 (disinformation) 를 첫 번째 예시 증명 설정으로 사용하여 700 개의 변조 항목으로 구성된 참조 데이터셋을 구축한다. 이는 5 가지 변조 수준과 7 가지 전략에 걸친 20 개의 기본 문장에서 추출된다. 우리는 두 가지 연결된 평가를 수행하며 7 개의 다른 언어 모델을 사용한다: 하나는 의미 복원 (meaning recovery) 을 통한 해석 테스트이고, 다른 하나는 분류를 통한 가짜 뉴스 감지이다. 변조 수준에 대한 곡선 적합 (curve fitting) 은 다수 이해 가능한 변조 (Majority Understandable Modulation) 임계값의 추정치를 제공하며 전략과 모델에 따른 민감도 분석을 가능하게 한다 (Figure 1 참조). 결과는 이해 가능성과 변조 사이의 특징적인 관계를 드러낸다. 이 연구는 Algospeak 의 역동성을 이해하는 기초를 마련하고, 설명된 프레임워크, 데이터셋 및 실험 설계를 제공한다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0