Algospeak, Hiding in the Open: The Trade-off Between Legible Meaning and

대규모 언어 모델 (LLMs) 이 콘텐츠 생성과 검열을 점점 더 중재함에 따라, Algospeak(알고스피크) 라는 언어적 회피 전략은 회피자 (evaders) 와 감지자 (detectors) 사이의 공진화 (coevolution) 를 강화했다. 본 연구는 공동 행동 모델 (joint action model) 에 기반한 근본적인 역동성을 공식화한다: Algospeak 이 증가할수록 감지 가능성 (detectability) 과 이해 가능성 (understandability) 은 감소한다. 또한, 다수 이해 가능한 변조 (Majority Understandable Modulation, MUM) 개념을 도입하고 정의한다. 이는 추가 회피적 변형이 감지자 회피를 증가시키지만 대다수 수신자에게 이해성을 잃는 변조 수준이다. 이를 경험적으로 탐구하기 위해, 기존 분류법과 조정 가능한 변조 수준을 기반으로 의미 보존성 (meaning-preserving) Algospeak 스타일 변형을 생성할 수 있는 재현 가능한 프레임워크를 소개한다. COVID-19 가짜 뉴스 (disinformation) 를 첫 번째 예시 증명 설정으로 사용하여 700 개의 변조 항목으로 구성된 참조 데이터셋을 구축한다. 이는 5 가지 변조 수준과 7 가지 전략에 걸친 20 개의 기본 문장에서 추출된다. 우리는 두 가지 연결된 평가를 수행하며 7 개의 다른 언어 모델을 사용한다: 하나는 의미 복원 (meaning recovery) 을 통한 해석 테스트이고, 다른 하나는 분류를 통한 가짜 뉴스 감지이다. 변조 수준에 대한 곡선 적합 (curve fitting) 은 다수 이해 가능한 변조 (Majority Understandable Modulation) 임계값의 추정치를 제공하며 전략과 모델에 따른 민감도 분석을 가능하게 한다 (Figure 1 참조). 결과는 이해 가능성과 변조 사이의 특징적인 관계를 드러낸다. 이 연구는 Algospeak 의 역동성을 이해하는 기초를 마련하고, 설명된 프레임워크, 데이터셋 및 실험 설계를 제공한다.

Insights

Algospeak, Hiding in the Open: The Trade-off Between Legible Meaning and

요약

핵심 포인트

댓글

DFINITY, 사용자의 Internet Identity를 통해 TAGGR에 게시물을 올리는 AI 에이전트 시연

AI를 활용하여 수십 개의 트레이딩 전략을 테스트, 구축 및 자동화해 본 경험

Claude Opus 5가 오늘 출시될 예정이라는 보고 — 유출된 "Honeycomb EAP" 모델이 가리키는 특징:

Forward-Deployed Engineer(FDE)란 무엇인가?

AI를 활용하여 수십 개의 트레이딩 전략을 테스트, 구축 및 자동화해 본 경험

Claude Opus 5가 오늘 출시될 예정이라는 보고 — 유출된 "Honeycomb EAP" 모델이 가리키는 특징:

Forward-Deployed Engineer(FDE)란 무엇인가?