
OpenAI와 Google이 거대한 법적 문제에 직면하려 하고 있지만 아무도 이를 이야기하지 않고 있습니다.
요약
연구자들은 'Alignment Whack-a-Mole' 논문을 통해 OpenAI, Google, DeepSeek 모델들이 저작권 도서를 그대로 재현할 수 있는 취약점을 폭로했습니다. 미세 조정(Fine-tuning)만으로도 모델 내부에 숨겨진 저작권 텍스트 암기 기능이 활성화될 수 있음을 증명했습니다.
핵심 포인트
- 안전 필터가 저작권 텍섭의 축자적 회상을 완벽히 차단하지 못함
- 미세 조정은 모델 내 숨겨진 암기 데이터를 재활성화하는 마스터 키 역할 수행
- 특정 작가 학습만으로도 무관한 작가들의 저작권 텍스트 추출 가능
- 업계 전반의 모델들이 공통적인 저작권 침해 취약점을 공유함
OpenAI와 Google은 거대한 법적 문제에 직면하려 하고 있지만 아무도 이를 이야기하지 않고 있습니다.
모든 주요 AI 연구소(AI lab)들은 자신들의 모델이 저작권이 있는 도서의 정확한 복사본을 저장하지 않는다고 법원에 선서했습니다.
그들은 자신들의 안전 필터(safety filters)가 축자적 회상(verbatim regurgitation)을 차단한다고 주장합니다. 그들은 이를 저작권 침해에 대한 주요 법적 방어 수단으로 사용합니다.
연구자들은 이것이 완전히 환상임을 증명했습니다.
그들은 "Alignment Whack-a-Mole"라는 제목의 논문을 발표하여 AI의 공정 이용(fair use) 기반을 파괴할 수 있는 취약점을 폭로했습니다.
그들은 복잡한 탈옥(jailbreak)이나 악의적인 해킹을 사용했습니다. 그들은 단지 모델을 미세 조정(fine-tuning)했을 뿐입니다.
그들은 ChatGPT, Gemini, 그리고 DeepSeek를 단순하고 무해한 작업, 즉 줄거리 요약을 전체 텍스트로 확장하는 작업으로 학습시켰습니다.
안전 필터는 즉시 붕괴되었습니다.
모델들은 저작권이 있는 도서의 85%에서 90%를 토씨 하나 틀리지 않고 그대로 재현하기 시작했습니다. 단일 축자적 구간(verbatim spans)은 460단어를 초과했습니다.
그들은 프롬프트(prompt)에서 실제 도서 텍스트를 전혀 보지 않고도 이 작업을 수행했습니다. 오직 의미론적 설명(semantic descriptions)만 사용했습니다.
하지만 AI 경영진들을 공포에 떨게 할 세부 사항이 여기 있습니다.
추출하고자 하는 특정 도서로 AI를 미세 조정(fine-tune)할 필요조차 없습니다.
연구자들은 오직 무라카미 하루키의 작품들로만 모델을 미세 조정했습니다.
그 단 한 번의 행동으로 30명 이상의 완전히 무관한 작가들에 대한 축자적 회상(verbatim recall) 기능이 해제되었습니다.
미세 조정(Fine-tuning)은 모델에게 새로운 텍스트를 가르치는 것이 아닙니다. 그것은 마스터 키(skeleton key) 역할을 합니다. 그것은 사전 학습 가중치(pre-training weights) 깊숙이 숨겨진 잠재적인 축자적 암기(word-for-word memorization)를 재활성화합니다.
그리고 이것은 세 개의 서로 다른 회사의 세 가지 서로 다른 모델에서 발생했습니다. 그들은 모두 정확히 같은 위치에서 정확히 같은 책들을 암기했습니다.
이것은 업계 전반의 취약점입니다.
[IMG:https://pbs.twimg.com/media/HKTUd7LaoAEIa-9.jpg]
AI 자동 생성 콘텐츠
본 콘텐츠는 X @HowToAI_ (AI 활용법)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기