
판사, AI 학습을 위해 성인 영화를 토렌트로 다운로드한 Meta에 대해 성인물 제작사의 소송 허가 판결
요약
Meta가 Llama 모델 학습을 위해 성인 영화를 토렌트로 불법 다운로드했다는 혐의로 저작권 소송을 받게 되었습니다. 법원은 성인물 제작사의 소송 제기를 허가했으며, 이는 AI 기업들의 데이터 수집 관행에 대한 법적 책임을 묻는 중요한 사례가 될 전망입니다.
핵심 포인트
- Meta가 AI 학습용 데이터 확보를 위해 토렌트를 사용했다는 혐의
- 법원은 Meta의 '일탈한 직원' 변명을 기각하고 소송 진행 허가
- AI 기업의 저작권 있는 콘텐츠 무단 수집 관행(Piracy-to-Parameters) 지적
- 프런티어 AI 연구소 전반에 걸친 데이터 수집의 법적 리스크 부각
원문은 twarx.com에서 처음 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽을 수 있습니다.
최종 업데이트: 2026년 6월 21일
판사의 판결에 따르면, 한 성인물 제작사가 AI 학습을 위해 자사의 성인 영화를 토렌트(torrenting)로 다운로드한 Meta를 상대로 소송을 제기할 수 있습니다. 그리고 Meta는 단순히 성인물을 다운로드한 것이 아니라, AI에 공급하기 위해 기업 차원의 토렌트 운영을 수행했다는 혐의를 받고 있습니다. 2026년 6월 11일, 연방 판사는 '일탈한 직원들'이라는 변명이 기각하기에는 너무 터무니없다고 판결하며, 소송이 증거 개시(discovery) 단계로 진행될 수 있도록 허용했습니다. 이는 Strike 3 Holdings vs Meta 저작권 사건으로, Blacked와 같은 사이트의 성인 콘텐츠 제작자들은 Meta가 Llama 모델을 학습시키기 위해 BitTorrent를 사용하여 2,300편 이상의 영화를 불법 복제했다고 주장하고 있습니다.
이 사건이 지금 중요한 이유는 동일한 데이터 수집 문제가 모든 프런티어 연구소(frontier lab)에 걸쳐 있기 때문입니다. 이 글을 읽으면 이번 판결과 법적으로 무엇이 걸려 있는지, 그리고 이 판결이 세상 밖으로 끌어낸 체계적인 관행이 무엇인지 이해하게 될 것입니다.
Meta는 AI 학습을 위해 2,300편 이상의 성인 영화를 토렌트로 다운로드했다는 혐의로 저작권 소송에 직면해 있습니다. 출처: Mashable / Marcin Golba/NurPhoto via Getty Images
조어된 프레임워크(Coined Framework)
해적질-파라미터 파이프라인 (The Piracy-to-Parameters Pipeline) — AI 기업들이 저작권이 있는 콘텐츠를 대규모로 토렌트링하여, 창작자의 동의나 보상 없이 불법적으로 획득한 창작물을 상업적 모델 가중치(model weights)로 전환하는 미공개 관행
이는 학습 데이터가 공개적으로 어떻게 설명되는지('공개적으로 이용 가능한 데이터 (publicly available data)')와 실제로 어떻게 획득되는지(등록된 저작물의 피어 투 피어 (P2P) 해적판 복제) 사이의 간극을 지적합니다. Strike 3 사건은 해당 파이프라인이 기업의 법적 책임 (corporate liability)을 수반하는지에 대한 지금까지의 가장 명확한 시험대입니다.
발표 내용: Meta에 대한 연방법원 판결 설명
2026년 6월 11일, 미국 연방법원 Eumi K. Lee 판사는 자사의 AI 학습을 위해 성인 영화를 토렌트로 다운로드했다고 주장하는 소송에 대해 Meta의 기각 신청을 거부하는 명령을 내렸습니다. 이 사건은 이제 진행될 수 있습니다.
정확한 판결: 연방법관의 결정 사항 및 시점
Mashable에 따르면, Lee 판사는 원고들이 '[Meta]가 자사 영화의 토렌트링을 기반으로 직접적, 대위적, 그리고 기여적 저작권 침해에 대한 책임이 있다고 그럴듯하게 주장했다'고 판결했습니다. 이는 유죄 판결이 아닙니다. 해당 주장이 기각 신청을 견뎌내고 증거 개시 (discovery) 단계로 넘어갈 만큼 충분히 타당하다는 판결입니다. 제가 설명하겠지만, 바로 이 증거 개시 단계에서 실질적인 위험이 드러나게 됩니다.
공식 사건 세부 정보: 당사자, 법원, 사건 번호 및 날짜
원고는 Strike 3 Holdings와 Counterlife Media(Strike 3가 과반 지분을 보유)입니다. 404 Media에 따르면, Strike 3는 Blacked를 포함한 유명 성인 사이트들을 소유하고 있습니다. 소송은 2025년 7월에 처음 제기되었으며, Meta가 2018년에서 2025년 사이에 2,300편 이상의 저작권이 있는 포르노 영화를 침해했다고 주장합니다. 해당 기업들은 최대 3억 5,900만 달러의 손해 배상을 요구하고 있습니다.
Meta의 기각 신청과 판사가 이를 거부한 이유
Meta는 2025년 10월에 기각 신청 (motion to dismiss)을 제출하며, 해당 청구들이 '터무니없고 근거가 없다'고 주장하며 다운로드는 '개인적 용도'였다고 항변했습니다. Lee 판사는 이를 받아들이지 않았습니다. 그녀는 단 하루 만에 만화부터 성인물에 이르기까지 유사한 이름의 파일들을 토렌트(torrenting)로 다운로드한 IP 주소 패턴에 대해, '이러한 상관관계가 단순한 우연이며 개별 인간의 선택에 의한 결과라고 주장하는 것은 신뢰하기 어렵다'고 기술했습니다. 이는 판사가 절제된 사법적 언어로 Meta의 방어 논리가 말이 되지 않는다고 말한 것입니다.
2,300개 이상
토렌트로 다운로드된 것으로 추정되는 저작권 영화 (2018–2025)
[Mashable, 2026](https://mashable.com/tech/porn-company-can-sue-meta-torrenting-copyright)
...
기각 신청 거부는 판결이 아닙니다. 그것은 자물쇠를 돌리는 핵심적인 열쇠입니다. 그것이 여는 것은 증거 개시 (discovery)이며, 증거 개시는 AI 산업 전체의 학습 데이터 (training-data) 비밀이 숨겨져 있는 곳입니다.
요약: 이 소송은 무엇인가
법률 용어를 걷어내고 상황을 살펴보면 매우 명확합니다. 성인 영화를 제작하는 회사가 세계에서 가장 가치 있는 소셜 미디어 기업이 자사의 영화를 훔쳤다고 주장하는 것입니다. 스트리밍 방식이 아니라, 일반인들이 지난 20년 동안 소송을 당해온 것과 동일한 파일 공유 소프트웨어를 사용하여 대량으로 _다운로드_했다는 점이 핵심입니다.
이 사건을 단순한 해적 행위 (piracy) 이야기가 아닌 AI 이야기로 만드는 반전은 그 목적에 대한 주장입니다. Strike 3는 Meta 직원들이 이 영화들을 시청했다고 주장하지 않습니다. 대신 Meta가 이미지, 비디오, 콘텐츠가 어떻게 작동하는지 머신러닝 (machine-learning) 모델에게 가르치기 위한 원재료, 즉 학습 데이터 (training data)로서 이를 확보했다고 주장합니다. 이 소송은 토렌트 이용을 모델 구축을 위한 공급망 (supply chain)으로 규정하고 있습니다. 이는 이전에 명확하게 논의된 그 어떤 것과도 근본적으로 다른 법적 이론입니다.
비전문가를 위해 설명하자면, 밤중에 폐차장에서 철강을 훔쳐 자동차 공장을 운영했다는 혐의를 받는 자동차 공장을 상상해 보십시오. 공장 측은 '몇몇 직원이 개인적인 프로젝트를 위해 금속을 가져갔을 뿐'이라고 주장합니다. 하지만 판사는 그 양과 패턴을 볼 때 그러한 설명은 믿기 불가능하다고 말합니다. 이번 사건이 바로 그러합니다. 다만 철강 대신 영화가, 자동차 대신 AI 모델 (AI models)이 있을 뿐입니다.
이번 판결에서 가장 중요한 문구는 '저작권 (copyright)'이 아니라 '비인간적 패턴 (non-human patterns)'입니다. Strike 3는 Meta의 IP 주소들이 '인간이 소비할 수 있는 범위를 넘어선' 양을 다운로드했다고 주장합니다. 이 단 하나의 포렌식 (forensic) 세부 사항이 '개인적 사용'이라는 방어 논리를 무너뜨립니다. 규모가 의도를 드러내는 것입니다.
Strike 3 Holdings는 누구인가? 소송을 제기한 원고
여기서 원고를 이해하는 것이 중요합니다. Strike 3는 결코 순진한 방관자가 아니기 때문입니다. 이들은 미국 연방법원에서 가장 왕성하게 활동하는 저작권 집행자 중 하나이며, 이러한 이력은 이 싸움이 어떻게 전개될지에 대한 모든 것을 결정짓습니다.
Strike 3의 포트폴리오: Blacked, Vixen, Tushy
Strike 3 Holdings는 프리미엄 성인 콘텐츠 제작사로, 404 Media가 보도한 Blacked를 포함한 브랜드 군을 통해 상당한 트래픽을 창출합니다. Counterlife Media와 함께 이들은 이번 사건의 중심이 된 영화들에 대한 등록 저작권을 보유하고 있습니다. 해당 저작권 등록은 원고 적격 (standing)을 위한 핵심적인 법적 요건이며, Strike 3는 이를 확실히 확보하고 있습니다.
저작권 집행자로서의 기록된 역사
Strike 3는 BitTorrent를 통해 자사의 콘텐츠를 불법 복제한 개인 다운로더들을 상대로 수천 건의 소송을 제기하는 것으로 널리 알려져 있습니다. 비평가들은 이러한 전략을 '저작권 트롤링 (copyright trolling)'이라 부르며, Electronic Frontier Foundation은 오랫동안 이 관행을 면밀히 조사해 왔습니다. 이들의 집행 방식은 단순했습니다. 침해를 일으킨 IP 주소를 식별하고, 싸우기보다는 돈을 지불하는 편을 택할 개인 소비자들로부터 합의금을 받아내는 것이었습니다. 그리고 이 방식은 반복적으로 성공했습니다.
'저작권 트롤'이라는 프레임이 중요한 이유
이 이야기가 입소문을 타게 만든 아이러니는 바로 이것입니다. 토렌트(torrenting)를 이용한 일반적인 해적 행위자들을 고소하여 수익을 창출해 온 회사가, 이제는 동일한 법적 메커니즘을 사용하여 세계에서 가장 가치 있는 기술 기업을 상대로 — 동일한 혐의에 대해 — 소송을 제기하고 있다는 점입니다. Strike 3의 집행 이력에 대해 어떤 의견을 가지고 있든, 등록된 저작권(copyrights)은 그들에게 실질적인 당사자 적격(standing)을 부여합니다. 그리고 Meta의 압도적으로 거대한 자원은 이 싸움이 변호사를 선임할 여력이 없는 겁에 질린 개인과의 조용한 합의로 사라지는 대신, 실제로 본격적인 소송(litigated) 단계로 이어질 것임을 의미합니다.
'저작권 트롤 (copyright troll)'은 창작 산업 전체가 필요로 했던 테스트 케이스가 되었습니다. 저작권법에서 동정심은 무관하며, 중요한 것은 등록(registration)입니다. 그리고 Strike 3는 그 등록권을 가지고 있습니다.
혐의를 받고 있는 '해적 행위-파라미터 파이프라인 (Piracy-to-Parameters Pipeline)': 대규모 피어 투 피어 (peer-to-peer) 다운로드가 상업용 AI 모델의 학습 데이터가 되는 과정.
작동 방식: 혐의와 메커니즘
이 사건의 기술적 핵심은 비트토렌트 (BitTorrent)입니다. 이것이 어떻게 작동하는지 이해하면 왜 '독단적인 직원 (rogue employee)'이라는 방어 논리가 정밀 조사 과정에서 무너졌는지 정확히 설명할 수 있습니다.
AI 학습 맥락에서 토렌트(torrenting)가 의미하는 것
비트토렌트 (BitTorrent)는 대용량 파일을 조각으로 나누어 여러 소스로부터 동시에 다운로드하는 피어 투 피어 (peer-to-peer) 프로토콜입니다. 이는 최소한의 인프라 비용으로 대규모 미디어를 이동시키는 데 매우 효율적입니다. 바로 이 점이 거대한 비디오 및 텍스트 데이터셋을 구축하는 데 매력적인 요소가 되는 동시에, 파일에 등록된 저작권이 포함되어 있을 때 법적으로 위험한 요소가 되는 지점입니다. 2,300편의 영화를 실수로 토렌트할 수는 없습니다. 소프트웨어가 그런 방식으로 작동하지 않기 때문입니다.
해적 행위-파라미터 파이프라인 (Piracy-to-Parameters Pipeline): 토렌트로 수집된 콘텐츠가 어떻게 모델 가중치 (model weights)가 되는지에 대한 혐의
1
**소스 식별 (Source Identification)**
대상 콘텐츠는 영화, 도서 (LibGen/Books3), 이미지 등 토렌트 인덱스 전반에 걸쳐 위치합니다. 목표는 최소한의 비용으로 최대한의 볼륨을 확보하는 것입니다.
↓
2
...
Strike 3의 고소장에 따르면, 파일들은 '비인간적 패턴 (non-human patterns)'으로 다운로드됩니다. 즉, 기업 IP 대역에서 하루 동안 유사한 이름을 가진 수많은 파일이 다운로드되는 방식입니다.
↓
3
...
가공되지 않은 미디어 (Raw media)는 정제, 중복 제거 과정을 거쳐 프레임, 캡션, 임베딩 (embeddings)과 같이 학습 준비가 된 텐서 (tensors)로 변환됩니다.
↓
4
...
처리된 코퍼스 (corpus)는 Llama와 같은 모델의 가중치 (weights)를 형성합니다. 저작권이 있는 저작물은 이제 상업적 파라미터 (parameters) 내에 통계적으로 임베딩되어 있습니다.
↓
5
...
모델이 오픈 소스 또는 API 형태로 출시되면, 창작자들이 라이선스를 허가한 적 없는 입력값으로부터 수익과 경쟁 우위를 창출합니다.
이 시퀀스가 중요한 이유는, 모델이 무엇을 출력하는지와 무관하게 2단계(획득)에서 책임이 발생할 수 있기 때문입니다. 이는 출력물 중심의 사건들과 구별되는 결정적인 차이점입니다.
LibGen 및 Books3와의 연관성
Strike 3는 2025년 1월 저작자들의 Meta 대상 소송에 대한 언론 보도를 통해 Meta의 BitTorrent 활동을 인지하게 되었다고 밝혔습니다. 해당 이전 사건의 증거 개시 (Discovery) 과정을 통해 Meta가 AI 학습을 위해 도서를 해적판으로 사용했다는 사실이 드러났습니다. The Atlantic을 포함한 매체들의 보도는 Meta의 데이터 소싱이 Llama 시리즈 학습에 사용된 Books3 및 LibGen과 같은 대규모 스크레이핑 저장소와 연관되어 있음을 밝혀냈습니다. 한 소송의 증거 개시는 다른 소송의 로드맵이 됩니다. 이것이 사건이 확산되는 방식입니다.
'독단적인 직원 (rogue employee)' 방어 논리 — 그리고 그것이 실패한 이유
Meta는 해당 토렌트 이용이 회사가 승인한 기업 활동이 아니라 개별 직원들의 개인적 사용을 반영한 것이라고 주장했습니다. Lee 판사는 규모와 상관관계 때문에 이 주장을 기각했습니다. Meta 본사로 추적되는 동일한 IP들이 만화부터 성인물에 이르기까지 이름이 일치하는 유사한 파일들을 단 하루 만에 토렌트로 다운로드했기 때문입니다. Mashable의 보도에 따르면, 소송에는 '인간이 소비할 수 있는 수준을 넘어선 대규모 침해'를 포함하는 패턴이 기술되어 있습니다. 체계적이고 대량이며 IP로 귀속되는 기업의 다운로드를 단순한 우연으로 설명할 수는 없습니다. 판사 또한 그렇게 보지 않았습니다.
정립된 프레임워크
작동 중인 '해적 행위-파라미터 파이프라인 (Piracy-to-Parameters Pipeline)'
피고 측 방어 논리의 취약점은 이 프레임워크의 핵심을 드러냅니다. 산업적 규모에서는 체계적인 데이터 수집을 개인의 행동으로 위장할 수 없습니다. 파이프라인을 폭로하는 '비인간적 패턴 (non-human patterns)'은 동시에 기업의 법적 책임을 가능하게 만드는 증거가 됩니다.
해적 행위-파라미터 파이프라인 (Piracy-to-Parameters Pipeline): AI 기업들이 학습 데이터를 획득하는 것으로 의심되는 방식
Strike 3 사건은 2024~2026년에 걸쳐 펼쳐지는 광범위한 소송 지도의 한 지점입니다. 더 넓은 생태계를 이해하면 왜 이번 판결이 성인 콘텐츠를 훨씬 넘어 큰 반향을 일으키는지 설명할 수 있습니다.
토렌트 이용이 효율적이지만 법적으로 위험한 이유
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기