본문으로 건너뛰기

© 2026 Molayo

Tom's HW헤드라인2026. 05. 08. 06:54

Nvidia 의 ISP 도난 방지 방어는 역효과를 낳았으며 판사는 NeMo 프레임워크 내 스크립트가 저작권 침해 속도를 높이는 데 다른 목적이

요약

Nvidia가 AI 모델 훈련에 사용한 대규모 데이터셋(Bibliotik eBook 토렌트 추적기, Books3, The Pile)의 저작권 침해 소송과 관련하여, 미국 연방 판사 존 티가르는 Nvidia의 방어 논리를 기각했습니다. 판사는 특정 스크립트들이 사용자들에게 저작권 규칙을 위반하는 과정을 자동화하고 가속화하는 데 다른 목적이 없다고 지적하며, AI 기업들의 데이터 수집 및 사용 방식에 대한 법적 책임을 강조했습니다. 이는 Meta나 Google 등 다른 빅테크 기업들도 직면한 유사한 논쟁의 연장선상에 있으며, AI 모델 훈련을 위한 대규모 스크래핑과 공정 이용(Fair Use) 범위에 대한 중요한 법적 전례를 남길 것으로 예상됩니다.

핵심 포인트

  • Nvidia는 NeMo Megatron 프레임워크 사용의 '침해하지 않는 용도'를 주장하며 저작권 침해 소송을 방어하려 했으나, 판사로부터 기각되었습니다.
  • 판사는 Nvidia가 제공한 스크립트들이 데이터셋 사전 처리 및 다운로드를 자동화하여 저작권 위반 속도를 높이는 데만 사용되었다고 지적했습니다.
  • 이 사건은 AI 모델 훈련을 위한 대규모 데이터 수집(스크래핑)과 공정 이용(Fair Use)의 경계에 대한 중요한 법적 논쟁을 제기합니다.
  • Nvidia 외에도 Meta, Google 등 빅테크 기업들이 유사한 저작권 소송에 직면하며 AI 산업 전반의 법적 리스크가 부각되고 있습니다.

미국 연방 판사 존 티가르 (Jon Tigar) 는 Nvidia 가 제기한 저작권 침해 사건을 기각하는 요청을 거절했습니다. 그는 Nvidia 가 AI 기반 NeMo Megatron 프레임워크 사용자의 사용법을 책임지지 않는다고 주장했습니다. TorrentFreak 에 따르면, Nvidia 는 Bibliotik eBook 토렌트 추적기, Books3 데이터셋, 'The Pile' 데이터셋에 대한 언어 모델링 사용을 연결된 직접 저작권 침해 소송을 기각하는 법원에 요청하고 있습니다. Nvidia 는 Cox vs. Sony 판례를 인용했습니다. 미국 대법원은 서비스 제공자가 사용자의 도난 행위에 대해 책임지지 않는다고 판결했습니다.

Nvidia 는 NeMo Megatron 프레임워크가 상당한 "침해하지 않는 용도"를 가지고 있으며, 이를 도난 도구로 홍보하지 않았다고 말했습니다. 이는 Justice Clarence Thomas 의 결정에 해당합니다. "우리의 판례에 따르면, 회사는 일반 대중에게 서비스를 제공하여 일부 사용자가 저작권을 침해할 것으로 알면서도 저작권 침해자로 책임지지 않습니다." 그러나 불행히도 회사, 판사 티가르는 그의 주장과 반대했습니다. 그는 특정 스크립트가 저작권 규칙을 위반했다고 말했습니다.

그는 이러한 스크립트들이 사용자들이 자동으로 다운로드하고 The Pile 데이터셋을 사전 처리하기 쉽게 만들도록 설계되었다고 말했습니다. complainants 는 이 데이터셋이 저작권된 작업을 포함한다고 주장했습니다. "스크립트는 Sony Corp. 에서 문제인 디지털 비디오 기록기 시스템이나 Cox 에서 제공한 인터넷 서비스와 달리 침해 과정 속도를 높이는 데 다른 목적이 없다고 alleged" 판사 티가르는 썼습니다. Bibliotik 은 197,000 권 이상의 책을 포함한다고 주장되는 사적인 eBook 토렌트 추적기입니다. 그것은 Books3 데이터셋에 포함되었고, 이는 다시 800+ 기바이트의 The Pile 데이터셋에 포함되었습니다. The Pile 는 Nvidia 의 AI LLMs 훈련에 사용되어, 몇몇 저자가 저작권 침해 소송을 제기했습니다.

AI 회사가 모델을 훈련하기 위해 데이터를 스크래핑하는 것과 관련된 이전 저작권 침해 사례가 있었습니다. 이 Nvidia 사건의 경우 외에도 Meta 는 지난 년부터 유사한 소송을 직면해 왔습니다. 그것은 도난 자료를 사용하는 것이 콘텐츠를 씨딩하지 않는다면 합법적이라고 말하며 스스로를 방어했습니다. Google 은 AI 스크래핑이 공정 사용으로 태그되어야 한다고 주장하고 있습니다. 그들은 "호주에서 AI 모델을 훈련하기 위해 저작권된 콘텐츠의 적절한 및 공정한 사용을 가능하게 하는 저작권 시스템"을 원한다고 말했습니다. 그리고 "AI 시스템을 사용하여 데이터를 훈련하지 않는 것을 선호하는 엔티티를 위한 작동 가능한 옵트아웃을 지원하면서."

이 결정으로, Nvidia 의 저자들에 대한 클래스 액션 소송은 앞으로 진행될 것이며, 사건이 진행됨에 따라 우리는 더 많은 세부 사항을 듣게 될 것입니다. 다음 청문회가 언제일지는 아직 없습니다. 그러나 우리는 이것이 AI 거대 기업이 침해된 작가들과 싸우는 동안 여러 년의 전투가 될 것으로 예상합니다.

Follow* Tom's Hardware on Google News**, or** add us as a preferred source**, to get our latest news, analysis, & reviews in your feeds.*

Get Tom's Hardware's best news and in-depth reviews, straight to your inbox.

Jowi Morales 는 산업에서 여러 년의 경험을 가진 기술 애호가입니다. 그는 2021 년부터 몇몇 기술 출판물과 함께 작성해 왔으며, 기술 하드웨어와 소비자 전자제품에 관심이 있습니다.

Nvidia(엔비디아)가 그런 짓을 했다는 게 너무 어리석다; 구글이 (구글북스를 만들 때) 도서관에서 책을 빌려 스캔하는 방식을 취해야 했어야 한다. 아니면 각 책의 사본을 구매해도 된다. 197k x 약 $20/책은 $400만 미만이다, 엔비디아에게는 거스름돈에 불과하다.Reply

일반인은 저작권 데이터 (copyrighted data) 를 개인용으로 복제한다: 그것은 해킹 (Piracy)!Reply

반면 대기업은 수천 개를 상업용 목적으로 복제한다: 그것은 공정한 사용 (fair use) 이다.

그리고 우리는 더 이상 몬티 파이튼의 '이것은 긁어낸 것' (it's a scratch would) 의 대체 현실 세계에 살고 있다. -
Reply
Nvidia(엔비디아)는 Cox vs. Sony 판례를 인용했다. 미국 대법원은 서비스 제공자가 사용자가 수행할 수 있는 모든 해킹에 대해 책임을 지지 않는다고 판결했다.

엔비디아는 AI 변호사를 사용하거나 뭔가? 어떤 기괴한 방어가 아닌가! Cox vs Sony 는 사용자를 침해 당사자로 간주한다. 나는 이 상황을 Books3(북스 3) vs Authors(저자들)로 해석한다. 엔비디아는 이 해석에 따라 적어도 받은 도난 물건을 빼앗길 수 있고, 최악의 경우 각 침해 토큰 (infringing token) 에 대해 책임을 져야 한다. 나는 엔비디아는 중간자라고 주장하고 있다고 생각하지만, 난Torrent(터넷) 제공자가 이미 그 역할을 수행한다고 생각한다. 나는 엔비디아 -- 그리고 AI 산업 전체 -- 이 저작권 보유자로부터 이 소송을 통해 거대한 현실 교훈 (reality check) 을 받기를 바란다.

이건 이제 웃기다. 개인 시민이 불법적으로 "스크래핑" (scraping), 즉 인터넷 콘텐츠로 돈을 벌고 싶으면, 그들은 감옥에 던져진다. 그들이 저작권 보호된 콘텐츠를 다운로드하는 것이 합법적이라고 믿는다는 사실에 기반하여 법의 예외를 요청할 수 없다. 왜냐하면 그들이 씨드를播种하지 않았기 때문이다.Reply

Meta(메타) 가 이것을 할 때, 그것은 괜찮다. 나는 기억한다. 그들의 사례는 (throw out as i recall) 거부되었다. 즉, 일부 주장이 유지되었다. 나는 책임 있는 당국은 이를 호소하고 있다고 생각한다.

엔비디아는 사용자의 네트워크에서의 행동에 대해 책임을 지지 않는다는 사실에 기반하여 저작권 법의 예외를 원한다?

그건 괜찮다. 엔비디아는 ISP(인터넷 서비스 제공자) 네트워크에서 자신의 직원을 그렇게 지시할 때, 우리는 그냥 다른 쪽을 바라볼 것이다. 모든 것이 좋았다. ISP 가 잘못이다.

물론 구글은 opt-out 시스템 (선택 거부 시스템) 을 원한다. 당신은 기본적으로 선택되어 있다. 세계에서 가장 크고 위험한 데이터 흡입 (data hoovering) 회사가 더 많은 데이터를 AI 에게 공급하기 위해 원한다.

이 회사들은 이익을 노린다. 돈. 그리고 그들을 달성하기 위해 그들은 우리 대부분이 할 수 없는 불법적인 일을 할 수 있도록 마음을 꺾는다.
-ReplyShiznizzle(시즈니즐)가 말했다:이건 이제 웃기다. 개인 시민이 불법적으로 "스크래핑" (scraping), 즉 인터넷 콘텐츠로 돈을 벌고 싶으면, 그들은 감옥에 던져진다. 그들이 저작권 보호된 콘텐츠를 다운로드하는 것이 합법적이라고 믿는다는 사실에 기반하여 법의 예외를 요청할 수 없다. 왜냐하면 그들이 씨드를播种하지 않았기 때문이다.

When Meta dos this, its ok though. Their case was throw out as i recall. Meaning that some of their claims were upheld. I think the authorities in charge are appealing this.

Nvida wants exemptions to the copyright law based on the fact that they are not responsible for their users' behavior on their networks?

Thats ok then. We will just look the other way when Nvidia then directs their own employees to do this on the ISP network then. All good now. ISP at fault.

Of course google wants the opt-out system as you are opted in by default. The largest and most dangerous data hoovering company in the world wants yet more data to feed their AI with.

These companies are after profits mind you. Money. And to get there they are twisting minds so they can do illegal things the rest of us cant -

물론 구글은 옵아웃 시스템을 원합니다. 여러분은 기본적으로 옵인 상태이기 때문입니다. 세계 최대이자 가장 위험한 데이터 흡입 기업은 AI 에게 더 많은 데이터를 공급하기 위해 여전히 더 많은 데이터를 원합니다.

이러한 기업들은 이윤을 쫓습니다. 돈입니다. 그리고 그들에게 도달하기 위해 그들은 우리 대부분이 할 수 없는 불법적인 일을 할 수 있도록 마음을 꺾습니다.

여러분은 정말로 부자와 권력자에게는 일반 시민과 다른 법이 있다는 것을 암시하고 계신가요??

왜냐하면 만약 여러분이 그렇게 생각하신다면, 여러분은 100% 정확합니다!! -
한편으로는 이러한 AI 기업들이 저작권된 작품을 사용할 때 어떤 형태의 라이선스를 지불해야 한다고 생각합니다. 다른 한편으로는 저작권은 최대 20 년 동안 지속되어야 하며, 그 후 해당 작품들은 공공 도메인으로 떨어져야 한다고 생각합니다.

상표는 브랜드가 적극적으로 사용하는 동안 영구적으로 유지되어야 하지만, 저작권된 자료가 공공 도메인으로 떨어지는 것을 막아서는 사용해서는 안 됩니다. (특히 디즈니를 고려할 때.)

AI 자동 생성 콘텐츠

본 콘텐츠는 Tom's Hardware의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0