본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 24. 11:10

순환적 디노이징(Cyclic Denoising)을 통한 확산 모델(Diffusion Models) 내 초안정 메모리(Ultrastable

요약

순환적 디노이징(Cyclic Denoising) 기법을 통해 확산 모델이 학습 데이터를 기억하는 방식을 탐구합니다. 노이즈 진폭을 조절하여 모델 내의 초안정 메모리(Ultrastable Memory)를 추출함으로써 프라이버시 및 저작권 문제를 진단할 수 있습니다.

핵심 포인트

  • 순환적 디노이징을 통한 확산 모델의 학습 데이터 추출 공격 가능성 제시
  • 사전 지식 없이 샘플러 제어만으로 메모리된 이미지 복원 가능
  • 초안정 끌개(Ultrastable Attractors)를 통한 데이터 메모리 감사 도구 활용
  • 프라이버시 보호 및 모델 핑거프린팅을 위한 물리 기반 탐침 역할

우리는 이미지 확산 모델(image diffusion models)에 대한 추출 공격(extraction attack)으로서, 제어된 노이즈 진폭(noise amplitudes) 하에서 순방향 및 역방향 확산(forward and reverse diffusion)을 반복하는 순환적 디노이징(cyclic denoising)을 소개합니다. 무질서한 고체(disordered solids) 내의 무작위 조직화(random organization)에서 영감을 얻은 순환적 디노이징은 표준 샘플링(standard sampling)으로는 거의 접근할 수 없는 학습된 분포(learned distribution)의 영역을 드러냅니다. 이러한 역학(dynamics)은 샘플을 광범위한 안정성 스펙트럼(stability spectrum)을 가진 끌개(attractors)로 유도합니다. 가장 깊은 끌개들은 초안정(ultrastable)합니다. 이들은 거의 완전한 손상(corruption) 이후에도 재생되며 수천 번의 노이징-디노이징(noising-denoising) 사이클을 통해 지속됩니다. 이러한 끌개 중 다수는 스톡 사진(stock photographs), 브랜드 워터마크(brand watermarks), 웹 크롤링 아티팩트(web-crawl artifacts)를 포함하여 메모리된 학습 이미지(memorized training images)와 일치합니다. 이 공격은 그래디언트(gradients), 가중치 검사(weight inspection), 프롬프트(prompts), 캡션(captions), 또는 학습 데이터에 대한 사전 지식 없이 오직 샘플러 수준의 제어(sampler-level control)만을 필요로 합니다. 대규모 프롬프트 기반 생성과 사후 유사성 또는 멤버십 추론 필터링(membership-inference filtering)에 의존하는 생성 후 필터링(generate-and-filter) 공격과 달리, 우리의 주요 프로토콜은 완전히 무조건적(unconditioned)입니다. 우리는 Stable Diffusion v1.4와 픽셀 공간(pixel-space) DDPM에서 이 현상을 입증하며, 잠재 공간(latent-space) 및 픽셀 공간 확산 모델 전반에 걸쳐 일관된 동작을 보여줍니다. 노이즈 진폭에 따라 우리는 항복 유사 전이(yielding-like transition)를 관찰합니다. 낮은 진폭의 사이클링은 사소한 흡수 고정점(absorbing fixed points) 또는 한계 주기(limit cycles)를 생성하는 반면, 더 큰 진폭은 재배열(rearrangements), 분지 호핑(basin hopping), 그리고 구조화된 메모리된 끌개 분지(memorized attractor basins) 내에서의 장기적인 트래핑(trapping)을 유도합니다. 우리는 또한 계층적 부분 흡수(hierarchical partial absorption), 프롬프트 안정화 분지(prompt-stabilized basins), 그리고 회복된 끌개 집합의 교차 초기 조건 보편성(cross-initial-condition universality)을 관찰합니다. 따라서 우리의 결과는 순환적 디노이징이 생성적 지형(generative landscapes)에 대한 물리 기반 탐침(physics-inspired probe)인 동시에 메모리 감사(memorization auditing)를 위한 실용적인 도구임을 보여주며, 이는 프라이버시, 저작권 준수 및 모델 핑거프린팅(model fingerprinting)에 시사점을 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0