arXiv논문2026. 06. 24. 11:10

순환적 디노이징(Cyclic Denoising)을 통한 확산 모델(Diffusion Models) 내 초안정 메모리(Ultrastable

요약

순환적 디노이징(Cyclic Denoising) 기법을 통해 확산 모델이 학습 데이터를 기억하는 방식을 탐구합니다. 노이즈 진폭을 조절하여 모델 내의 초안정 메모리(Ultrastable Memory)를 추출함으로써 프라이버시 및 저작권 문제를 진단할 수 있습니다.

핵심 포인트

순환적 디노이징을 통한 확산 모델의 학습 데이터 추출 공격 가능성 제시
사전 지식 없이 샘플러 제어만으로 메모리된 이미지 복원 가능
초안정 끌개(Ultrastable Attractors)를 통한 데이터 메모리 감사 도구 활용
프라이버시 보호 및 모델 핑거프린팅을 위한 물리 기반 탐침 역할

우리는 이미지 확산 모델(image diffusion models)에 대한 추출 공격(extraction attack)으로서, 제어된 노이즈 진폭(noise amplitudes) 하에서 순방향 및 역방향 확산(forward and reverse diffusion)을 반복하는 순환적 디노이징(cyclic denoising)을 소개합니다. 무질서한 고체(disordered solids) 내의 무작위 조직화(random organization)에서 영감을 얻은 순환적 디노이징은 표준 샘플링(standard sampling)으로는 거의 접근할 수 없는 학습된 분포(learned distribution)의 영역을 드러냅니다. 이러한 역학(dynamics)은 샘플을 광범위한 안정성 스펙트럼(stability spectrum)을 가진 끌개(attractors)로 유도합니다. 가장 깊은 끌개들은 초안정(ultrastable)합니다. 이들은 거의 완전한 손상(corruption) 이후에도 재생되며 수천 번의 노이징-디노이징(noising-denoising) 사이클을 통해 지속됩니다. 이러한 끌개 중 다수는 스톡 사진(stock photographs), 브랜드 워터마크(brand watermarks), 웹 크롤링 아티팩트(web-crawl artifacts)를 포함하여 메모리된 학습 이미지(memorized training images)와 일치합니다. 이 공격은 그래디언트(gradients), 가중치 검사(weight inspection), 프롬프트(prompts), 캡션(captions), 또는 학습 데이터에 대한 사전 지식 없이 오직 샘플러 수준의 제어(sampler-level control)만을 필요로 합니다. 대규모 프롬프트 기반 생성과 사후 유사성 또는 멤버십 추론 필터링(membership-inference filtering)에 의존하는 생성 후 필터링(generate-and-filter) 공격과 달리, 우리의 주요 프로토콜은 완전히 무조건적(unconditioned)입니다. 우리는 Stable Diffusion v1.4와 픽셀 공간(pixel-space) DDPM에서 이 현상을 입증하며, 잠재 공간(latent-space) 및 픽셀 공간 확산 모델 전반에 걸쳐 일관된 동작을 보여줍니다. 노이즈 진폭에 따라 우리는 항복 유사 전이(yielding-like transition)를 관찰합니다. 낮은 진폭의 사이클링은 사소한 흡수 고정점(absorbing fixed points) 또는 한계 주기(limit cycles)를 생성하는 반면, 더 큰 진폭은 재배열(rearrangements), 분지 호핑(basin hopping), 그리고 구조화된 메모리된 끌개 분지(memorized attractor basins) 내에서의 장기적인 트래핑(trapping)을 유도합니다. 우리는 또한 계층적 부분 흡수(hierarchical partial absorption), 프롬프트 안정화 분지(prompt-stabilized basins), 그리고 회복된 끌개 집합의 교차 초기 조건 보편성(cross-initial-condition universality)을 관찰합니다. 따라서 우리의 결과는 순환적 디노이징이 생성적 지형(generative landscapes)에 대한 물리 기반 탐침(physics-inspired probe)인 동시에 메모리 감사(memorization auditing)를 위한 실용적인 도구임을 보여주며, 이는 프라이버시, 저작권 준수 및 모델 핑거프린팅(model fingerprinting)에 시사점을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

순환적 디노이징(Cyclic Denoising)을 통한 확산 모델(Diffusion Models) 내 초안정 메모리(Ultrastable

요약

핵심 포인트

댓글