arXiv논문2026. 05. 18. 20:02

GenShield: AI 생성 이미지의 통합 탐지 및 아티팩트 수정 프레임워크

요약

GenShield는 AI 생성 이미지(AIGI)를 탐지하는 동시에 발견된 아티팩트를 수정하여 사실적인 외관을 복원하는 통합 자기회귀 프레임워크입니다. 진단과 복원을 하나의 폐쇄 루프 내에서 수행하며, 시각적 사고 사슬(Visual Chain-of-Thought) 기반의 커리큘럼 학습을 통해 설명 가능한 다단계 수정을 지원합니다.

핵심 포인트

AIGI 탐지와 아티팩트 수정을 연결하는 통합 자기회귀 프레임워크 제안
시각적 사고 사슬(Visual Chain-of-Thought)을 활용한 설명 가능한 '진단 후 수리' 프로세스 도입
탐지와 수정 간의 상호 강화 관계를 활용한 폐쇄 루프(Closed-loop) 구조 구축
대규모 아티팩트-복원 쌍 데이터셋 및 통합 평가 파이프라인 구축
기존 AIGI 탐지 벤치마크에서 최첨단(SOTA) 성능 및 강력한 일반화 능력 입증

확산 기반 (Diffusion-based) 이미지 합성 기술은 AI 생성 이미지 (AIGI)를 점점 더 실사처럼 만들어, 오정보 탐지 (misinformation detection), 디지털 포렌식 (digital forensics), 콘텐츠 중재 (content moderation)와 같은 응용 분야에서 진위 여부에 대한 시급한 우려를 불러일으키고 있습니다. AIGI 탐지 분야의 상당한 발전에도 불구하고, 눈에 보이는 아티팩트 (artifacts)가 있는 탐지된 AI 생성 이미지를 어떻게 수정하고 사실적인 외관을 복원할 것인지는 여전히 미개척 분야로 남아 있습니다. 더욱이, 기존 연구 중 AIGI 탐지와 아티팩트 수정 사이의 연결 고리를 구축한 사례는 거의 없습니다. 이러한 공백을 메우기 위해, 우리는 진단에서 복원으로 이어지는 폐쇄 루프 (closed loop) 내에서 설명 가능한 AIGI 탐지와 제어 가능한 아티팩트 수정을 공동으로 수행하며, 이 두 작업 사이의 상호 강화 관계를 밝혀내는 통합 자기회귀 (autoregressive) 프레임워크인 GenShield를 제안합니다. 나아가, 우리는 명시적인 중단 기준 (stopping criterion)과 함께 스스로 설명 가능한 다단계 "진단 후 수리 (diagnose-then-repair)" 수정을 가능하게 하는 시각적 사고 사슬 (Visual Chain-of-Thought) 기반의 커리큘럼 학습 (curriculum learning) 전략을 도입합니다. 또한 대규모 "아티팩트-복원 (artifact-restored)" 쌍을 포함한 고품질 데이터셋과 통합 평가 파이프라인을 구축하였습니다. 우리의 수정 벤치마크 및 주요 AIGI 탐지 벤치마크에 대한 광범위한 실험은 우리 방법론의 최첨단 (state-of-the-art) 성능과 강력한 일반화 능력을 입증합니다. 코드는 https://github.com/zhipeixu/GenShield 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

GenShield: AI 생성 이미지의 통합 탐지 및 아티팩트 수정 프레임워크

요약

핵심 포인트

댓글