arXiv논문2026. 05. 07. 18:56

확산 모델의 환각을 드러내는 로컬 내재 차원

요약

본 논문은 확산 모델이 구조적 환각(hallucinations)을 일으키는 현상을 '모델 유도 다양체 상의 불안정성'으로 해석하고, 이를 완화하기 위한 새로운 접근 방식을 제안한다. 연구진은 이러한 불안정성의 근본 원인이 로컬 내재 차원(LID)에 있음을 밝혀내고, 이를 수정하는 메커니즘인 '본질 냉각(Intrinsic Quenching: IQ)'을 개발했다. IQ는 다양한 벤치마크에서 기존의 환각 감소 기법보다 우수한 성능을 보여주며, 특히 의료 영상 분야에서 해부학적 일관성을 유지하는 데 유용할 것으로 기대된다.

핵심 포인트

확산 모델의 구조적 환각은 단순히 통계적 오류가 아닌, '모델 유도 다양체' 상의 불안정성으로 정의되었다.
환각 발생의 핵심 원인 동인은 로컬 내재 차원(LID)임이 밝혀졌다.
제안된 본질 냉각(Intrinsic Quenching: IQ) 메커니즘은 기존 환각 감소 기법보다 일관되게 높은 성능을 보인다.
IQ는 특히 해부학적 구조의 정확성이 중요한 의료 영상 분야에서 강력한 해결책이 될 잠재력을 가진다.

확산 모델은 구조적 환각 (hallucinations) 을 발생하기 쉽습니다. 이는 학습 데이터의 통계적 특성과는 일치하지만, 근본적인 구조 규칙을 위반하여 손가락이 5 개보다 많거나 같은 등의 이례적인 현상을 초래합니다. 최근 연구들은 이 실패 모드를 여러 관점에서 분석하며, 모드 간섭 (mode interpolation) 등 발생 원인을 부분적으로 설명했습니다. 본 작업에서는 환각을 모델 유도 다양체 (model-induced manifold) 상의 불안정성으로 다루는 보완적 관점을 제안합니다. 먼저, 이러한 불안정성을 기반으로 한 환각 필터가 최근 제안된 시간적 필터와 성능이 같거나 더 높음을 보여줍니다. 이러한 불안정성의 원인을 추적하여 로컬 내재 차원 (Local Intrinsic Dimension: LID) 이 주요 동인임을 확인하고, 이를 완화하기 위해 직접적인 수정 메커니즘인 본질 냉각 (Intrinsic Quenching: IQ) 을 제안합니다. IQ 는 다양한 벤치마크에서 표준 환각 감소 기법보다 일관되게 우수한 성능을 보이며, 후속 의료 영상 작업에서 해부학적 일관성을 강제하는 데 매우 유망한 해결책을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

확산 모델의 환각을 드러내는 로컬 내재 차원

요약

핵심 포인트

댓글