arXiv논문2026. 05. 18. 20:02

잠재 매니폴드 얽힘 해소를 통한 모델 유도 레이블 노이즈 분리 기법 MIND

요약

본 논문은 Foundation Models를 활용한 자동 주석 과정에서 발생하는 체계적인 모델 유도 레이블 노이즈 문제를 해결하기 위한 MIND 프레임워크를 제안합니다. 잠재 매니폴드 얽힘 해소(Latent Manifold Disentanglement) 기술을 통해 노이즈를 서브스페이스 의존적 구성 요소로 분리하여, 정답 데이터 없이도 구조적 오류를 효과적으로 식별합니다. 실험 결과, MIND는 3D 데이터셋과 같은 복잡한 환경에서 기존 방식보다 뛰어난 성능을 보였으며 시각-언어 모델의 제로샷 환각 현상을 교정하는 데 탁월함을 입증했습니다.

핵심 포인트

모델 유도 레이블 노이즈는 주석가의 귀납적 편향으로 인해 발생하는 체계적이고 구조적인 오류임
MIND 프레임워크는 잠재 분리 추정기(LDE)를 통해 노이즈를 다루기 쉬운 서브스페이스로 분리함
정답(ground-truth) 앵커 포인트 없이도 노이즈 식별이 가능한 구조적 클러스터링 방식 채택
CIFAR-100 및 대규모 3D 데이터셋(S3DIS, ScanNet)에서 최신 기술(SOTA) 대비 우수한 성능 확인
Vision-Language Models의 제로샷 환각(hallucinations)을 교정하여 강건한 모델 증류 가능

사전 학습된 전문가 및 파운데이션 모델 (Foundation Models)에 의해 구동되는 자동 주석 (automatic annotations) 학습 패러다임은 데이터 집약적인 애플리케이션을 지배하고 있습니다. 그러나 이는 모델 유도 레이블 노이즈 (model-induced label noise)라는 중대한 과제를 야기합니다. 고전적인 강건 학습 (robust learning)에서의 확률적 노이즈 (stochastic noise)와 달리, 이 노이즈는 주석가 (annotator)의 귀납적 편향 (inductive biases)에서 비롯되며, 국소적 특징 매니폴드 (local feature manifolds)와 밀접하게 결합된 체계적 오류로 나타납니다. 전역 전이 행렬 (global transition matrices)에 의존하는 기존 방법들은 이러한 구조적 패턴을 과소적합 (underfit)하며, 인스턴스별 행렬 (instance-specific matrices)을 학습하는 것은 수학적으로 다루기 어렵습니다.

우리는 이 딜레마를 해결하기 위해 이론적 근거를 갖춘 프레임워크인 MIND (Model-Induced Noise Decoupling)를 제안합니다. 우리는 고차원 노이즈 매니폴드 (noise manifold)가 잠재 매니폴드 얽힘 해소 (Latent Manifold Disentanglement)를 통해 다루기 쉬운 서브스페이스 의존적 (subspace-dependent) 구성 요소로 분리될 수 있음을 입증합니다. 구체적으로, 우리의 잠재 분리 추정기 (Latent Decoupling Estimator, LDE)는 샘플을 일관된 오류 모드를 가진 잠재적 구조적 클러스터 (latent structural clusters)로 동적으로 투영하여, 정답 (ground-truth) 앵커 포인트 없이도 노이즈 식별 가능성 (noise identifiability)을 촉진합니다.

강건성 (robustness)을 엄격하게 평가하기 위해, 우리는 계층적 프로토콜을 채택합니다. 즉, CIFAR-100에서의 통제된 노이즈에서부터 오류 패턴이 기하학적 매니폴드 (geometric manifolds)와 명시적으로 결합되는 대규모 실제 3D 데이터셋 (S3DIS, ScanNet)에 대한 구조적 스트레스 테스트로 확장합니다. 실험적으로 MIND는 이러한 복잡한 벤치마크에서 최신 기술 (state-of-the-art) 방법들을 크게 능가하며, 시각-언어 모델 (Vision-Language Models, 예: OpenSeg)의 제로샷 환각 (zero-shot hallucinations)을 효과적으로 교정함으로써 파운데이션 모델 (Foundation Models)을 위한 강건한 증류 (distillation) 프레임워크로서의 잠재력을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

잠재 매니폴드 얽힘 해소를 통한 모델 유도 레이블 노이즈 분리 기법 MIND

요약

핵심 포인트

댓글