MHSA: Steered Attention을 통해 환각을 완화하는 LVLM을 위한 경량 프레임워크
요약
MHSA(Mitigating Hallucinations via Steered Attention)는 대규모 시각-언어 모델(LVLMs)이 겪는 환각 문제를 완화하기 위해 제안된 경량 프레임워크입니다. 이 프레임워크는 LVLM의 교차 모달 어텐션 패턴을 학습하여 교정함으로써, 기존의 어텐션을 수정 없이 효과적으로 대체합니다. MHSA는 판별적 및 생성적 환각 모두를 완화하며, 모델의 신뢰성을 높이는 새로운 접근 방식을 제시합니다.
핵심 포인트
- MHSA는 LVLM의 환각 문제를 해결하기 위해 설계된 경량 프레임워크입니다.
- 이 프레임워크는 교차 모달 어텐션 패턴을 학습하고 이를 통해 기존 어텐션을 교정하여 사용합니다.
- 추론 과정에서 MHSA는 LVLM 파라미터를 수정하지 않고, 단순히 어텐션만 대체하는 방식으로 작동합니다.
- MHSA는 판별적(discriminative) 및 생성적(generative) 환각 모두를 완화할 수 있습니다.
대규모 시각-언어 모델 (Large vision-language models, LVLMs)은 다양한 멀티모달 (multimodal) 작업에서 놀라운 성능을 달성했지만, 시각적 입력과 일치하지 않는 콘텐츠를 생성하는 환각 (hallucinations) 문제로 인해 여전히 어려움을 겪고 있습니다. 이전 연구인 DHCP (Detecting Hallucinations by Cross-modal Attention Pattern)는 교차 모달 어텐션 (cross-modal attention) 관점에서 환각 탐지를 탐구했으나, 환각 완화 (mitigation) 문제는 다루지 않았습니다. 본 논문에서는 LVLM의 교차 모달 어텐션 패턴을 교정하는 법을 학습함으로써 환각을 완화하는 경량 프레임워크인 MHSA (Mitigating Hallucinations via Steered Attention)를 제안합니다. MHSA는 DHCP 판별기 (discriminator)와 LVLM 자체의 감독 신호 (supervisory signals)에 의해 유도되어, 교정된 어텐션을 생성하도록 단순한 3층 MLP 생성기 (generator)를 학습시킵니다. 추론 (inference) 과정에서 MHSA는 어떠한 LVLM 파라미터도 수정하지 않고, 기존의 교차 모달 어텐션을 교정된 어텐션으로 단순히 교체함으로써 다양한 데이터셋과 LVLM에 걸쳐 판별적 (discriminative) 환각과 생성적 (generative) 환각을 모두 완화합니다. 교차 모달 어텐션 메커니즘을 환각 탐지에서 환각 완화로 확장함으로써, MHSA는 LVLM의 환각 연구에 대한 새로운 관점을 제공하며 모델의 신뢰성을 높이는 데 기여합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기