본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 12:55

시각적 프라이밍이 비전-언어 모델의 협력 행동에 미치는 영향

요약

본 논문은 반복 죄수의 딜레마(IPD)를 사용하여 시각적 프라이밍이 비전-언어 모델(VLMs)의 협력 행동에 미치는 영향을 조사합니다. 연구는 행동 개념을 담은 이미지 노출과 색상 지정 보상 행렬이 VLM의 의사결정 패턴을 어떻게 변화시키는지 분석했습니다. 그 결과, VLM의 행동은 이미지 콘텐츠와 색상 단서 모두에 민감하게 반응하며, 모델별로 이러한 민감도와 완화 효과가 다름을 보여주었습니다.

핵심 포인트

  • VLM의 협력 행동은 시각적 프라이밍(이미지 및 색상)에 의해 영향을 받을 수 있다.
  • VLMs는 이미지 콘텐츠와 색상 단서 모두에 민감하게 반응하며, 이는 의사결정 패턴을 변화시킨다.
  • 모델마다 이러한 시각적 자극에 대한 민감도와 완화 효과가 다르므로, 모델별 평가 프레임워크가 필요하다.
  • 프롬프트 수정, CoT 추론 등 기존의 완화 전략만으로는 VLM 행동의 모든 시각적 영향을 완전히 제어하기 어렵다.

비전-언어 모델 (Vision-Language Models, VLMs) 이 의사결정 시스템에 점차 통합됨에 따라 시각적 입력이 그들의 행동을 어떻게 영향을 미치는지 이해하는 것이 필수적입니다. 본 논문은 반복 죄수의 딜레마 (Iterated Prisoner's Dilemma, IPD) 를 테스트 시나리오로 사용하여 시각적 프라이밍이 VLMs 의 협력 행동에 미치는 영향을 조사합니다. 우리는 행동 개념 (친절함/도움 vs 공격성/이기심) 을 묘사하는 이미지에 노출되는 것과 색상이 지정된 보상 행렬이 VLM 의사결정 패턴을 변경하는지 여부를 검토합니다. 여러 최첨단 VLM 에서 실험을 수행했습니다. 우리는 프롬프트 수정, 사슬의 사고 (Chain of Thought, CoT) 추론, 시각 토큰 감소와 같은 완화 전략도 추가로 탐구합니다. 결과는 VLM 행동이 이미지 콘텐츠와 색상 단서에 모두 영향을 받을 수 있으며, 모델마다 민감도와 완화 효과는 다르다는 것을 보여줍니다. 이러한 발견은 비전-언어 모델을 시각적으로 풍부하고 안전이 중요한 환경에 배포하기 위해 견고한 평가 프레임워크의 중요성을 강조할 뿐만 아니라, 모델 간의 구조적 및 훈련적 차이가 어떻게 다른 행동 반응을 이끌어낼 수 있는지를 부각시킵니다. 이는 추가 조사가 필요한 분야입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0