arXiv논문2026. 06. 17. 11:49

지시적 의사소통에서의 LVLM을 위한 암시적 vs. 명시적 프롬프팅 전략

요약

LVLM의 지시적 의사소통에서 명시적 프롬프팅과 암시적 프롬프팅의 효과를 비교 연구했습니다. 연구 결과, 모델은 명시적 지시에는 효율적으로 반응하지만 암시적 프롬프트로부터 의사소통 효율성의 필요성을 스스로 추론하는 데는 한계를 보였습니다.

핵심 포인트

LVLM의 명시적 프롬프팅에 따른 효율적 지시 표현 협력 재현
암시적 프롬프트 사용 시 의사소통 효율성 추론 실패 확인
인간과 AI 시스템 간의 의사소통 방식 차이 규명

최근 두 연구(Jones et al. (2026); Zeng et al. (2026))는 LVLM(Large Vision-Language Models)이 효율적인 지시 표현(referring expressions)을 통해 협력할 수 있는지에 대해 서로 상충하는 것으로 보이는 결론을 내렸습니다. 우리는 연구 간의 태스크(task) 차이를 통제하면서 그들의 프롬프팅(prompting) 스타일을 직접 비교했습니다. 우리는 모델이 명시적으로 그렇게 하도록 프롬프팅되었을 때 효율적인 지시 표현을 협력할 수 있다는 발견을 재현하였으며, 이는 다른 태스크 차이가 상이한 결과의 원인이 아님을 시사합니다. 그러나 우리는 동일한 모델이 더 암시적인 프롬프트로부터 의사소통 효율성의 필요성을 추론하는 데 실패한다는 점 또한 발견하였으며, 이는 인간과 AI 시스템이 의사소통하는 방식 사이의 결정적인 차이를 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

지시적 의사소통에서의 LVLM을 위한 암시적 vs. 명시적 프롬프팅 전략

요약

핵심 포인트

댓글