본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 10:55

사회적 상호작용 에이전트의 신뢰 보정(Trust Calibration)을 향하여: LLM을 이용한 성별화된 멀티모달 행동 생성 연구

요약

본 연구는 사회적 상호작용 에이전트(SIA)가 사용자의 신뢰를 적절히 조절할 수 있도록 LLM을 활용해 능력과 선의를 반영한 멀티모달 행동을 생성하는 방법을 제안합니다. 실험 결과 GPT-4(본문 내 GPT-5.4는 오기로 판단됨)가 텍스트, 음성, 표정 등 다양한 양식에서 일관된 행동을 생성할 수 있음을 확인했으나, 성별 프롬프트 입력 시 사회적 성 고정관념이 나타나는 한계도 발견했습니다.

핵심 포인트

  • LLM을 사용하여 에이전트의 능력(ability)과 선의(benevolence)를 나타내는 멀티모달 행동 생성 가능
  • 텍스트, 억양, 얼굴 표정, 몸짓 간의 일관된 행동 생성 역량 입증
  • 성별 지정 시 남성은 높은 능력, 여성은 높은 선의로 연결되는 사회적 성 고정관념 재현 문제 확인
  • 사용자 연구를 통해 생성된 행동이 의도된 지침(능력 및 선의 수준)과 일치함을 검증

사회적 상호작용 에이전트 (Socially Interactive Agents, SIAs)가 일상생활에 점점 더 통합됨에 따라, 에이전트의 실제 능력에 맞춰 사용자의 신뢰를 보정 (calibrate)하는 능력은 이러한 에이전트의 적절한 사용을 보장하는 데 도움이 될 것입니다. 본 논문에서는 신뢰성 (trustworthiness)의 두 가지 핵심 차원인 능력 (ability)과 선의 (benevolence)의 다양한 수준을 반영하는 멀티모달 행동 (multimodal behaviors; 언어적, 음성적, 몸짓 및 얼굴 표정 양식)을 생성하는 거대 언어 모델 (Large Language Models, LLMs)의 역량을 탐구합니다. 우리는 이러한 특성의 특정 수준과 일치하는 행동을 자동으로 생성하기 위한 새로운 방법을 제안하며, 이는 미묘하고 신뢰가 보정된 상호작용을 가능하게 하기 위한 첫 번째 단계입니다. LLM에 의해 생성된 멀티모달 전사 데이터 (multimodal transcripts)의 대규모 데이터셋을 분석함으로써, 우리는 GPT-5.4가 서로 다른 양식 (텍스트, 억양, 얼굴 표정 및 몸짓)에 걸쳐 일관된 행동을 생성할 수 있음을 입증합니다. 랜덤 포레스트 (Random Forest) 특성 중요도 분석을 사용하여, 생성된 행동이 능력 및 선의에 대한 이론적 기대치와 일치함을 보여줍니다. 그러나 프롬프트 (prompt)에 성별이 지정될 경우, LLM이 사회적 성 고정관념을 재현하는 경향이 있어 남성 에이전트의 행동은 높은 능력과, 여성 에이전트의 행동은 높은 선의와 연관시키는 것을 발견했습니다. 우리의 접근 방식을 검증하기 위해, 우리는 피험자 내 설계 (within-subjects design)를 사용하여 Prolific에서 사용자 연구를 수행했습니다. 참가자들은 생성된 행동에서 의도된 지침과 일치하는 다양한 수준의 능력과 선의를 인지했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0