LLM 에이전트의 반복 게임에서 나타나는 사회적 평판 및 기만 역학 분석

본 연구는 대규모 언어 모델(LLM) 에이전트를 활용하여 숨겨진 역할 기반의 심리 게임인 '아발론 (Avalon)'에서 나타나는 사회적 상호작용과 역동성을 탐구합니다. 기존의 LLM 성능 평가는 단일 게임 환경에 국한되는 경우가 많았으나, 본 연구는 에이전트들이 이전 상호작용을 기억하는 장기 메모리(long memory)를 유지하며 반복적인 게임을 진행하도록 설계하여 사회적 역학 변화 과정을 관찰했습니다.

총 188개의 게임을 분석한 결과, 두 가지 핵심 현상이 발견되었습니다. 첫째는 '평판 역학 (reputation dynamics)'의 자연스러운 출현입니다. 에이전트들이 과거 행동에 대한 기억을 유지하면서,