arXiv논문2026. 05. 22. 21:33

말하기 전에 세 번 생각하라: 설득력 있는 에이전트를 위한 이중 지식 강화 마음 이론 (Theory-of-Mind) 추론

요약

LLM의 설득력을 높이기 위해 마음 이론(ToM)을 활용한 새로운 추론 프레임워크인 TTBYS를 제안합니다. BDI 프레임워크와 대규모 데이터셋 ToM-BPD를 통해 모델이 타인의 정신 상태를 더 정교하게 추론하도록 설계되었습니다.

핵심 포인트

BDI 프레임워크 기반의 ToM-PD 태스크 도입
대규모 주석 데이터셋 ToM-BPD 구축
지식 강화 단계별 추론 프레임워크 TTBYS 제안
Qwen3-8B가 특정 지표에서 GPT-5를 상회하는 성능 기록
추론의 해석 가능성 및 일관성 향상 확인

설득력 있는 대화는 타인의 잠재적인 정신 상태(latent mental states)에 대해 추론하는 능력을 요구하며, 이는 마음 이론 (Theory of Mind, ToM)이라고 알려진 능력입니다. 그러나 단순한 프롬프팅 (prompting) 전략에 대한 의존과 불충분한 ToM 지식으로 인해, 기존의 거대언어모델 (LLMs)은 정신 상태 간의 내재적 의존성을 포착하지 못하는 경우가 많으며, 이는 파편화된 표현과 불안정한 추론으로 이어집니다. 이러한 문제를 해결하기 위해, 우리는 다회차 대화(multi-turn dialogues)에서 정신 상태 간의 순차적 의존성을 명시적으로 모델링하는 믿음-욕구-의도 (Belief-Desire-Intention, BDI) 프레임워크에 기반한 ToM 기반 설득 대화 (ToM-based Persuasive Dialogue, ToM-PD) 태스크를 도입합니다. 이 태스크에 대한 연구를 촉진하기 위해, 우리는 세밀한 정신 상태와 그에 상응하는 설득 전략을 포착하는 대규모 주석 데이터셋인 ToM 기반 광범위 설득 대화 (ToM-based Broad Persuasive Dialogues, ToM-BPD)를 구축합니다. 나아가 우리는 명시적 및 암시적 사전 경험을 모두 활용하여 LLM의 욕구, 믿음 및 설득 전략에 대한 추론을 개선하는 지식 강화 단계별 추론 프레임워크인 Think Thrice Before You Speak (TTBYS)를 제안합니다. 실험 결과, TTBYS를 탑재한 Qwen3-8B는 욕구, 믿음 및 설득 전략을 예측하는 데 있어 GPT-5보다 각각 1.20%, 22.80%, 16.97% 더 높은 성능을 보였습니다. 사례 연구를 통해 우리의 접근 방식이 추론의 해석 가능성 (interpretability)과 일관성 (consistency)을 향상시킨다는 점을 추가로 확인했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

말하기 전에 세 번 생각하라: 설득력 있는 에이전트를 위한 이중 지식 강화 마음 이론 (Theory-of-Mind) 추론

요약

핵심 포인트

댓글