arXiv논문2026. 06. 16. 22:46

인공지능을 위한 갈등 상황에서의 마음 이론(Theory of Mind) 인과 모델

요약

본 논문은 AI가 갈등 상황에서 언제 마음 이론(ToM)을 개입시켜야 하는지를 다루는 구조적 인과 모델을 제안합니다. DAG 기반의 모델을 통해 상황적·에이전트 수준의 조건에 따른 ToM 활성화 메커니즘을 공식화합니다.

핵심 포인트

ToM을 상시 활성화가 아닌 상황적 조건에 따른 메커니즘으로 정의
DAG 기반의 구조적 인과 모델(SCM)을 통한 ToM 개입 정당화
실행 가능성, 추론 깊이, 촉진 원인 등 3가지 인과 경로 제시
자원 효율적이고 신뢰할 수 있는 인공 사회적 지능 구현 방법론 제공

마음 이론 (Theory of Mind, ToM)은 타인에게 정신 상태를 귀속시키고, 그러한 귀속을 예측과 추론에 사용하는 능력으로, 효과적인 인간-기계 통합을 위해 필수적인 것으로 널리 가정됩니다. 기존의 AI-ToM 모델들은 '어떻게' 마음을 읽을 것인가(mentalize)를 다루지만, '언제' 해야 하는가에 대한 문제는 대체로 다루지 않은 채 남겨두고 있습니다. 핵심 질문은 다음과 같습니다: 갈등 상황에서 어떤 상황적 및 에이전트 수준의 조건 하에서 ToM 개입이 인과적으로 정당화되는가? 본 논문은 ToM을 항상 켜져 있는 능력이 아니라 상황적 및 에이전트 수준의 조건에 의해 활성화되는 메커니즘으로 취급하며, 유향 비순환 그래프 (Directed Acyclic Graph, DAG)로 공식화된 구조적 인과 모델 (Structural Causal Model)을 제시합니다. 이 모델은 상황적 및 에이전트 수준의 조건을 포착하는 4개의 외생 변수 (Exogenous variables), 5개의 내생 매개 변수 (Endogenous mediators), 그리고 세 가지 뚜렷한 인과 경로인 실행 가능성 경로 (Tractability pathway), 추론 깊이 경로 (Reasoning-depth pathway), 촉진 원인 경로 (Enabling-cause pathway)를 통해 개입 상태를 생성하는 메커니즘적 ToM 노드를 명시합니다. 주요 결과물은 인식적 정확성 (Epistemic accuracy)이며, 이는 사회적 추론을 행동 정책 (Behavioral policy)으로부터 분리하고 갈등을 넘어 사회적 현상 전반에 걸쳐 일반화됩니다. 이 프레임워크는 AI 시스템에 마음 읽기를 위한 원칙적이고 자원 합리적인 (Resource-rational) 결정 절차를 제공하며, 이는 효율성, 신뢰성, 그리고 견고한 인공 사회적 지능 (Artificial social intelligence)의 발전에 시사점을 줍니다. 시뮬레이션 검증, 실증적인 인간-기계 팀워크 연구, 그리고 갈등에 최적화된 마음 읽기에서 발생하는 윤리적 고려 사항들이 논의됩니다.

AI 자동 생성 콘텐츠

원문 바로가기

인공지능을 위한 갈등 상황에서의 마음 이론(Theory of Mind) 인과 모델

요약

핵심 포인트

댓글