집단적 딜레마 상황에서의 AI 설득적 프레이밍 (AI Persuasive Framing in Collective Dilemmas)
요약
AI 에이전트가 집단적 딜레마 상황에서 인간의 협력을 유도하는 설득적 프레이밍의 효과를 연구했습니다. 개인화된 프레이밍은 단기적으로 협력을 증진시키지만, 반사회적 프레이밍을 통한 이기적 행동 조장은 더 지속적이고 부정적인 영향을 미칠 수 있음을 확인했습니다.
핵심 포인트
- AI의 맞춤형 설득 프레이밍이 단기적 협력 증진에 기여함
- 협력 유도 효과는 초기 라운드 이후 일시적으로 사라짐
- 반사회적 프레이밍은 이기적 행동을 더 지속적으로 조장함
- AI 시스템의 설득적 개입에 따른 이중 용도(dual-use) 위험 강조
AI 에이전트(AI agents)는 대규모 사회적 문제를 해결하는 과정에서 인간의 협력을 증진하기 위한 유연한 행동 넛지(behavioral nudges)로서 유망한 도구입니다. 그러나 AI 에이전트가 협력을 효과적으로 촉진할 수 있는지에 대한 증거는 여전히 엇갈리고 있습니다. 본 연구에서는 1,283명의 참가자를 모집하여 소규모 그룹 내에서 반복적 집단 위험 게임(iterated Collective Risk Games)을 수행하게 함으로써, AI 어시스턴트가 참가자들을 협력으로 유도(nudge)할 수 있는지 테스트했습니다. 각 플레이어의 사회적 가치 지향성(Social Value Orientation) 프로필에 맞춤화된 설득적 프레이밍(persuasive framing)을 사용함으로써, AI 개입은 기여도와 그룹 성공률을 유의미하게 증가시켰습니다. 하지만 이러한 협력적 효과는 일시적이었으며, 처음 몇 라운드 이후에는 사라졌습니다. 놀랍게도, AI 처치를 면책적 프레이밍(exculpatory framing)을 통해 이기적 행동을 조장하도록 재구성했을 때, 기여도와 그룹 성공에 미치는 부정적 영향은 더 컸으며 특히 개인화된 개입의 경우 상당히 더 지속적이었습니다. 이러한 친사회적(prosocial) 설득과 반사회적(antisocial) 설득 사이의 비대칭성은 집단 행동 설정에서 그룹 행동에 영향을 미치도록 설계된 AI 시스템의 이중 용도(dual-use) 위험을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기