LLM들이 플레이하는 One Night Werewolf
요약
LLM 모델들이 'One Night Werewolf' 게임을 플레이할 수 있도록 프롬프트와 도구 호출 시스템을 구축한 실험 사례입니다. 모델의 정체성 유지 문제와 전략적 사고를 위한 프롬프트 개선 과정을 다룹니다.
핵심 포인트
- Gemma, Qwen 등 다양한 모델의 게임 플레이 성능 비교
- 모델의 정체성 혼란 문제를 해결하기 위한 목표 지향적 프롬프트 적용
- 게임 종료 후 모델이 스스로 스킬을 작성하는 기능 구현
- 다양한 OpenAI API와 호환되는 범용 러너 스크립트 개발
며칠 전, 저는 도구 호출 (tool calls)을 통해 제가 직접 만든 UI에서 One Night Werewolf 게임을 플레이하는 것에 대해 게시물을 올렸습니다. 그 이후로 몇 판의 게임을 더 진행하며 프롬프트 (prompts)를 개선했습니다.
초기에는 참여자들, 즉 Gemma4 31B & 26B, Qwen3.6 36B, 그리고 소문난 성능의 27B 모델 모두 자신의 정체성이 바뀌었을 수도 있다는 사실을 받아들이는 데 문제가 있었습니다. 특히 Qwen은 자신이 이미 카드 B를 가지고 있어야 한다고 추론했음에도 불구하고, 카드 A의 초기 정체성을 강력하게 고수하곤 했습니다. 이는 실제로 게임에 참여하는 대신 정체성을 부정하는 상황으로 변질되었습니다.
나중에 이들에게 더 목표 지향적 (goal oriented)으로 행동하도록 프롬프트를 작성했는데, 이는 Qwen의 경우 상당히 개선되어 이제 더 전략적으로 생각하게 되었습니다. Gemma는 아직 가끔씩 부정하는 모습을 보이곤 합니다. 하지만 오해하는 모습 또한 지켜보는 재미가 있을 수 있습니다.
추가로 게임 스킬 (skill.md) 기능을 넣었습니다. 매 게임이 끝날 때마다 각 모델은 미래의 게임에 반영할 자신의 게임 스킬을 작성합니다.
그리고 모델들의 도구 호출 (tool calls)을 일일이 관리하는 것에 질려서, 바이브 코딩 (vibe coded)으로 러너 스크립트 (runner script)를 만들었습니다. 어떤 OpenAI API든 꽂기만 하면 바로 실행됩니다. 모델들은 더 이상 도구 호출 능력이 필요하지 않습니다. 작년 이전의 아주 오래된 모델들도 플레이할 수 있습니다 (아직 테스트해보지는 않았습니다).
관심 있는 분들을 위해 여기 공유합니다:
제 생각에는 5명이 플레이하는 것이 더 흥미로울 것 같습니다.....
AI 자동 생성 콘텐츠
본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기