LLM들이 플레이하는 One Night Werewolf

며칠 전, 저는 도구 호출 (tool calls)을 통해 제가 직접 만든 UI에서 One Night Werewolf 게임을 플레이하는 것에 대해 게시물을 올렸습니다. 그 이후로 몇 판의 게임을 더 진행하며 프롬프트 (prompts)를 개선했습니다.

초기에는 참여자들, 즉 Gemma4 31B & 26B, Qwen3.6 36B, 그리고 소문난 성능의 27B 모델 모두 자신의 정체성이 바뀌었을 수도 있다는 사실을 받아들이는 데 문제가 있었습니다. 특히 Qwen은 자신이 이미 카드 B를 가지고 있어야 한다고 추론했음에도 불구하고, 카드 A의 초기 정체성을 강력하게 고수하곤 했습니다. 이는 실제로 게임에 참여하는 대신 정체성을 부정하는 상황으로 변질되었습니다.

나중에 이들에게 더 목표 지향적 (goal oriented)으로 행동하도록 프롬프트를 작성했는데, 이는 Qwen의 경우 상당히 개선되어 이제 더 전략적으로 생각하게 되었습니다. Gemma는 아직 가끔씩 부정하는 모습을 보이곤 합니다. 하지만 오해하는 모습 또한 지켜보는 재미가 있을 수 있습니다.

추가로 게임 스킬 (skill.md) 기능을 넣었습니다. 매 게임이 끝날 때마다 각 모델은 미래의 게임에 반영할 자신의 게임 스킬을 작성합니다.

그리고 모델들의 도구 호출 (tool calls)을 일일이 관리하는 것에 질려서, 바이브 코딩 (vibe coded)으로 러너 스크립트 (runner script)를 만들었습니다. 어떤 OpenAI API든 꽂기만 하면 바로 실행됩니다. 모델들은 더 이상 도구 호출 능력이 필요하지 않습니다. 작년 이전의 아주 오래된 모델들도 플레이할 수 있습니다 (아직 테스트해보지는 않았습니다).

관심 있는 분들을 위해 여기 공유합니다:

제 생각에는 5명이 플레이하는 것이 더 흥미로울 것 같습니다.....

Insights

LLM들이 플레이하는 One Night Werewolf

요약

핵심 포인트

댓글

Cursor, 자체 학습 LLM 출시 및 Git 플랫폼 Origin과 모바일 앱 공개

LangGraph의 세 가지 재작성: 프로덕션 환경에서 상태 유지 에이전트(Stateful Agents)의 체크포인팅(Checkpointing)

AI 채용 SaaS 구축하기: 배운 점들

Andrew Ng의 OpenWorker: 오픈 소스 데스크톱 AI 에이전트

Cursor, 자체 학습 LLM 출시 및 Git 플랫폼 Origin과 모바일 앱 공개

LangGraph의 세 가지 재작성: 프로덕션 환경에서 상태 유지 에이전트(Stateful Agents)의 체크포인팅(Checkpointing)

AI 채용 SaaS 구축하기: 배운 점들

Andrew Ng의 OpenWorker: 오픈 소스 데스크톱 AI 에이전트