AI 텍스트 RPG에서의 지속적 메모리 문제와 그 해결 방법

우리는 게이머로서, 그리고 언어 모델(Language Models)이 긴 세션 동안 상태 유지 상호작용(Stateful Interactions)을 어떻게 처리하는지에 대한 전문가적 호기심으로 지난 몇 년간 AI 텍스트 RPG가 발전하는 과정을 지켜봐 왔습니다. 지속적 메모리(Persistent Memory) 문제는 플레이어들이 계속해서 마주치는 문제였습니다. 대부분의 플랫폼은 단일 세션 동안에는 충분히 설득력 있는 서사를 생성합니다. 하지만 문제는 다음 날 다시 돌아왔을 때 발생합니다. 모델은 당신의 캐릭터가 누구인지, 어떤 결정을 내렸는지, 혹은 현재 세계가 어떤 모습인지에 대한 실제적인 문맥(Context)을 가지고 있지 않습니다. 당신은 프롬프팅(Prompting)을 통해 모든 것을 다시 설정해야 하며, 이는 즉시 경험을 망가뜨립니다. 우리 팀은 서로 다른 플랫폼들이 이를 어떻게 처리하는지에 대해 충분한 호기심을 느꼈고, 몇 달 동안 이를 진지하게 테스트하는 데 시간을 보냈습니다. 우리가 발견한 것은 대부분의 플랫폼이 메모리를 사후 고려 사항(Afterthought)으로 취급한다는 점이었습니다. 하지만 그중 하나는 그렇지 않았습니다.

아무도 충분히 이야기하지 않는 기술적 문제
텍스트 RPG 맥락에서 지속적 메모리가 실제로 무엇을 요구하는지 생각해보면, 그 범위는 빠르게 복잡해집니다. 이것은 단순히 대화 기록을 저장하는 것이 아닙니다. 실행 중인 대화 로그(Conversation Log)는 단일 세션에서는 잘 작동하지만, 여러 세션에 걸쳐서는 빠르게 다루기 힘들어집니다. 컨텍스트 윈도우(Context Window)가 무관한 대화 턴(Turns)들로 가득 차게 됩니다. 중요한 세부 사항들은 묻혀버립니다. 모델은 기술적으로 여전히 컨텍스트 안에 있더라도 30턴 전에 일어난 일들을 놓치기 시작합니다. 실제로 당신에게 필요한 것은 각 턴에서 중요한 세부 사항을 추출하고, 이를 가공되지 않은 대화 로그와 별도로 저장하며, 적절한 순간에 이를 표면화하는 메모리 추출 및 검색 시스템(Memory Extraction and Retrieval System)입니다. 캐릭터 관계, 세계 상태의 변화, 활성화된 퀘스트 스레드, 나중에 결과로 이어져야 할 결정들 같은 것들 말입니다. 이것은 단순히 더 긴 컨텍스트를 전달하는 것과는 다른 엔지니어링 문제입니다. 우리가 테스트한 대부분의 플랫폼은 이를 해결하지 못했습니다. 그들은 긴 세션 동안 성능이 저하되는 가공되지 않은 컨텍스트 윈도우를 사용하거나, 세션 사이에 아무것도 저장하지 않았습니다.

Questsmith가 다르게 접근하는 방식

Questsmith는 제가 더 이상 대안을 찾지 않게 만든 플랫폼입니다. 이 메모리 시스템은 모험당 최대 500개의 개별 세부 사항을 추적합니다. 단순히 가공되지 않은 대화 차례(conversation turns)가 아니라, 실제로 추출된 사실(extracted facts)을 저장합니다. 캐릭터 이름과 관계, 내린 결정과 그 결과, 진행 중이거나 완료된 퀘스트 스레드(quest threads), NPC 상태, 위치 및 세계의 변화 등이 포함됩니다. 캠페인에 다시 돌아오면, 이 추출된 메모리가 현재 세션과 함께 컨텍스트(context)로 다시 로드됩니다. 실제로 이는 우리가 이전에 보지 못했던 방식으로 세션 전반에 걸쳐 서사적 일관성(narrative coherence)이 유지됨을 의미합니다. 우리는 2주 동안 6번의 세션에 걸쳐 판타지 캠페인을 진행했습니다. AI는 우리가 세션 2에서 설정했던 배신을 기억하고 있었으며, 제가 별도로 유도하지 않았음에도 세션 5에서 그에 따른 결과로 이를 다시 드러냈습니다. 이러한 종류의 연속성(continuity)이야말로 텍스트 RPG를 단절된 세션의 나열이 아닌 실제 캠페인처럼 느끼게 만드는 요소입니다.

메모리 계층(memory layer)을 중심으로 구축된 RPG 시스템 또한 언급할 가치가 있습니다. 실제 수정치 계산(modifier calculations)이 적용되는 4가지 캐릭터 능력치, 각 굴림 전 승리 확률이 표시되는 D20 액션 체크, 체력 추적이 포함된 실시간 전투, 자동 퀘스트 로그 등이 있습니다. 이는 단순히 챗봇 위에 얹혀 있는 메모리 쇼케이스가 아닙니다. 그 밑에는 실제 게임이 존재합니다.

동료(companion) 시스템은 AI 행동 관점에서 저를 가장 놀라게 한 부분이었습니다. 당신의 여행 동료는 지속적인 성격 프로필(personality profile)과 캠페인 전반의 결정에 따라 업데이트되는 신뢰도 수치(trust meter)를 가집니다. 동료는 지시를 거부하거나, 장면 도중 자율적으로 행동하거나, 스스로 사이드 퀘스트를 시작할 수도 있습니다. 동료와의 개인 채팅(Private companion chat)을 통해 직접 대화를 나눌 수 있으며, 여기서 나눈 공유된 계획은 다시 메인 서사로 이어집니다. 게임 컨텍스트 내에서 지속적인 AI 캐릭터 상태(character state)가 어떻게 작동할 수 있는지에 관심이 있는 사람이라면, Questsmith가 이를 어떻게 처리하는지 살펴볼 가치가 있습니다.

이 문제가 보기보다 어려운 이유

LLM(대규모 언어 모델)을 기반으로 텍스트 RPG를 구축하는 것은 충분히 간단합니다.

수십 번의 세션에 걸쳐 일관된 상태 (State)를 유지하는 게임을 구축하는 것은 전혀 다른 차원의 프로젝트입니다. 메모리 추출 (Memory extraction)은 모든 것을 저장하지 않으면서도 무엇이 실제로 중요한지를 식별할 수 있을 만큼 충분히 똑똑해야 합니다. 너무 적게 추출하면 서사의 일관성 (Coherence)이 깨지고, 너무 많이 추출하면 불필요한 단계를 거쳐 다시 컨텍스트 윈도우 (Context window) 문제로 돌아가게 됩니다. 검색 (Retrieval)은 현재의 컨텍스트를 무관한 과거 이력으로 어지럽히지 않으면서, 적절한 순간에 적절한 사실을 드러내야 합니다.

RPG 메커니즘 레이어는 또 다른 제약 조건을 추가합니다. 당신은 단순히 서사를 추적하는 것이 아니라, 게임 상태 (Game state)를 추적하고 있는 것입니다. 체력 수치, 인벤토리, 퀘스트 완료 플래그, 능력치 수정 사항 등이 이에 해당합니다. 이러한 요소들은 서사적 세부 사항과는 다른 차원의 신뢰성을 가지고 지속되어야 합니다. 이야기의 세부 사항이 약간 틀리는 것은 몰입감 (Immersion)의 문제이지만, 캐릭터의 체력 수치가 틀리는 것은 게임을 망가뜨리는 버그입니다. 우리가 테스트한 대부분의 플랫폼은 이 두 가지 문제를 깔끔하게 해결하지 못했습니다. Questsmith는 메모리 시스템이 나중에 덧붙여진 것이 아니라, 처음부터 긴 캠페인을 지원하도록 설계되었다는 느낌을 준 첫 번째 플랫폼이었습니다.

이것이 AI 게임 개발에 의미하는 바

텍스트 RPG 분야는 다른 맥락에서도 발생하는 지속적인 AI 메모리 문제에 대한 유용한 테스트 베드 (Test bed)입니다. 상태 유지형 (Stateful) AI 어시스턴트, 장기 실행 자율 에이전트 (Autonomous agents), 그리고 매 세션마다 인간이 컨텍스트를 다시 설정해 줄 필요 없이 확장된 상호작용 전반에 걸쳐 일관된 컨텍스트를 유지해야 하는 모든 시스템이 이에 해당합니다. 게임 맥락에서 개발되고 있는 솔루션들은 설령 당신의 작업이 게임 분야가 아닐지라도 주목할 가치가 있습니다. 메모리 추출 및 검색, 대화 컨텍스트와 병행되는 구조화된 상태 지속성 (Structured state persistence), 긴 상호작용 체인 전반에 걸친 캐릭터 일관성 강제 (Character consistency enforcement) 등은 RPG 이외의 영역에서도 실제 사용 사례가 존재하는 실질적인 엔지니어링 문제입니다.

이 분야에서 무언가를 구축하는 사람에게 흥미로운 질문은 단순히 모델에게 더 긴 컨텍스트 윈도우를 제공하는 방법이 아닙니다. 그것은 어떻게 하면 모델에게 '적절한 순간에 적절한 컨텍스트'를 제공할 것인가 하는 점입니다.

이것이 바로 5분 동안만 작동하는 시스템과 몇 주간의 사용에도 유지되는 시스템을 가르는 차이점입니다. 관심이 있다면 시도해 볼 가치가 있습니다. 실제 멀티 세션 캠페인(multi-session campaign) 전반에 걸쳐 메모리와 상태 지속성(state persistence)이 실제로 어떻게 작동하는지 확인하고 싶다면, 무료 티어만으로도 적절한 테스트를 수행하기에 충분합니다. 신용카드는 필요하지 않습니다. 시나리오 생성기(scenario creator) 또한 디자인 관점에서 탐색해 볼 가치가 있습니다. 막(acts), 아크(arcs), 비트(beats)를 활용한 구조화된 스토리 구축, 평이한 언어 묘사로부터의 AI 보조 초안 생성(AI-assisted draft generation), 다른 사용자들이 플레이할 수 있는 게시된 시나리오 등이 포함됩니다. AI 보조 내러티브 디자인 도구(AI-assisted narrative design tools)에 관심이 있는 사람이라면, 이 플랫폼을 몇 시간 정도 투자하여 제대로 평가해 볼 가치가 있습니다. AI 애플리케이션에서의 지속적 메모리(persistent memory) 문제는 아직 전반적으로 해결되지 않았습니다. 특히 텍스트 RPG 분야에서는 누군가가 마침내 이 문제를 진지하게 다루기 시작했습니다.

AI 텍스트 RPG에서의 지속적 메모리 문제와 그 해결 방법

요약

핵심 포인트

댓글