arXiv논문2026. 05. 01. 13:14

장기적 생산성 시뮬레이션을 위한 대규모 합성 컴퓨터

요약

본 논문은 현실적인 장기적 생산성 작업을 시뮬레이션하기 위해 'Synthetic Computers at Scale'이라는 확장 가능한 방법론을 제안합니다. 이 방법론은 실제 폴더 구조와 다양한 콘텐츠가 풍부한 아티팩트를 갖춘 합성 컴퓨터 환경을 생성하고, 사용자 특화의 복잡한 목표를 가진 에이전트들이 장기간에 걸쳐 상호작용하며 작업을 수행하도록 합니다. 이를 통해 방대한 양의 현실적이고 풍부한 경험 학습 신호를 확보할 수 있으며, 이는 에이전트 성능 개선 및 강화학습(RL) 연구를 위한 강력한 기반을 제공합니다.

핵심 포인트

'Synthetic Computers at Scale' 방법론은 실제와 유사한 폴더 구조와 콘텐츠가 풍부한 아티팩트를 갖춘 합성 환경을 생성한다.
사용자 특화의 복잡하고 장기적인 생산성 목표를 설정하여 에이전트들이 현실적인 작업을 수행하도록 한다.
시뮬레이션 결과는 8시간 이상의 긴 실행 시간과 2,000개 이상의 턴을 포함하며 풍부한 경험 학습 신호를 제공한다.
이 방법론은 수백만 또는 수십억 개의 합성 사용자 월드로 확장 가능하여 광범위한 시나리오 테스트를 지원한다.
합성 컴퓨터와 대규모 시뮬레이션의 결합은 에이전트 자기 개선 및 강화학습(RL)을 위한 유망한 기반 서브스트레이트를 제공한다.

현실적인 장기적 생산성 작업은 사용자 특이적인 컴퓨터 환경에 강하게 의존하며, 작업의 많은 맥락이 디렉토리 구조와 콘텐츠가 풍부한 아티팩트를 통해 저장 및 조직화됩니다. 이러한 생산성 시나리오에 대한 합성 데이터 생성을 확장하기 위해, 우리는 현실적인 폴더 계층 구조와 콘텐츠가 풍부한 아티팩트(예: 문서, 스프레드시트, 프레젠테이션 등)로 이러한 환경을 생성할 수 있는 확장 가능한 방법론인 'Synthetic Computers at Scale'를 소개합니다. 각 합성 컴퓨터에 대해 조건부 설정을 하여 장기적 시뮬레이션을 수행합니다: 하나의 에이전트는 컴퓨터 사용자에게 특화된 생산성 목표를 생성하며, 이는 여러 가지 전문적인 산출물과 약 한 달 분량의 인간 작업을 필요로 합니다. 다른 에이전트는 그 사용자로 행동하여 컴퓨터를 가로지르며 계속 작업합니다; 예를 들어, 정교화를 위한 파일 시스템 탐색, 시뮬레이션된 협력자와의 조정, 전문적인 아티팩트 생성 등을 수행하여 이러한 목표가 완료될 때까지 작업합니다. 예비 실험에서 우리는 1,000 개의 합성 컴퓨터를 생성하고 이에 대해 장기적 시뮬레이션을 수행했습니다. 각 실행은 에이전트 런타임이 8 시간 이상 소요되며 평균적으로 2,000 개 이상의 턴을 포괄합니다. 이러한 시뮬레이션은 풍부한 경험 학습 신호를 생성하며, 그 효과성은 도메인 내 및 도메인 외 생산성 평가에서 에이전트 성능의 유의한 개선으로 검증되었습니다. 페르소나가 수십억 규모로 풍부하게 존재하므로, 이 방법론은 충분한 컴퓨팅 자원을 활용하면 원칙적으로 수백만 개나 심지어 수십억 개의 합성 사용자 월드로 확장될 수 있어, 다양한 직업, 역할, 맥락, 환경 및 생산성 요구에 대한 더 넓은 범위를 가능하게 합니다. 우리는 확장 가능한 합성 컴퓨터 생성과 대규모 시뮬레이션을 결합한 것이 장기적 생산성 시나리오에서 에이전트 자기 개선 및 에이전틱 강화학습 (RL) 을 위한 기초적인 서브스트레이트로서 매우 유망하다고 주장합니다.

AI 자동 생성 콘텐츠

원문 바로가기

장기적 생산성 시뮬레이션을 위한 대규모 합성 컴퓨터

요약

핵심 포인트

댓글