본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 29. 12:44

Skill Graphs 를 통한 확장 가능한 터미널 작업 합성으로 나아가기

요약

본 논문은 자율적인 커맨드 라인 실행 능력을 가진 터미널 에이전트의 훈련 데이터 부족 문제를 해결하기 위해 SkillSynth라는 자동화 프레임워크를 제안합니다. SkillSynth는 시나리오 매개 기술 그래프(skill graph)를 구축하여, 다양한 명령어 기술을 연결하는 경로를 샘플링하고 이를 실제 실행 가능한 작업 인스턴스로 합성합니다. 이 방식을 통해 에이전트가 훈련 과정에서 경험해야 할 최소한의 실행 궤적 다양성을 명시적으로 제어할 수 있어, 터미널 기반 환경에서의 에이전트 성능 향상에 기여합니다.

핵심 포인트

  • SkillSynth는 시나리오 매개 기술 그래프를 활용하여 터미널 작업 합성을 자동화하는 프레임워크입니다.
  • 기존 방법들이 단순히 작업의 양을 늘리는 데 그쳤다면, SkillSynth는 실행 궤적의 다양성(diversity)에 초점을 맞춥니다.
  • 기술 그래프에서 샘플링된 경로를 기반으로 작업을 합성함으로써, 필요한 최소한의 실행 궤적 다양성을 명시적으로 제어할 수 있습니다.
  • 제안된 프레임워크는 Terminal-Bench 실험을 통해 효과성이 입증되었으며, 실제 에이전트 훈련에 활용되고 있습니다.

터미널 에이전트 (Terminal agents) 는 자율적인 커맨드 라인 실행에 있어 강력한 잠재력을 보여주었으나, 그 훈련은 고품질이고 다양한 실행 궤적 (execution trajectories) 의 부족으로 인해 제한받고 있습니다. 기존 접근법들은 이 병목 현상을 완화하기 위해 궤적 샘플링을 위한 대규모 터미널 작업 인스턴스를 합성하는 데 중점을 둡니다. 그러나 이러한 방법들은 주로 작업의 수를 확장하는 데 집중하면서도, 에이전트가 훈련 과정에서 실제로 경험하는 실행 궤적의 다양성에 대한 통제를 제한적으로만 제공합니다. 본 논문에서는 시나리오 매개 (scenario-mediated) 기술 그래프 (skill graph) 를 기반으로 구축된 터미널 작업 합성을 위한 자동화 프레임워크인 SkillSynth 를 제시합니다. SkillSynth 는 먼저 대규모 기술 그래프를 구성하는데, 이 과정에서 시나리오가 다양한 커맨드 라인 기술을 연결하는 중간 전환 노드 역할을 합니다. 이어 이 그래프에서 실제 워크플로우의 추상화로 간주되는 경로 (paths) 를 샘플링한 후, 다중 에이전트 하네스 (multi-agent harness) 를 사용하여 이를 실행 가능한 작업 인스턴스로 구체화합니다. 그래프에서 샘플링된 워크플로우 경로를 기반으로 작업 합성을 수행함으로써, SkillSynth 는 합성된 작업을 해결하기 위해 필요한 최소 실행 궤적의 다양성을 명시적으로 제어합니다. Terminal-Bench 에서 진행된 실험은 SkillSynth 의 효과성을 입증하였습니다. 또한, SkillSynth 로 합성된 작업 인스턴트는 Hy3 Preview 의 훈련에 채택되어 터미널 기반 환경에서의 에이전트 능력 향상에 기여하고 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0