arXiv논문2026. 06. 03. 11:31

EvoDS: 기술 학습 및 컨텍스트 관리를 통한 자기 진화형 자율 데이터 과학 에이전트

요약

EvoDS는 자율 기술 습득(ASA)과 적응형 컨텍스트 압축(ACC)을 통해 스스로 진화하는 데이터 과학 에이전트입니다. 기존 에이전트의 한계인 정적 액션 세트와 장기 컨텍스트 관리 문제를 해결하여 성능을 대폭 향상했습니다.

핵심 포인트

자율 기술 습득(ASA)을 통한 실행 가능한 기술 합성 및 재사용
학습된 제어를 통한 적응형 컨텍스트 압축(ACC) 전략 도입
기존 오픈 소스 에이전트 대비 평균 28.9% 성능 향상
정보 병목 원리를 활용한 효율적인 컨텍스트 사용 증명

최근 거대 언어 모델 (Large Language Model, LLM) 에이전트의 발전은 자동화된 데이터 과학 분야에서 유망한 진보를 가능하게 했습니다. 그러나 기존 방식들은 정적인 액션 세트 (static action sets)와 원칙적인 장기 컨텍스트 관리 (long-horizon context management)의 부재로 인해 근본적인 한계를 가지고 있으며, 이는 작업 전반에 걸쳐 재사용 가능한 경험을 축적하고 다단계의 반복적인 데이터 과학 파이프라인 (pipelines)에서 안정적으로 작동하는 능력을 저해합니다. 이러한 과제를 해결하기 위해, 우리는 에이전트 강화학습 (agentic reinforcement learning)을 통해 기술을 확장하고 장기 컨텍스트를 적응적으로 관리하는 법을 배우는 자기 진화형 자율 데이터 과학 에이전트인 EvoDS를 소개합니다. 구체적으로, EvoDS는 두 가지 핵심 전략을 도입합니다: (1) 에이전트가 실행 가능한 기술을 합성, 검증 및 재사용할 수 있도록 하는 자율 기술 습득 (Autonomous Skill Acquisition, ASA) 메커니즘, 그리고 (2) 컨텍스트 관리를 수동적인 절단 (passive truncation)이 아닌 학습된 제어 문제로 취급하는 적응형 컨텍스트 압축 (Adaptive Context Compression, ACC) 전략입니다. 이러한 전략들은 2단계 멀티 에이전트 학습 체계 내에서 조율되어, EvoDS가 시간이 지남에 따라 자율적으로 개선될 수 있도록 합니다. 이론적으로, 우리는 EvoDS의 계층적 설계가 도구 선택 오류 (tool-selection error)를 줄이며, 그 최적화 목표가 정보 병목 원리 (information bottleneck principle)와 일치하여 효율적인 컨텍스트 사용을 보장함을 증명합니다. 실증적으로, EvoDS는 토큰 초과 실패 (out-of-token failures)를 제거하는 동시에 네 가지 다양한 벤치마크에서 최첨단 오픈 소스 데이터 과학 에이전트들보다 평균 28.9% 더 나은 성능을 보여주었습니다. 우리의 코드와 데이터는 https://github.com/usail-hkust/EvoDS 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

EvoDS: 기술 학습 및 컨텍스트 관리를 통한 자기 진화형 자율 데이터 과학 에이전트

요약

핵심 포인트

댓글