arXiv논문2026. 06. 19. 10:49

ScaffoldAgent: 개방형 심층 연구를 위한 효용 가이드 기반 동적 개요 최적화

요약

ScaffoldAgent는 개방형 심층 연구(OEDR)를 위해 개요를 동적으로 최적화하는 프레임워크입니다. 효용 가이드 피드백을 통해 개요를 확장, 축소, 수정하며 검색 이득과 구조적 일관성을 극대화합니다.

핵심 포인트

개요를 고정하지 않고 동적으로 업데이트하여 스캐폴드 표류 문제 해결
확장, 축소, 수정의 세 가지 연산을 통한 구조화된 의사결정 모델링
효용 가이드 메커니즘을 통한 노드 선택 및 연산 스케줄링 최적화
DeepResearch Bench 실험을 통해 장문 보고서 생성 및 사실적 근거 능력 입증

개방형 심층 연구 (Open-ended deep research, OEDR)는 시스템이 다회차 검색 (multi-round retrieval)을 통해 지식을 습득하고 일관된 장문 보고서를 생성할 것을 요구합니다. 개요 (outline)는 검색, 증거 구성, 그리고 생성을 조율하는 구조적 스캐폴드 (scaffold)로서 핵심적인 역할을 수행합니다. 그러나 기존 방법들은 글을 쓰기 전에 개요를 고정하거나 국소적 휴리스틱 (local heuristics)으로 이를 개선하는데, 이는 지속적인 정보 축적 상황에서 스캐폴드 표류 (scaffold drift)를 초래하고 개요 수정에 대한 피드백이 지연되는 문제를 야기합니다. 우리는 OEDR를 위한 효용 가이드 기반 동적 개요 최적화 프레임워크인 ScaffoldAgent를 제안합니다. ScaffoldAgent는 개요의 진화를 확장 (Expansion), 축소 (Contraction), 수정 (Revision)이라는 세 가지 연산이 포함된 구조화된 의사결정 과정 (structured decision process)으로 모델링하여, 보고서 스캐폴드에 대한 제어된 업데이트를 가능하게 합니다. 나아가 검색 이득 (retrieval gain), 구조적 일관성 (structural coherence), 그리고 시도 생성 품질 (trial-generation quality)로부터 각 개요 연산의 다운스트림 가치를 추정하는 효용 가이드 피드백 메커니즘을 도입합니다. 결과적으로 생성된 효용 신호 (utility signal)는 추론 과정 중 노드 선택, 연산 스케줄링, 그리고 종료를 가이드합니다. DeepResearch Bench 및 DeepResearch Gym에 대한 실험 결과, ScaffoldAgent는 기존의 심층 연구 에이전트들에 비해 장문 보고서 생성 및 사실적 근거 제시 (factual grounding) 능력을 일관되게 향상시킴을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

ScaffoldAgent: 개방형 심층 연구를 위한 효용 가이드 기반 동적 개요 최적화

요약

핵심 포인트

댓글