본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 05. 15:45

폐쇄 루프 메모리 최적화를 통한 소프트웨어 엔지니어링 강화

요약

소프트웨어 엔지니어링(SE) 에이전트의 에피소드 중심적 한계를 극복하기 위한 폐쇄 루프 메모리 최적화 프레임워크 MemOp을 제안합니다. MemOp은 메모리 효용성을 작업 불가지론적인 벤치마크로 확립하여 에이전트의 성능과 효율성을 동시에 개선합니다.

핵심 포인트

  • SE 에이전트의 경험 유지 및 재사용 문제 해결
  • 작업 불가지론적 메모리 효용성 평가 벤치마크 도입
  • 성공률 최대 5.25% 및 해결 효율성 4.63% 향상
  • 계산 비용 9.79% 이상 절감 달성

대규모 언어 모델 (LLMs)은 복잡한 코드베이스를 탐색하고 실제 문제를 해결할 수 있는 강력한 소프트웨어 엔지니어링 (SE) 에이전트를 가능하게 했습니다. 그러나 이러한 에이전트들은 근본적으로 에피소드 중심적 (episodic)입니다. 즉, 작업 전반에 걸쳐 경험을 유지, 개선 및 재사용하지 못하며, 문맥을 처음부터 반복적으로 재구성하고 유사한 실수를 되풀이합니다. 메모리 지원이 있더라도, 원칙적이고 작업 불가지론적인 (task-agnostic) extit{메모리 효용성 (memory utility)}의 부재에 대한 해결책을 제공하지 못하며, 이로 인해 에이전트와 환경 전반에 걸쳐 엄격하게 평가하거나 일반화하기 어렵습니다. 이러한 한계를 해결하기 위해, 우리는 SE 에이전트의 메모리 증강을 위한 폐쇄 루프 (closed-loop) 프레임워크인 ext{ extsf{MemOp}}을 소개합니다. ext{ extsf{MemOp}}은 메모리 효용성을 extit{검증된 다운스트림 영향 (validated downstream impact)}에 근거하게 하여, 효용성을 작업 불가지론적인 extbf{평가 벤치마크 (evaluation benchmark)}이자 주석이 필요 없는 extbf{최적화 신호 (optimization signal)}로 확립합니다. extit{단일 에피소드 (single-episode)} 및 extit{교차 에피소드 (cross-episode)} 메모리 증강에 대한 상호 보완적인 평가를 통해, 결과는 ext{ extsf{MemOp}}이 다양한 환경에서 SE 에이전트를 일관되게 개선함을 보여줍니다. 구체적으로 성공률에서 최대 $\uparrow5.25%$, 해결 효율성에서 $\uparrow4.63%$의 절대적 이득을 달성하는 동시에, 계산 비용을 $\geq9.79%$ 이상 실질적으로 절감했습니다. 프로젝트 페이지: \href{https://xhguo7.github.io/MemOp/}{https://xhguo7.github.io/MemOp/}.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0