본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 17:34

MEMCoder: 사내 라이브러리를 위한 다차원 진화형 메모리 기반 코드 생성

요약

MEMCoder는 사내 전용 라이브러리에 의존하는 기업 환경에서 LLM의 코드 생성 성능 저하 문제를 해결하기 위해 제안된 새로운 프레임워크입니다. 기존 RAG 시스템이 제공하는 정적 문서만으로는 API 간 작업 수준 조정 패턴이나 경계 조건에 대한 지식 공백을 메우기 어렵다는 한계를 극복합니다. MEMCoder는 모델 자체의 문제 해결 과정에서 얻은 교훈을 포착하고 진화시키는 '다차원 진화형 메모리'를 도입하며, 자동화된 폐쇄 루프(automated closed loop)를 통해 지식을 동적으로 업데이트하여 높은 도메인 특화 적응력을 보여줍니다.

핵심 포인트

  • 사내 라이브러리 환경에서 LLM의 코드 생성 성능 저하 문제를 해결하는 것이 핵심 목표입니다.
  • 기존 RAG 시스템은 정적 문서에 의존하여 API 간 작업 흐름이나 경계 조건 같은 깊이 있는 지식 공백을 메우지 못합니다.
  • MEMCoder는 모델의 문제 해결 과정(성공/실패)에서 얻은 교훈을 포착하는 '다차원 진화형 메모리'를 사용합니다.
  • 자동화된 폐쇄 루프(automated closed loop)를 통해 실행 피드백 기반으로 지식을 지속적으로 업데이트하고 개선합니다.
  • 벤치마크 평가 결과, MEMCoder는 기존 RAG 시스템 대비 평균 절대 pass@1 점수에서 16.31%의 향상을 입증했습니다.

대규모 언어 모델 (LLMs) 은 일반적인 코드 생성에서 뛰어난 성능을 보이지만, 공개 사전 학습 코퍼스에 없는 사내 전용 라이브러리에 의존하는 기업 환경에서는 성능이 급격히 떨어집니다. 검색 증강 생성 (RAG) 은 정적 API 문서를 제공함으로써 훈련 불필요한 대안을 제시하지만, 우리는 이러한 문서가 일반적으로 고립된 정의만 제공하여 근본적인 지식 공백을 남긴다는 점을 발견했습니다. 구체적으로 LLM 은 API 간의 작업 수준 조정 패턴 부족과 파라미터 제약 및 경계 조건에 대한 API 수준의 오해로 인해 어려움을 겪습니다. 이를 해결하기 위해 우리는 두 차원을 아우르는 사용 가이드라인 (Usage Guidelines) 을 자율적으로 축적하고 진화시킬 수 있는 새로운 프레임워크인 MEMCoder 를 제안합니다. MEMCoder 는 모델의 자체 문제 해결 궤적에서 추출된 교훈을 포착하는 다차원 진화형 메모리 (Multi-dimensional Evolving Memory) 를 도입합니다. 추론 단계에서는 정적 문서와 관련 역사적 가이드라인을 컨텍스트에 주입하기 위해 이중 출처 검색 메커니즘 (dual-source retrieval mechanism) 을 사용합니다. 이 프레임워크는 객관적인 실행 피드백을 사용하여 성공과 실패를 성찰하고, 지식 충돌을 해결하며, 메모리를 동적으로 업데이트함으로써 자동화된 폐쇄 루프 (automated closed loop) 로 작동합니다. NdonnxEval 및 NumbaEval 벤치마크에 대한 광범위한 평가에서 MEMCoder 가 기존 RAG 시스템을 현저히 향상시켜 평균 절대 pass@1 점수 향상이 16.31% 에 달함을 입증했습니다. 또한, MEMCoder 는 기존 메모리 기반 지속 학습 (continual learning) 방법과 비교하여 훨씬 뛰어난 도메인 특화 적응력을 보입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
6

댓글

0