자율적 데이터 과학을 위한 지속 가능한 사례 기반 메모리 연구: 로컬 배포 가능한 소형 언어 모델(SLM)을 결합한 CBR 증강
요약
자율적 데이터 과학 에이전트의 세션 간 메모리 부족 문제를 해결하기 위해 CBR(사례 기반 추론)과 SLM을 결합한 연구를 제안합니다. Gemma 4 31B를 백본으로 사용하여 구조화된 사례 기록과 품질 필터링을 통해 에이전트의 추론 정확도와 안정성을 높였습니다.
핵심 포인트
- CBR 레이어를 통한 지속적인 세션 간 메모리 구현
- Gemma 4 31B를 활용한 로컬 배포형 SLM 에이전트 검증
- 코드 스냅샷과 메타데이터를 포함한 구조화된 사례 저장
- Kaggle 경진대회를 통한 높은 정확도 및 낮은 분산 입증
- 단순 복사가 아닌 개념적 가이드를 제공하는 재사용 메커니즘
대부분의 최고 성능을 자랑하는 자율적 데이터 과학 (autonomous data-science) 에이전트들은 프런티어 클라우드 모델 (frontier cloud models)에 의존하며, 세션 간 지속적인 메모리 (persistent, cross-session memory)가 부족합니다. 본 논문은 두 가지 미개척 영역을 다룹니다: (1) 기호적 사례 기록 (symbolic case records)과 실행 가능한 코드 산출물 (executable code artefacts)을 결합하여, 공식적으로 구조화되고 품질이 제어된 사례 기반 추론 (Case-Based Reasoning, CBR) 사례 기반 (case bases)의 활용 미비, (2) 로컬에 배포 가능한 에이전트 백본 (agent backbones)으로서 소형 언어 모델 (Small Language Models, SLMs)의 검증되지 않은 생존 가능성입니다. 우리는 Microsoft의 R&D-Agent 프레임워크에 지속적인 CBR 레이어를 통합하고, Gemma 4 31B Dense를 위한 맞춤형 백엔드를 갖춘 CBR 증강 R&D-Agent를 제시합니다. 이는 자율적 데이터 과학 에이전트 백본으로서 Gemma 4에 대한 최초의 공개된 엔드 투 엔드 (end-to-end) 평가입니다. CBR 레이어는 단일 환경 변수에 의해 토글되는 정밀한 서브클래스 (subclass)를 통해 R&D 루프의 세 가지 단계를 제어합니다. 사례들은 실행 가능한 코드 스냅샷과 품질 메타데이터를 포함하는 구조화된 기록으로 저장됩니다. 5단계 품질 필터와 휴리스틱 재사용 탐지 (heuristic reuse-detection) 메커니즘은 임베딩 유사도 (embedding similarity), 코드 지문 중첩 (code-fingerprint overlap), 주입 출처 (injection provenance)를 결합하여 지식 전이를 평가합니다. 두 개의 Kaggle 경진대회 (NOMAD 2018, Spaceship Titanic)에서 각각 8회의 개선 루프 동안 4개의 시드를 사용하여 평가한 결과, CBR은 Spaceship Titanic에서 CBR이 비활성화된 베이스라인보다 방향성 측면에서 더 높은 정확도를 달성하였으며 (0.8147 대 0.8098, d = -1.41), 분산 (variance)은 실질적으로 더 낮았습니다. 108회의 검색 이벤트에 걸친 휴리스틱 재사용 탐지는 높은 의미론적 관련성 (평균 임베딩 유사도 0.882)과 함께 가변적인 구조적 근접성 (평균 코드 지문 유사도 0.305)을 보여주었으며, 이는 코드를 그대로 복사하는 것이 아니라 개념적 가이드를 제공하는 것과 일치합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기