arXiv논문2026. 06. 09. 11:51

경험이 숙련도를 만든다: 자기 진화형 기술 메모리를 통한 일반화 가능한 의료 에이전트 추론 구현

요약

SkeMex는 모델 가중치 업데이트 없이 기술 기반 메모리를 통해 의료 에이전트를 개선하는 자기 진화 프레임워크입니다. 상호작용 궤적을 구조화된 기술로 증류하고, 환경 피드백을 통해 유용한 메모리를 선별적으로 관리하여 임상 추론 능력을 강화합니다.

핵심 포인트

모델 가중치 수정 없는 사후 배포형 자기 진화 프레임워크 제안
상호작용 데이터를 재사용 가능한 절차적 지식으로 증류
환경 피드백 기반의 가치 인식 검색 및 저장소 관리 메커니즘
다양한 모델 백본에 적용 가능한 일반화 및 전이 가능성 입증

의료 에이전트 (Medical agent) 시스템은 단순히 정적인 질의응답 (Question answering)을 넘어 상호작용적인 임상 의사 결정 (Clinical decision making)을 지원할 것이라는 기대가 점점 높아지고 있습니다. 이러한 환경에서 효과적인 에이전트는 진화하는 사례 전반에 걸쳐 이전의 경험을 재사용해야 하지만, 기존의 메모리 메커니즘 (Memory mechanisms)은 종종 중복되고 노이즈가 많으며 제어하기 어려운 가공되지 않은 과거의 흔적들을 그대로 유지합니다. 더 중요한 점은, 어떤 메모리가 미래의 추론에 진정으로 유용한지를 구분하는 경우가 드물다는 것입니다. 이는 장기적인 임상 추론 (Long-horizon clinical reasoning)을 위해 압축적이고 신뢰할 수 있는 경험을 축적하는 능력을 제한합니다.

이러한 격차를 해소하기 위해, 우리는 모델 가중치 (Model weights)를 업데이트하지 않고도 기술 기반 메모리 (Skill-based memory)를 통해 의료 에이전트를 개선하는 사후 배포형 자기 진화 프레임워크 (Post-deployment self-evolution framework)인 SkeMex를 제안합니다. SkeMex는 정보가 풍부한 상호작용 궤적 (Interaction trajectories)을 재사용 가능한 절차적 지식 (Procedural knowledge)을 인코딩하는 구조화된 기술 (Skills)로 증류 (Distill)하며, 이를 일반적, 작업 특정적, 그리고 액션 수준 (Action-level)의 경험을 아우르는 다중 분기 저장소 (Multi-branch repository)로 구성합니다. 어떤 메모리를 재사용하고 유지해야 하는지 결정하기 위해, SkeMex는 환경 피드백 (Environment feedback)으로부터 문맥 의존적 효용 (Context-dependent utility)을 추정하고, 이를 가치 인식 검색 (Value-aware retrieval) 및 저장소 관리 (Repository governance)를 안내하는 데 사용합니다. 폐쇄 루프 형태의 "읽기--쓰기--평가--관리 (Read--Write--Assess--Govern)" 라이프사이클은 새로운 기술을 작성하고, 효용을 업데이트하며, 유용한 메모리를 승격시키고, 해로운 항목을 제거함으로써 지속적인 진화를 더욱 지원합니다.

다양한 임상 작업에 걸친 실험 결과, SkeMex는 오프라인 및 온라인 설정 모두에서 대표적인 메모리 기반 에이전트들을 일관되게 능가함을 보여주었습니다. 또한 SkeMex는 다양한 모델 백본 (Model backbones)에 걸쳐 일반화가 가능하며 전이 가능한 기술 메모리 (Transferable skill memory)를 지원합니다. 모든 데이터와 코드는 공개적으로 배포될 예정입니다.

AI 자동 생성 콘텐츠

원문 바로가기

경험이 숙련도를 만든다: 자기 진화형 기술 메모리를 통한 일반화 가능한 의료 에이전트 추론 구현

요약

핵심 포인트

댓글