로컬 에이전트를 자기 최적화(Self-optimizing) 에이전트로 전환하기
요약
로컬 LLM 채팅 로그를 분석하여 스스로 성능을 개선하는 자기 최적화(Self-optimizing) 에이전트 파이프라인을 소개합니다. 성찰 및 재작성 단계를 통해 추출된 교훈을 시스템 프롬프트에 자동으로 반영하여 에이전트의 능력을 지속적으로 향상시킵니다.
핵심 포인트
- 채팅 로그를 검토하여 구체적인 교훈을 추출하는 reflect-and-rewrite 방식 적용
- 추출된 지식을 skills.yaml에 기록하고 시스템 프롬프트에 자동 주입
- LM Studio와 연동하여 로컬 환경에서 손쉽게 실행 가능
- 벤치마크 성능을 30%에서 90%까지 대폭 향상시킨 실험적 접근
저는 벤치마크 리더보드(TerminalBench) 순위를 높이기 위해 자기 최적화(Self-optimizing) 에이전트 파이프라인을 실험하고 있었습니다.
10개의 태스크로 구성된 하위 집합에서 성능을 약 30%에서 약 90%까지 끌어올렸습니다.
이 루프가 효과가 있었기에, 저는 다음과 같은 질문을 던졌습니다: '동일한 성찰 및 재작성(reflect-and-rewrite) 단계를 벤치마크 대신 일상적인 채팅에 지속적으로 적용할 수 있을까?'
작동 방식
- 로컬 LLM(Large Language Model)과의 모든 채팅은 작은 프록시(Proxy)를 거치며 로그(Log)로 기록됩니다.
autoswarm reflect는 동일한 로컬 모델이 해당 로그를 검토하여 구체적인 교훈을 추출(Distill)하고, 이를skills.yaml에 기록하도록 합니다.- 추출된 교훈은 향후 채팅의 시스템 프롬프트(System Prompt)에 자동으로 주입됩니다.
실행 방법 (LM Studio 경로)
- LM Studio의 로컬 서버를 시작하고 모델을 로드합니다.
pip install -e .
autoswarm doctor # LM Studio에 접속 가능한지 확인
autoswarm start # 업스트림(Upstream)과 모델을 자동 감지하고 :8080 포트에서 대기
저는 자기 최적화 에이전트라는 아이디어에 진심으로 매료되었으며, 그곳에는 발견해야 할 더 큰 무언가가 있다고 믿습니다.
그렇긴 하지만, 이것은 단순한 취미 프로젝트이며 저는 여전히 실험 중입니다. 여러분의 피드백을 환영합니다!
링크: https://github.com/arteemg/autoswarm
저는 이 프로젝트를 활발히 진행 중이므로, 최신 소식을 받으시려면 ⭐ 리포지토리를 스타(Star) 해주세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기