Reddit요약2026. 05. 27. 04:16

로컬 에이전트를 자기 최적화(Self-optimizing) 에이전트로 전환하기

요약

로컬 LLM 채팅 로그를 분석하여 스스로 성능을 개선하는 자기 최적화(Self-optimizing) 에이전트 파이프라인을 소개합니다. 성찰 및 재작성 단계를 통해 추출된 교훈을 시스템 프롬프트에 자동으로 반영하여 에이전트의 능력을 지속적으로 향상시킵니다.

저는 벤치마크 리더보드(TerminalBench) 순위를 높이기 위해 자기 최적화(Self-optimizing) 에이전트 파이프라인을 실험하고 있었습니다.

10개의 태스크로 구성된 하위 집합에서 성능을 약 30%에서 약 90%까지 끌어올렸습니다.

이 루프가 효과가 있었기에, 저는 다음과 같은 질문을 던졌습니다: '동일한 성찰 및 재작성(reflect-and-rewrite) 단계를 벤치마크 대신 일상적인 채팅에 지속적으로 적용할 수 있을까?'

작동 방식

로컬 LLM(Large Language Model)과의 모든 채팅은 작은 프록시(Proxy)를 거치며 로그(Log)로 기록됩니다.
autoswarm reflect는 동일한 로컬 모델이 해당 로그를 검토하여 구체적인 교훈을 추출(Distill)하고, 이를 skills.yaml에 기록하도록 합니다.
추출된 교훈은 향후 채팅의 시스템 프롬프트(System Prompt)에 자동으로 주입됩니다.

실행 방법 (LM Studio 경로)

pip install -e .
autoswarm doctor    # LM Studio에 접속 가능한지 확인
autoswarm start     # 업스트림(Upstream)과 모델을 자동 감지하고 :8080 포트에서 대기

저는 자기 최적화 에이전트라는 아이디어에 진심으로 매료되었으며, 그곳에는 발견해야 할 더 큰 무언가가 있다고 믿습니다.

그렇긴 하지만, 이것은 단순한 취미 프로젝트이며 저는 여전히 실험 중입니다. 여러분의 피드백을 환영합니다!

저는 이 프로젝트를 활발히 진행 중이므로, 최신 소식을 받으시려면 ⭐ 리포지토리를 스타(Star) 해주세요.

AI 자동 생성 콘텐츠