MMoA: 기억 기반 혼합 에이전트(Mixture-of-Agent)를 위한 순환 구조의 AI 에이전트 프레임워크

혼합 에이전트 (Mixture-of-Agents, MoA) 프레임워크는 여러 에이전트의 출력을 집계함으로써 대규모 언어 모델 (Large Language Model, LLM)의 성능을 향상시키는 유망한 가능성을 보여주었습니다. 그러나 기존의 MoA 시스템은 집계 계층(aggregation layers) 전반에 걸친 시간적 및 문맥적 의존성을 완전히 포착하지 못하는 정적 라우터 (static routers)에 의존하는 경우가 많습니다. 이러한 한계를 해결하기 위해, 우리는 에이전트 선택 과정에 LSTM 기반 게이팅 (gating)을 통합한 순환 MoA 아키텍처인 MMoA를 제안합니다. 순환 라우터 (recurrence router)는 현재 입력과 과거의 라우팅 결정 모두를 기반으로 에이전트의 기여도를 적응적으로 조절하여, 더욱 문맥을 인식하는 집계를 가능하게 합니다. 우리는 AlpacaEval 2.0, MT-Bench, Arena-Hard를 포함한 표준 지시 이행 (instruction-following) 벤치마크에서 MMoA를 평가합니다. 결과에 따르면 MMoA는 더 적은 수의 에이전트를 동적으로 활성화함으로써 계산 오버헤드 (computational overhead)를 줄이는 동시에 기존 MoA와 대등한 정확도를 달성합니다. 예를 들어, AlpacaEval 2.0에서 MMoA는 MoA의 59.8%와 비교하여 58.0%의 승률을 기록하면서도 실행 시간 효율성을 최대 4.6%까지 향상시켰습니다. 이러한 결과는 MMoA가 적응형 다중 에이전트 LLM 시스템을 위한 확장 가능하고 효율적인 접근 방식을 제공함을 시사합니다.

Insights

MMoA: 기억 기반 혼합 에이전트(Mixture-of-Agent)를 위한 순환 구조의 AI 에이전트 프레임워크

요약

핵심 포인트

댓글

선형화의 핵심: 분석 기반 트랜스포머 선형화

Co-LMLM: 연속 질의 기반 제한 메모리 언어 모델

SkillCenter: 자율 AI 에이전트를 위한 대규모 출처 기반 스킬 라이브러리

OpenAI, GPT‑Live 공개

선형화의 핵심: 분석 기반 트랜스포머 선형화

Co-LMLM: 연속 질의 기반 제한 메모리 언어 모델

SkillCenter: 자율 AI 에이전트를 위한 대규모 출처 기반 스킬 라이브러리

OpenAI, GPT‑Live 공개