본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 12. 00:05

ADKO: 에이전트 기반 분산 지식 최적화

요약

ADKO는 자율 에이전트들이 협력적으로 블랙박스 최적화를 수행하기 위한 프레임워크입니다. 이 프레임워크는 샘플 효율성, 개인 정보 보호를 유지하면서 지식 토큰(knowledge tokens)이라는 압축된 요약본을 통해 통신합니다. ADKO는 가우시안 프로세스(GP), 베이지안 최적화, 언어 모델(LM) 기반 발견을 통합하고, 정보 손실과 근사 오차에 대한 이론적 분석을 제공하여 분산 환경에서의 지식 공유 및 최적화를 개선합니다.

핵심 포인트

  • ADKO는 자율 에이전트 간의 협업적인 블랙박스 최적화 프레임워크를 제시합니다.
  • 개인 정보 보호와 통신 효율성을 위해 원시 데이터 대신 '지식 토큰'을 사용합니다.
  • 지식 토큰은 방향 신호, 이점 점수, LM 통찰력을 포함하는 압축되고 손실이 있는 요약본입니다.
  • 논문은 지식 공유 과정에서 발생하는 정보 손실과 근사 오차에 대한 이론적 분석(dual information loss)을 제공합니다.
  • 메모리 제약을 고려하여 충실도 인식 토큰 가지치기 기법을 제안했습니다.

본 논문에서는 자율 에이전트 간의 협업적인 블랙박스 최적화를 위한 프레임워크인 Agentic Decentralized Knowledge Optimization (ADKO)을 제시합니다. ADKO는 샘플 효율성, 개인 정보 보호, 이종 목적 함수 처리 및 통신 효율성을 달성합니다. 각 에이전트는 로컬 데이터로 학습된 사설 가우시안 프로세스(GP) 서로게이트를 유지하며, 원시 데이터를 공유하거나 모델 매개변수를 공유하지 않고 지식 토큰(knowledge tokens)—방향 신호, 이점 점수(advantage scores), 그리고 선택적 언어 모델(LM) 통찰력을 포함하는 압축되고 손실이 있는 요약본—을 통해서만 통신합니다. ADKO는 GP-Upper Confidence Bound (GP-UCB), 병렬 베이지안 최적화, 분산 학습 및 LM 기반 발견을 통합합니다. 우리는 이중 정보 손실(dual information loss)에 대한 최초의 형식 분석을 제공하는데, 이는 상호 정보 기반 충실도(mutual-information-based fidelity)로 정량화된 토큰 압축과 편향(bias) 및 확률적 노이즈(stochastic noise)로 분해된 LM 근사 오차입니다. 우리의 주요 결과는 누적 후회(cumulative regret)가 GP 오차, LM 편향, LM 노이즈 및 압축 손실로 분해되며, 준선형 후회를 위한 필요충분조건을 제시한다는 것입니다. 또한 메모리 예산 하에서 고정보 토큰을 보존하기 위해 충실도 인식 토큰 가지치기(fidelity-aware token pruning)를 제안합니다. 신경 구조 탐색 및 과학적 발견에 대한 실험은 이론을 검증하고 강력한 베이스라인 대비 일관된 개선을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0