arXiv논문2026. 06. 15. 11:41

능동적 LLM 에이전트를 위한 커뮤니케이션 정책 진화 (Communication Policy Evolution)

요약

LLM 에이전트와 사용자 간의 정보 격차를 줄이기 위한 커뮤니케이션 정책을 연구한 논문입니다. 텍스트와 UI의 장점을 결합한 하이브리드 방식과 프롬프트 개선을 통해 정책을 스스로 발전시키는 CPE 프레임워크를 제안합니다.

핵심 포인트

텍스트는 작업 성능을, UI는 응답 품질과 페르소나 준수를 향상시킴
모델 수정 없이 프롬프트 개선만으로 성능을 높이는 CPE 프레임워크 제안
사용자-에이전트 및 플래너-실행자 설정에서의 정보 비대칭성 분석
커뮤니케이션 행동이 에이전트 설계의 핵심 요소임을 입증

LLM 에이전트(LLM agents)는 자율 시스템으로 빠르게 진화해 왔으나, 사용자와 에이전트 사이에는 지속적인 정보 격차가 존재합니다. 즉, 커뮤니케이션은 비용이 많이 들며, 사용자의 동일한 선호도는 정보 교환을 더욱 제한합니다. 에이전트가 다양한 모달리티(modalities)를 통해 어떻게 커뮤니케이션해야 하는지 조사하기 위해, 본 논문은 커뮤니케이션 정책(Communication Policy)을 공식화하고, 텍스트 및 UI 기반 정책을 수립한 후, 다양한 환경, 페르소나(personas), 모델 조합에 걸쳐 커뮤니케이션 정책을 평가합니다. 능동적 에이전트를 위한 정보 비대칭성을 구축하기 위해, 우리는 상호 보완적인 두 가지 설정인 사용자-에이전트(User-Agent)와 플래너-실행자(Planner-Executor)를 설정했습니다. 실험 결과, 상호작용 채널 간의 상호 보완적인 강점이 드러났습니다. 텍스트 기반 상호작용은 종종 작업 성능(task performance)을 촉진하는 반면, 구조화된 UI는 에이전트의 응답 품질과 페르소나 준수(persona compliance)를 향상시킵니다. 이에 착안하여, 이러한 장점들을 결합한 하이브리드 방법을 사용합니다. 우리는 더 나아가 롤아웃(rollout)과 프롬프트 수준의 진화(prompt-level evolving)를 통해 커뮤니케이션 정책을 개선하는 자가 진화 프레임워크인 커뮤니케이션 정책 진화(Communication Policy Evolution, CPE)를 제안합니다. 모델 수정 없이도, CPE는 프롬프트 개선(prompt refinement)만으로 여러 설정에서 최고의 작업 성공률을 달성합니다. 우리의 연구 결과는 커뮤니케이션 행동이 LLM 에이전트를 위한 매우 중요하지만 아직 충분히 탐구되지 않은 설계 차원임을 확인시켜 줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

능동적 LLM 에이전트를 위한 커뮤니케이션 정책 진화 (Communication Policy Evolution)

요약

핵심 포인트

댓글