tap: 이기종 LLM 에이전트 협업을 위한 파일 기반 프로토콜
요약
이기종 LLM 에이전트 간의 협업을 위해 파일 기반 프로토콜인 tap을 제안합니다. 공유 런타임 없이도 Claude와 Codex가 마크다운 파일과 실시간 알림을 통해 코드베이스 상에서 협업할 수 있도록 설계되었습니다.
핵심 포인트
- 파일 우선 설계(file-first design)를 통해 메시지 보존성 확보
- 실시간 알림과 파일 검사 경로를 결합한 하이브리드 통신 방식
- 이기종 모델(Claude, Codex) 간의 협업 시 리뷰 관점 확대 효과
- npm 패키지 @hua-labs/tap을 통한 오픈 소스 배포
기존의 멀티 에이전트 소프트웨어 개발 시스템들은 역할 기반 협업(role-based collaboration) 및 자동 코드 리뷰(automated code review)를 포함하여 다양한 형태의 에이전트 협업 방식을 제안해 왔습니다. 그러나 많은 시스템이 공통된 런타임(runtime), 중앙 대화 서버, 또는 동일한 API 제품군을 가정합니다. 이러한 가정하에서는 서로 다른 벤더의 LLM 에이전트들이 공유 코드베이스(codebase) 상에서 개발 및 리뷰 작업을 분담하면서, 각자의 실행 환경(execution environment)으로부터 직접 메시지를 쉽게 교환할 수 없습니다. 본 논문은 Claude (Anthropic)와 Codex (OpenAI)가 공유 메모리나 동일한 런타임 없이도 하나의 코드베이스에서 협업할 수 있도록 하는 파일 기반 협업 프로토콜인 tap을 제시합니다. tap의 핵심은 메타데이터를 포함한 마크다운(markdown) 파일을 원본 메시지로 보존하는 파일 우선 설계(file-first design), 파일 검사 경로(파일 통신, Tier 1)를 Claude 및 Codex를 위한 실시간 알림 경로(실시간 통신, Tier 2)와 결합하는 것, 그리고 별도의 git 워크트리(git worktrees)를 통해 작업을 격리하는 것입니다. 실시간 알림이 실패하거나 수신자가 재시작되더라도 메시지 파일은 계속 사용 가능하며 동일한 콘텐츠를 다시 검사할 수 있습니다. tap을 사용하여 스스로를 개발하고 리뷰한 27일간의 37세대 자가 적용 운영 과정에서, 우리는 209개의 tap 관련 풀 리퀘스트(pull requests)와 717개의 운영 아티팩트(operational artifacts)를 수집했습니다. 375개의 리뷰 아티팩트를 분석한 결과, 최소 하나 이상의 결함(defect) 또는 변경 요청을 기록한 리뷰의 비율은 이기종 모델 쌍(heterogeneous model pairs)의 경우 69.8%, 동종 모델 쌍(homogeneous model pairs)의 경우 53.1%였습니다. 이러한 결과는 파일 기반 메시지 보존과 실시간 알림을 결합한 tap이 실제 프로덕션 저장소(production repository)에서 작동하며, 이기종 모델과 실행 환경을 결합하는 것이 리뷰 관점을 넓힐 수 있음을 보여줍니다. tap은 오픈 소스 npm 패키지 @hua-labs/tap (v0.5.2)로 배포됩니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기