데이터 인텔리전스 에이전트 (Data Intelligence Agents): 자율 코딩 에이전트 (ACAs)를 통한 기업 데이터의 해석
요약
자율 코딩 에이전트(ACA)를 활용하여 기업 데이터 워크플로우를 자동화하는 데이터 인텔리전스 에이전트(DIA) 시스템을 제안합니다. 데이터 해석기, 스키마 생성기, 쿼리 생성기 세 가지 에이전트가 공유 메모리를 통해 협업하며, SQL 벤치마크에서 기존 최고 성능을 능가하는 결과를 입증했습니다.
핵심 포인트
- 자율 코딩 에이전트(ACA)를 통한 데이터 워크플로우 병목 현상 해결
- 데이터 해석, 스키마 생성, 쿼리 생성의 3단계 에이전트 시스템 구축
- 공유 메모리 활용을 통한 에이전트 간 협업 및 경험 재사용
- 7개 SQL 벤치마크에서 기존 SOTA 성능과 대등하거나 능가하는 결과 달성
운영 데이터 통합은 기업 데이터를 협력적으로 발견, 구조화 및 쿼리해야 하는 데이터 소유자, 엔지니어, 분석가 사이의 반복적이고 손실이 발생하는 인수인계로 인해 병목 현상이 발생합니다. 우리는 자율 코딩 에이전트 (Autonomous Coding Agents, ACAs)를 일급 추상화 (first-class abstraction)로 취급하여 이 워크플로우를 압축하는 세 가지 에이전트 (데이터 해석기 (Data Interpreter), 스키마 생성기 (Schema Creator), 쿼리 생성기 (Query Generator)) 시스템인 데이터 인텔리전스 에이전트 (Data Intelligence Agents, DIA)를 제시합니다. 이 에이전트들은 텍스트를 출력하는 대신 구체적인 산출물 (artifacts)을 생성, 실행, 검증 및 수정하며, 경험 재사용을 위해 공유 메모리 (shared memory)를 활용하고, 각 단계를 도메인 전문가가 검토할 수 있도록 노출합니다. DIA는 기업 고객을 위해 실제 운영 환경에 배포되었습니다. 우리는 쿼리 생성기 (Query Generator)를 심층적으로 연구하고, 4개의 작업 범주와 4개의 방언 (dialects)을 아우르는 7개의 SQL 벤치마크에서 완전 자율 모드로 평가했습니다. 그 결과, 7개 벤치마크 모두에서 기존에 발표된 최고 결과와 일치하거나 이를 능가하였으며, 이는 ACAs와 공유 메모리를 기반으로 실행에 근거하여 구축된 아키텍처가 자연어 지시사항에 국한된 적응만으로 데이터 인텔리전스 워크로드 전반에 걸쳐 일반화될 수 있음을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기