ProfiliTable: 에이전트 워크플로우를 통한 프로파일링 기반 테이블 데이터 처리
요약
ProfiliTable은 데이터 클리닝, 변환, 증강 등 오류 발생 가능성이 높은 테이블 처리 작업을 자동화하기 위해 제안된 자율적인 다중 에이전트 프레임워크입니다. 이 프레임워크는 동적 프로파일링을 핵심으로 사용하여 상호작용적 탐색과 피드백 기반 정제를 통해 통합 실행 컨텍스트를 구축하고 반복적으로 개선합니다. ProfiliTable은 Profiler, Generator, Evaluator-Summarizer의 세 가지 구성 요소를 결합하여 복잡한 다단계 테이블 작업에서 높은 신뢰성과 성능을 입증했습니다.
핵심 포인트
- ProfiliTable은 데이터 파이프라인의 핵심 단계인 테이블 처리를 자동화하는 다중 에이전트 프레임워크이다.
- 동적 프로파일링(dynamic profiling)을 중심으로 설계되어, 모호한 사용자 의도를 견고하고 의미론적으로 정확한 코드로 변환한다.
- 시스템은 Profiler (데이터 탐색), Generator (작업 인식 코드 합성), Evaluator-Summarizer (폐쇄 루프 정제)의 세 가지 구성 요소를 통합하여 작동한다.
- 다양한 벤치마크 실험을 통해 ProfiliTable이 기존 강력한 기준선(strong baselines)보다 일관되게 우수한 성능을 보였다.
테이블 처리는 클리닝, 변환(transformation), 증강(augmentation), 매칭을 포함하며 실제 데이터 파이프라인에서 기초적이지만 오류가 발생하기 쉬운 단계입니다. 최근 LLM 기반 접근 방식은 이러한 작업을 자동화하는 데 유망함을 보여주지만, 모호한 지침, 복잡한 작업 구조, 그리고 구조화된 피드백의 부족으로 인해 실질적인 어려움을 겪는 경우가 많으며, 그 결과 구문적으로는 정확하지만 의미론적으로 결함이 있는 코드를 생성합니다. 이러한 문제들을 해결하기 위해, 우리는 동적 프로파일링(dynamic profiling)을 중심으로 하는 자율적인 다중 에이전트 프레임워크인 ProfiliTable을 제안합니다. 이 프레임워크는 상호작용적 탐색(interactive exploration), 지식 증강 합성(knowledge-augmented synthesis), 그리고 피드백 기반 정제(feedback-driven refinement)를 통해 통합 실행 컨텍스트를 구축하고 반복적으로 개선합니다. ProfiliTable은 (i) 의미론적 이해를 구축하기 위해 ReAct 스타일의 데이터 탐색을 수행하는 Profiler, (ii) 작업 인식 코드(task-aware code)를 합성하기 위해 큐레이션된 연산자(operators)를 검색하는 Generator, 그리고 (iii) 실행 점수와 진단 통찰력을 주입하여 폐쇄 루프 정제(closed-loop refinement)를 가능하게 하는 Evaluator-Summarizer 루프를 통합합니다. 18가지 테이블 작업 유형을 포괄하는 다양한 벤치마크에 대한 광범위한 실험은 ProfiliTable이 강력한 기준선(strong baselines)보다 일관되게 우수함을 입증하며, 특히 복잡한 다단계 시나리오에서 그러합니다. 이러한 결과는 모호한 사용자 의도를 견고하고 거버넌스 준수적인 테이블 변환으로 신뢰성 있게 번역하는 데 있어 동적 프로파일링의 중요한 역할을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기