TreeAgent: 컴파일된 전문가 규칙과 시각-언어 모델(VLM)을 통한 임업 자동 편향 레이블링을 위한 일반화 가능한 멀티 에이전트
요약
전문가 결정 트리와 시각-언어 모델(VLM)을 결합한 멀티 에이전트 시스템인 TreeAgent를 제안합니다. 이 시스템은 임업 데이터의 편향 레이블링 작업을 자동화하며, 기존 지도 학습 모델보다 높은 성능과 낮은 주석 비용을 보여줍니다.
핵심 포인트
- 전문가 결정 트리와 VLM을 오케스트레이션하는 MAS 제안
- D3 프레임워크를 통한 결정 구조의 일반화 가능성 확보
- 멀티 에이전트 투표를 통해 VLM의 확률성 문제 완화
- 임업 수목 높이 분류 작업에서 기존 ML 베이스라인 능가
많은 전문가 중심 도메인에서 주석 작성자(annotator) 간의 알려진 변동성에도 불구하고, 인간이 레이블링한 데이터는 머신러닝 (ML)에서 참조 주석으로 널리 사용됩니다. 또한, 전문가 주석은 속도가 느리고 일관성이 없으며, 임업 원격 탐사에서의 수목 높이 편향 분류 (tree height bias classification)와 같은 작업을 확장하는 데 있어 주요한 병목 현상으로 남아 있습니다. 우리는 전문가 결정 트리 (decision trees)를 시각-언어 모델 (Vision-Language Models, VLMs)과 오케스트레이션하는 멀티 에이전트 시스템 (multi-agent system, MAS)을 제안합니다. 이 시스템은 결정 트리를 구조적 사전 정보 (structural prior)로 취급하는 한편, VLMs는 개별 노드에서 국소적인 의미론적 인지 (semantic perception)를 수행하며, VLM의 확률성 (stochasticity)을 완화하기 위해 멀티 에이전트 투표 (multi-agent voting)를 사용합니다. 우리는 다양한 전문가 정의 결정 구조 전반에 걸쳐 수정 없이 일반화가 가능한 분리된 선언적 결정 (Decoupled Declarative Decision, D3) 프레임워크를 정형화합니다. 수목 편향 분류 테스트베드에서 우리의 프레임워크는 지도 학습 기반 ML 베이스라인을 능가하며 전문가 레이블링 노력의 양을 줄여줍니다. 이러한 결과는 전문가 사전 정보 (expert priors)를 가진 VLMs의 에이전트 오케스트레이션이 해석 가능성을 유지하면서도 실질적으로 더 낮은 주석 비용으로 전문가가 정의한 레이블링 절차를 재현할 수 있음을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기