TRACER: 멀티모달 도구 사용 에이전트를 위한 검증 가능한 생성적 출처 추적

멀티모달 대규모 언어 모델(LLM)은 시각적 검사, OCR, 검색, 계산 및 다단계 추론을 위해 외부 도구를 호출함으로써 점차적으로 비전 중심 작업을 해결하고 있습니다. 현재의 도구 사용 에이전트는 일반적으로 실행된 도구 궤적과 최종 답변만 노출하지만, 각 생성된 주장을 어떤 도구 관찰(tool observation)이 뒷받침하는지 명시하는 경우는 드뭅니다. 우리는 이 누락된 주장 수준 의존성 구조를 출처 추적 격차(provenance gap)라고 부릅니다. 이 격차 때문에 유용한 증거, 중복 탐색, 그리고 근거 없는 추론이 동일한 궤적에 혼재되어 도구 사용을 검증하거나 최적화하기 어렵습니다. 우리는 멀티모달 도구 사용 에이전트의 검증 가능한 생성적 출처 추적(verifiable generative provenance) 프레임워크인 TRACER를 소개합니다. TRACER는 단순히 생성 후에 인용문을 추가하는 대신, 지원하는 도구 턴(tool turn), 증거 단위(evidence unit), 그리고 의미적 지원 관계(semantic support relation)를 식별하는 구조화된 출처 추적 기록과 함께 각 답변 문장을 생성합니다. 이 관계 공간은 직접적인 재사용(Quotation), 충실한 응축(Compression), 그리고 근거 기반 도출(Inference)을 포함합니다. TRACER는 스키마 검사, 도구 턴 정렬(tool-turn alignment), 출처 진위성(source authenticity), 그리고 관계 합리성(relation rationality)을 통해 각 기록을 검증하고, 그 후 검증된 출처 추적 정보를 추적 가능성 제약 조건(traceability constraints) 및 강화학습 (RL)을 위한 출처 기반 지역 크레딧(provenance-derived local credit)으로 변환합니다. 또한 우리는 거친 멀티모달 도구 궤적으로부터 문장 수준의 출처 재구성(sentence-level provenance reconstruction)을 위한 벤치마크인 TRACE-Bench를 구축했습니다. TRACE-Bench에서는 단순히 도구를 추가하는 것만으로도 노이즈가 발생하는 경우가 많습니다.

Qwen3-VL-8B를 사용했을 때, TRACER는 답변 정확도(answer accuracy)에서 78.23%, 요약 정확도(summary accuracy)에서 95.72%에 도달하며, 가장 강력한 폐쇄형 소스(closed-source)의 도구 증강 기준선(tool-augmented baseline)을 23.80 퍼센트 포인트 능가했습니다. 또한, 도구만으로 지도 미세 조정(supervised fine-tuning)을 했을 때와 비교하여 전체 테스트 세트 도구 호출 횟수를 4949회에서 3486회로 줄였습니다. 이러한 결과는 신뢰할 수 있는 멀티모달 도구 추론이 단순히 더 많은 도구 호출에 의존하는 것이 아니라, 출처 인식(provenance-aware) 관찰 사용에 달려 있음을 보여줍니다.

Insights

TRACER: 멀티모달 도구 사용 에이전트를 위한 검증 가능한 생성적 출처 추적

요약

핵심 포인트

댓글

MaxLinear, 2026년 광학 데이터 센터 매출 전망치를 2억 1,000만~2억 3,000만 달러로 상향하며 3분기 매출을 2억 1

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축

MaxLinear, 2026년 광학 데이터 센터 매출 전망치를 2억 1,000만~2억 3,000만 달러로 상향하며 3분기 매출을 2억 1

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축