arXiv논문2026. 06. 01. 12:36

Semantic Triplet Restoration: 대규모 언어 모델의 계층적 테이블 이해를 위한 새로운 프로토콜

요약

LLM의 계층적 테이블 이해를 돕기 위해 셀 정보를 <item path, feature path, value> 형태의 트리플렛으로 재구성하는 STR 프로토콜을 제안합니다. 이를 통해 마크업 오버헤드를 줄이고 토큰 효율성을 높이면서도 테이블 질의응답 성능을 유지하거나 향상시킵니다.

핵심 포인트

STR 프로토콜을 통한 테이블 셀의 의미론적 관계 복구
HTML/Markdown 대비 토큰 사용량 감소 및 효율성 증대
경량 쿼리 인식 라우터 TripletQL 제시
작은 모델 및 긴 컨텍스트 환경에서 뛰어난 성능 입증

테이블 질의응답 (Table question answering)은 모델이 2차원 레이아웃 (layout), 병합된 셀 (merged cells), 그리고 계층적 헤더 (hierarchical headers)에 의해 암묵적으로 인코딩된 의미론적 관계 (semantic relations)를 복구할 것을 요구합니다. 현재의 파이프라인 (pipelines)은 일반적으로 HTML 또는 Markdown을 중간 테이블 표현 방식으로 사용하지만, 이러한 레이아웃 중심의 직렬화 (serializations)는 마크업 오버헤드 (markup overhead)를 발생시키며, 대규모 언어 모델 (Large Language Models, LLMs)이 행 및 열 스팬 (row and column spans)으로부터 헤더-셀 정렬 (header-cell alignments)을 추론하도록 요구합니다. 우리는 각 셀을 원자적 사실인 <item path, feature path, value>로 다시 쓰는 프로토콜인 Semantic Triplet Restoration (STR)을 제안합니다. 여기서 item path는 행 단위의 엔티티 (entity)를 지정하고, feature path는 계층적 속성 (hierarchical attribute)을 지정하며, value는 셀의 내용을 포함합니다. 또한, 우리는 각 질문에 대해 적절한 렌더링 (rendering) 또는 필터링된 트리플렛 (triplets)의 하위 집합을 선택하기 위해 STR을 사용하는 경량 쿼리 인식 라우터 (query-aware router)인 TripletQL을 제시합니다. 4개의 중국어 및 영어 테이블-QA 벤치마크 (benchmarks) 전반에 걸쳐, STR은 입력 토큰 (input tokens)을 줄이면서도 HTML 기반의 베이스라인 (baselines)과 대등하거나 이를 능가하는 성능을 보여줍니다. 이러한 상대적 이점은 더 작은 언어 모델 (smaller language models)과 더 긴 테이블 컨텍스트 (table contexts)에서 커지며, 이는 명시적인 의미론적 표현 (explicit semantic representations)이 제한된 추론 예산 (inference budgets) 하에서 특히 유용함을 시사합니다. 코드와 데이터는 https://github.com/Phoenix-ni/STR.git 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Semantic Triplet Restoration: 대규모 언어 모델의 계층적 테이블 이해를 위한 새로운 프로토콜

요약

핵심 포인트

댓글