arXiv논문2026. 06. 16. 12:12

순회 순서가 중요한가? Transformer Grammars에서의 트리 순회 방법론에 관한 체계적 연구

요약

Transformer Grammars(TGs)에서 구문 트리의 선형화 방식이 모델 성능에 미치는 영향을 연구했습니다. 기존의 깊이 우선 순회(DFT)를 넘어 너비 우선 순회(BFT)와 새로운 하이브리드 방식인 생성 규칙 순회(PRT)를 제안하고 성능을 검증했습니다.

핵심 포인트

구문 트리 선형화 방식이 언어 모델링 성능에 중요한 영향을 미침
BFT와 새로운 하이브리드 전략인 PRT를 통한 순회 설계 공간 확장
PRT는 BFT의 구조적 룩어헤드와 DFT의 조기 어휘 생성 장점을 결합
중첩된 구성과 전역 룩어헤드 사이의 트레이드오프 분석

Transformer Grammars (TGs)는 구문 트리 (syntactic tree) 구조를 통합함으로써 언어 모델링 (language modeling) 성능을 향상시킵니다. TGs에서 구문 트리가 선형화 (linearized)되는 방식이 모델 성능에 잠재적으로 상당한 영향을 미칠 수 있음에도 불구하고, 기존 연구들은 선형화를 위해 오직 깊이 우선 순회 (Depth-First Traversal, DFT)에만 의존해 왔습니다. 본 논문에서는 너비 우선 순회 (Breadth-First Traversal, BFT)와 새로운 하이브리드 순회 전략인 생성 규칙 순회 (Production-Rule Traversal, PRT)를 탐색함으로써 순회 설계 공간을 확장합니다. PRT는 BFT의 구조적 룩어헤드 (structural lookahead)와 DFT의 조기 어휘 생성 (early lexical generation)을 결합한 방식입니다. 우리는 이러한 순회 방법들을 다양한 트리 구성 및 마스킹 전략 (masking strategies)과 통합하였으며, 언어 모델링, 구문 일반화 (syntactic generalization) 및 요약 (summarization) 작업에서의 성능을 경험적으로 평가하였습니다. 우리는 중첩된 구성 (nested composition)과 전역 룩어헤드 (global lookahead) 사이의 내재적인 트레이드오프 (trade-offs)를 밝혀내며, 태스크 인지형 (task-aware) Transformer Grammars 설계를 위한 실행 가능한 권장 사항을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

순회 순서가 중요한가? Transformer Grammars에서의 트리 순회 방법론에 관한 체계적 연구

요약

핵심 포인트

댓글