구조적 일반화(Structural Generalization)에서 방향성(Directionality)의 역할에 대하여

여러 SLOG 테스트 카테고리는 방향성 구분(수식어 위치 이동, 논항 추출 위치)을 명시적으로 포함하고 있지만, 이전의 SOTA(State-of-the-Art)인 AM-Parser는 연산에 방향성을 인코딩하지 않는 AM 대수(AM algebra)를 사용합니다. 우리는 CCG 방향성 타입(CCG directed types)을 중심으로 심볼릭 백엔드(symbolic backend)를 재설계했습니다 (결정론적 CKY + 단일 선형 디코더, 30K 학습 가능 파라미터). 동일한 BERT-base 인코더 하에서, 이 시스템은 75.9$\pm$6.4%의 LF exact match를 달성하여 AM-Parser(70.8$\pm$4.3%)를 능가했습니다. SLOG 자체의 카테고리 그룹화에 따르면, 성능 향상은 매우 방향적입니다. CCG 시스템은 5개의 모든 위치 이동(position-shift) 카테고리에서 AM-Parser를 앞질렀으며(+29.9pp), 반면 AM-Parser는 6개의 모든 재귀 깊이(recursive-depth) 카테고리에서 앞섰습니다. 인코더를 DeBERTa-v3-large로 교체하면 90.7$\pm$4.9%를 기록하며, 재귀 깊이 카테고리에서 가장 큰 인코더 성능 향상을 보였는데, 이는 방향성에 의한 이득을 보완합니다. 방향성 표현(Directional representations)은 병목 현상을 심볼릭 레이어(AM-Parser의 카테고리 상한선 0%)에서 인코더 업그레이드에 따라 개선되는 뉴럴 레이어(neural layer)로 이동시킵니다.

Insights

구조적 일반화(Structural Generalization)에서 방향성(Directionality)의 역할에 대하여

요약

핵심 포인트

댓글

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

미 법무부, 가격 조작 혐의를 받은 주요 계란 생산 업체들과 합의 도달

Opus를 환상적으로 만들기: Fable 5의 독자적인 원칙에 따라 Opus 4.8을 실행하는 Claude Code 플러그인

AI API 비용을 밑바닥부터 획기적으로 줄이는 법: 아무도 말해주지 않는 사실

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

미 법무부, 가격 조작 혐의를 받은 주요 계란 생산 업체들과 합의 도달

Opus를 환상적으로 만들기: Fable 5의 독자적인 원칙에 따라 Opus 4.8을 실행하는 Claude Code 플러그인

AI API 비용을 밑바닥부터 획기적으로 줄이는 법: 아무도 말해주지 않는 사실