문법이 역할을 수행한다: Universal Dependencies 전반에 걸친 기능적 vs. 어휘적 의존 길이 최소화

의존 길이 최소화 (Dependency length minimization, DLM)는 잘 기록된 처리 보편성 (processing universal)이지만, 이전 연구들은 언어당 단일 평균 의존 거리 (mean dependency distance, MDD)를 보고하여 통사적 관계 유형에 따른 변이를 가려왔습니다. 우리는 UD 및 SUD (버전 2.17)의 122개 언어를 분석하여, DLM이 두 가지 뚜렷한 수준에서 작동함을 보여줍니다. 문법 주도 최적화 (Grammar-driven optimization)는 기능적 의존 관계 (functional dependencies; det, case, aux)를 대상으로 하며, 이는 보편적으로 짧고 (평균 1.71, $σ$ = 0.33) 유형론적으로 다양한 언어 전반에 걸쳐 불변합니다. 처리 주도 최적화 (Processing-driven optimization)는 어휘적 의존 관계 (lexical dependencies; nsubj, obj, obl)에서 작동하며, 이는 더 길고 (평균 2.87), 변동성이 크며 ($σ$ = 0.63), 어순 유형론에 의해 제약됩니다. 이러한 비대칭성은 헤드 방향이 반대인 SUD에서도 유지됩니다 (r = 0.92). 우리는 문법이 국소적인 기능적 부착 (functional attachments)으로 문장을 구조화함으로써 최소화의 역할을 수행하고, 어휘적 헤드 (lexical heads)의 순서를 결정하는 것은 처리 압력 (processing pressures)에 맡긴다는 결론을 내립니다.

Insights

문법이 역할을 수행한다: Universal Dependencies 전반에 걸친 기능적 vs. 어휘적 의존 길이 최소화

요약

핵심 포인트

댓글

실시간 음성 에이전트 구축하기: 800ms 미만의 지연 시간 예산과 끼어들기 (Barge-In)

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

미 법무부, 가격 조작 혐의를 받은 주요 계란 생산 업체들과 합의 도달

Opus를 환상적으로 만들기: Fable 5의 독자적인 원칙에 따라 Opus 4.8을 실행하는 Claude Code 플러그인

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

미 법무부, 가격 조작 혐의를 받은 주요 계란 생산 업체들과 합의 도달

Opus를 환상적으로 만들기: Fable 5의 독자적인 원칙에 따라 Opus 4.8을 실행하는 Claude Code 플러그인