본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 22. 17:14

패턴-및-어근 굴절 형태론: 아랍어 불규칙 복수형 (Broken Plural)

요약

아랍어의 불규칙 복수형(Broken Plurals)을 처리하기 위해 기존의 어근-패턴 모델을 뒤집은 '패턴-및-어근' 모델을 제안합니다. 형태음운론적 규칙 없이 사전만으로 형태론적 분석이 가능하도록 설계된 새로운 분류 체계를 제시합니다.

핵심 포인트

  • 전통적인 어근 중심 모델을 패턴 우선 모델로 전환
  • 형태론적 분석을 형태음운론 규칙 없이 사전 기반으로 수행
  • 불규칙 복수형을 위한 정교한 160개(최대 300개) 클래스 분류 체계 구축
  • 3,200개의 불규칙 복수형 명사에 적용 가능한 인코딩 체계 제공

우리는 아랍어 화자인 언어학자들의 사전 및 기타 언어 자원 관리 방식에 특별히 주목하여, 아랍어 명사의 굴절 형태론 (inflectional morphology)을 기술하는 실질적으로 구현된 모델을 제시합니다. 이 돌파구는 전통적인 셈어족의 어근-및-패턴 (root-and-pattern) 모델을 패턴-및-어근 (pattern-and-root)으로 뒤집어, 어근보다 패턴에 우선순위를 부여했다는 점에 있습니다. 우리의 모델은 어간을 수정하여 형성되는 복수형인 불규칙 복수형 (broken plurals, BPs)을 포함합니다. 이는 셈어 형태론의 전통적인 어근 (root) 및 패턴 (pattern) 개념에 기반하고 있습니다. 그러나 전통적인 아랍어 형태론과 비교했을 때, 우리의 모델은 굴절 (inflection)에 대한 형식적 기술을 파생 (derivation) 및 의미론 (semantics)에 대한 기술과 분리하여 유지합니다. 업데이트 가능한 사전은 전통적인 아랍어 사전와 마찬가지로 표제어 (lemmas)를 위한 어휘 항목 (lexical entries)으로 구조화되어 있으며, 참조 철자는 완전히 모음 부호화 (diacritized)되어 있습니다. 우리의 모델에서 아랍어 텍스트의 형태론적 분석 (morphological analysis)은 형태음운론적 규칙 (morphophonological rules) 없이 단어 사전만으로 직접 수행됩니다. 명사 굴절을 위한 우리의 분류 체계 (taxonomy)는 단순하고 질서 정연하며 상세합니다. 우리는 모음의 성질 (vowel quality)은 무시하고 모음의 양 (vowel quantity)을 v 또는 vv로 지정함으로써 단수 패턴의 분류 체계를 단순화합니다. 어근 교체 (Root alternations) 및 철자 변이 (orthographical variations)는 패턴과 독립적으로, 그리고 깊은 어근 (deep roots)이나 형태음운론적 또는 철자 규칙 없이 사실적인 방식으로 인코딩됩니다. 3자 어근 (triliteral) 불규칙 복수형을 가진 명사는 90개 클래스로 세분화된 22개 패턴에 따라 분류되며, 4자 어근 (quadriliteral) 불규칙 복수형을 가진 명사는 70개 클래스로 세분화된 3개 패턴에 따라 분류됩니다. 단수에만 영향을 미치는 굴절 변이를 고려하면 이 160개 클래스는 300개의 굴절 클래스가 됩니다. 우리는 3,200개의 불규칙 복수형 명사 항목에 적용한 직관적인 인코딩 체계를 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0