본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 25. 11:28

세 가지 불교 어휘: 경(Sutta), 율(Vinaya), 논(Abhidhamma)에 걸친 영어 팔리 경전의 계산 스타일로메트리

요약

영어로 번역된 불교 삼장(Tipitaka) 전체를 대상으로 계산 스타일로메트리 분석을 수행한 연구입니다. Zipf 분포, 어휘 다양성(MATTR), 숫자-단어 밀도 등을 통해 경, 율, 논의 언어적 특성과 번역 간의 차이를 규명했습니다.

핵심 포인트

  • 삼장 전체 코퍼스에 대한 Zipf 순위-빈도 분포 및 어휘 다양성 분석 수행
  • 율(Vinaya)이 이상적인 Zipf 기울기에 가장 근접함을 확인
  • Sangaha 코퍼스는 체계적 열거 특성으로 인해 가장 높은 숫자-단어 밀도 기록
  • 번역 시기 차이에 따른 어휘 공유율 및 주요 용어 번역 변화 분석
  • 연구 데이터와 코드는 오픈 소스로 공개됨

본 연구에서는 경(Sutta Pitaka)만을 대상으로 했던 이전 연구를 확장하여, 영어 번역본으로 된 삼장(Tipitaka) 전체의 세 가지 피타카(Pitakas)에 대한 계산 스타일로메트리 (Computational Stylometric) 분석을 제시합니다. 코퍼스(Corpus)는 Bhikkhu Sujato의 경(Sutta Pitaka) (114,591개 세그먼트, CC0), Bhikkhu Brahmali의 율(Vinaya Pitaka) (7,923개 세그먼트, CC0 2026), I.B. Horner의 1938년 율(Vinaya) 번역 (2,826개 세그먼트), Abhidhammattha Sangaha 요약서의 세 가지 영어 번역본 (2,077개 세그먼트), 그리고 Dharmaguptaka 및 Mulasarvastivada 학파의 교차 전통 율(Vinaya) 텍스트를 포함하여 총 134,831개의 세그먼트로 구성됩니다. 우리는 OLS-fitted 지수를 사용한 Zipf 순위-빈도 분포, 이동 평균 TTR (MATTR-500), 숫자-단어 밀도(numeral-word density), 그리고 어휘 중첩 (Jaccard 및 Szymkiewicz-Simpson 계수)을 계산합니다. 주요 연구 결과는 다음과 같습니다: (1) 모든 코퍼스는 Zipf와 일치하는 분포(R2 > 0.989)를 보입니다. 율(Vinaya)이 이상적인 Zipf 기울기 -1에 가장 가깝고, Sangaha 코퍼스가 가장 많이 벗어나 있으며, 8위 순위에서 'consciousness'가 문법적 입자(grammatical particles)를 대체합니다; (2) MATTR-500 분석 결과, 경(Sutta)과 상좌부(Theravada) 율(Vinaya)은 어휘 다양성(lexical diversity) 측면에서 거의 동일(0.399 및 0.400)한 반면, Sangaha 코퍼스는 크기 제어 하위 샘플링(size-controlled subsampling)을 통해 확인된 바와 같이 실제로 더 다양합니다(0.560); (3) Sangaha 코퍼스는 가장 높은 숫자-단어 밀도(3.26%)를 가지며, 이는 정신적 및 물질적 범주를 체계적으로 열거하는 특성과 일치합니다; (4) Mulasarvastivada 율(Vinaya)은 상좌부(Theravada) 율(Vinaya)과 20.0%(Jaccard) 및 49.1%(중첩 계수)의 어휘를 공유하며, 이는 2천 년에 걸친 공유된 법적 유산을 반영합니다; (5) 동일한 율(Vinaya) 원전의 두 영어 번역본은 88년의 시간 차에도 불구하고 어휘의 24.2%만을 공유하며, jhana에 대한 'musing' 대 'absorption', parajika에 대한 'defeat' 대 'expulsion'이 가장 진단적인 변화로 나타났습니다. 모든 결과는 점 추정치(point estimates)이며, 유의성 검정(significance testing)은 수행되지 않았습니다. 코드와 데이터는 Darshana Graph 코퍼스(arXiv:2606.18222)의 오픈 소스 확장판으로 공개됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0