통사적-의미적 및 교차 언어적 의미를 포함하는 새로운 의미론적 주석 코퍼스
요약
어휘 의미 중의성 해소(WSD)를 위한 새로운 프랑스어 의미 태깅 코퍼스를 제안합니다. 20개의 다의 동사를 대상으로 병렬 코퍼스 번역, 계산 사전, 그리고 이를 결합한 세밀한 의미 레이블을 포함합니다.
핵심 포인트
- 프랑스어 다의 동사 20개 인스턴스 대상 코퍼스 구축
- 병렬 코퍼스 기반의 실제 번역 의미 레이블 활용
- 계산 사전(Lexicon-Grammar)을 통한 의미 주석 제공
- 번역과 사전을 결합한 세밀한(fine-grained) 의미 레이블 생성
우리는 어휘 의미 중의성 해소 (Word Sense Disambiguation, WSD)를 위한 새로운 의미 태깅 코퍼스 (sense-tagged corpus)를 설명합니다. 이 코퍼스는 20개의 프랑스어 다의 동사 (polysemous verbs) 인스턴스로 구성되어 있습니다. 각 동사 인스턴스에는 세 가지 의미 레이블 (sense labels)이 주석으로 달렸습니다: (1) 병렬 코퍼스 (parallel corpus) 내 해당 인스턴스의 영어 버전에서 나타나는 동사의 실제 번역, (2) 프랑스어 계산 사전 (computational dictionary, Lexicon-Grammar 테이블)의 동사 항목, (3) 번역과 Lexicon-Grammar 항목을 결합하여 생성된 세밀한 의미 레이블 (fine-grained sense label)입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기