LLM 기반 개념화를 통한 이벤트 온톨로지 확장
요약
LLM을 활용하여 이벤트 온톨로지를 확장하는 새로운 프레임워크인 ConceptE를 제안합니다. 기존 방식의 한계인 문맥적 혼동을 해결하기 위해 LLM으로 개념 수준의 의미론을 도출하고 이를 트리거 정보와 공동 인코딩하여 클러스터링과 계층 확장 성능을 높였습니다.
핵심 포인트
- LLM 기반 개념화를 통해 이벤트 온톨로지 확장 성능 개선
- 문맥적 표현 대신 개념 수준의 의미론을 활용하여 클러스터링 안정성 확보
- ConceptE 프레임워크를 통한 일관된 이벤트 유형 명명 및 계층 확장 지원
- ACE, ERE, MAVEN 데이터셋 실험에서 SOTA 성능 달성
이벤트 온톨로지 확장 (Event ontology expansion)은 데이터로부터 새롭게 등장하는 이벤트 유형을 발견하고, 이를 기존 이벤트 온톨로지의 적절한 위치로 확장하는 것을 목표로 합니다. 기존 방법들은 일반적으로 문맥화된 트리거 표현 (contextualized trigger representations)을 클러스터링하고, 유도된 클러스터를 인스턴스 수준의 유사성 (instance-level similarity)을 기반으로 온톨로지에 부착합니다. 그러나 온톨로지 확장은 이벤트 유형을 특징짓는 개념 수준의 의미론 (concept-level semantics)을 필요로 하는 반면, 문맥화된 트리거 표현은 이러한 의미론을 표면적인 문맥 변화와 혼동하는 경우가 많아 불안정한 클러스터링과 신뢰할 수 없는 계층 확장 (hierarchy expansion)으로 이어집니다. 이 문제를 해결하기 위해, 우리는 이벤트 온톨로지 확장을 위한 개념화 강화 프레임워크인 ConceptE를 제안합니다. ConceptE는 먼저 문장과 이벤트 트리거를 LLM (Large Language Model)에 프롬프트로 제공하여 개념 수준의 의미론을 도출하며, 이를 통해 간결한 개념 명칭과 자연어 설명을 생성합니다. 그 다음, 이러한 의미론을 트리거 정보와 함께 공동 인코딩 (jointly encodes)하여 온톨로지 수준의 추론 (ontology-level reasoning)과 정렬된 개념 강화 표현 (concept-enhanced representations)을 구축합니다. 이러한 표현 설계는 더욱 일관된 이벤트 클러스터링, 더욱 신뢰할 수 있는 계층 확장, 그리고 온톨로지와 일치하는 유형 명명 (type naming)을 지원합니다. ACE, ERE, MAVEN에 대한 실험 결과, ConceptE는 이벤트 온톨로지 확장의 모든 하위 작업에서 최신 기술 (state-of-the-art) 방식들을 일관되게 능가함을 입증했습니다. 특히, 이벤트 클러스터링의 BCubed-F1에서 최대 12.37%, 계층 확장의 Taxo_F1에서 6.48%의 향상을 달성하여 제안된 ConceptE 방법의 효과를 증명했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기