GraphLit: 문학 연구를 위한 텍스트 풍부 동적 인물 네트워크 표현 학습
요약
문학 텍스트 내 인물 간 상호작용과 텍스트적 맥락을 동시에 학습하는 GraphLit 프레임워크를 제안합니다. 이종 그래프를 활용한 자기지도 학습을 통해 기존 모델보다 뛰어난 문학적 맥락 이해 성능을 입증했습니다.
핵심 포인트
- 인물과 텍스트 맥락을 정렬한 동적 이종 그래프(DHCNs) 도입
- 마스크된 그래프 오토인코더 기반의 자기지도 학습 프레임워크
- 기존 텍스트/그래프 전용 베이스라인 대비 성능 향상
- 서사의 비선형성과 동적 사회적 특징 간의 연결 고리 규명
문학 텍스트를 그래프 또는 그래프의 시퀀스로 표현하는 방법들은 주로 인물 간의 상호작용 (character interactions)을 표현하는 데 집중하며, 인물들이 상호작용하는 텍스트적 맥락 (textual context)이라는 또 다른 중요한 측면을 간과하는 경우가 많습니다. 본 연구에서는 긴 소설을 인물과 그들의 텍스트적 맥락을 정렬하는 시간적으로 국소화된 이종 그래프 (heterogeneous graphs)로 구성하는 동적 이종 인물 네트워크 (Dynamic Heterogeneous Character Networks, DHCNs)를 소개합니다. 우리는 Project Gutenberg에서 약 20,000개의 DHCNs를 추출하였으며, 마스크된 그래프 오토인코더 (masked graph autoencoder) 목적 함수를 통해 풍부한 문학적 표현을 학습하는 자기지도 학습 (self-supervised learning) 프레임워크인 GraphLit을 제안합니다. 12개의 광범위한 인물 관련 태스크에 걸쳐, GraphLit은 텍스트 전용 (text-only) 및 그래프 전용 (graph-only) 베이스라인보다 성능을 향상시켰으며, 특히 맥락적 이해 (contextual understanding)를 요구하는 태스크에서 두드러진 성과를 보였습니다. 마지막으로, 우리는 서사의 비선형성 (narrative non-linearity)과 동적 사회적 특징 (dynamic social features) 사이의 연결 고리를 연구함으로써 문학 분석을 위한 DHCNs와 GraphLit의 적용 가능성을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기