arXiv논문2026. 05. 28. 13:21

GraphLit: 문학 연구를 위한 텍스트 풍부 동적 인물 네트워크 표현 학습

요약

문학 텍스트 내 인물 간 상호작용과 텍스트적 맥락을 동시에 학습하는 GraphLit 프레임워크를 제안합니다. 이종 그래프를 활용한 자기지도 학습을 통해 기존 모델보다 뛰어난 문학적 맥락 이해 성능을 입증했습니다.

핵심 포인트

인물과 텍스트 맥락을 정렬한 동적 이종 그래프(DHCNs) 도입
마스크된 그래프 오토인코더 기반의 자기지도 학습 프레임워크
기존 텍스트/그래프 전용 베이스라인 대비 성능 향상
서사의 비선형성과 동적 사회적 특징 간의 연결 고리 규명

문학 텍스트를 그래프 또는 그래프의 시퀀스로 표현하는 방법들은 주로 인물 간의 상호작용 (character interactions)을 표현하는 데 집중하며, 인물들이 상호작용하는 텍스트적 맥락 (textual context)이라는 또 다른 중요한 측면을 간과하는 경우가 많습니다. 본 연구에서는 긴 소설을 인물과 그들의 텍스트적 맥락을 정렬하는 시간적으로 국소화된 이종 그래프 (heterogeneous graphs)로 구성하는 동적 이종 인물 네트워크 (Dynamic Heterogeneous Character Networks, DHCNs)를 소개합니다. 우리는 Project Gutenberg에서 약 20,000개의 DHCNs를 추출하였으며, 마스크된 그래프 오토인코더 (masked graph autoencoder) 목적 함수를 통해 풍부한 문학적 표현을 학습하는 자기지도 학습 (self-supervised learning) 프레임워크인 GraphLit을 제안합니다. 12개의 광범위한 인물 관련 태스크에 걸쳐, GraphLit은 텍스트 전용 (text-only) 및 그래프 전용 (graph-only) 베이스라인보다 성능을 향상시켰으며, 특히 맥락적 이해 (contextual understanding)를 요구하는 태스크에서 두드러진 성과를 보였습니다. 마지막으로, 우리는 서사의 비선형성 (narrative non-linearity)과 동적 사회적 특징 (dynamic social features) 사이의 연결 고리를 연구함으로써 문학 분석을 위한 DHCNs와 GraphLit의 적용 가능성을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

GraphLit: 문학 연구를 위한 텍스트 풍부 동적 인물 네트워크 표현 학습

요약

핵심 포인트

댓글