본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 22. 17:14

어휘 의미론을 위한 장면 추상화: 상황적 의미의 구조적 표현

요약

단어의 상황적 의미를 구조적으로 표현하기 위한 '장면 추상화(Scene Abstraction)' 프레임워크를 제안합니다. LLM의 퓨샷 프롬프팅을 활용해 문맥적 장면과 표현 프로필을 구축하며, 새로운 데이터셋인 COCA-Scenes를 통해 그 유효성을 입증했습니다.

핵심 포인트

  • 단어의 상황적·정서적 차원을 구조화하는 프레임워크 제안
  • 문맥적 장면과 표현 프로필로 구성된 장면 추상화 모델
  • 520개 사례를 포함한 COCA-Scenes 데이터셋 구축
  • 기존 임베딩 및 ATOMIC 대비 높은 인간 해석 일치도 증명

커피와 차는 많은 속성을 공유하지만, 매우 상이한 상황, 분위기, 그리고 정서적 연상(affective associations)을 불러일으킵니다. 단어 의미의 이러한 상황적 차원(situated dimensions)은 실재하며 체계적이지만, 어휘 의미에 대한 대부분의 계산적 표현(computational representations)에서는 암묵적인 상태로 남아 있습니다. 우리는 단어가 사용 맥락 전반에 걸쳐 참여하는 해석적 장면(interpretive scenes)의 구조적 표현을 구축하기 위한 프레임워크인 장면 추상화(Scene Abstraction)를 제안합니다. 각 장면은 문맥적 장면(Contextual Scene: 사건(Events), 개체(Entities), 설정(Setting))과 표현 중심의 표현 프로필(Expression Profile: 관여된 사건(Engaged events), 일반화 가능한 속성(Generalizable properties), 유발된 감정(Evoked emotions))로 구성되며, 대규모 언어 모델(Large Language Model, LLM)의 퓨샷 프롬프팅(few-shot prompting)을 통해 실행됩니다. 우리의 기여는 세 가지입니다: (1) 상황적 어휘 의미를 위한 구조적 표현 프레임워크; (2) 별도의 장면 식별을 위해 26개의 키워드에 걸쳐 520개의 사용 사례를 담은 데이터셋인 COCA-Scenes; (3) 장면이 인간 관찰자들 사이에서 안정적으로 식별 가능하다는 것(정확도 82.4%, 텍스트 전용 임베딩(text-only embeddings) 대비 +11.8 pp)과 우리의 장면 프로필이 ATOMIC 기반의 대안들보다 문맥 내 단어에 대한 인간의 해석과 더 밀접하게 일치한다는 것(세 가지 의미론적 차원에서 86.4%의 선호도)을 보여주는 두 가지 실험의 실증적 증거입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0