어휘 의미론을 위한 장면 추상화: 상황적 의미의 구조적 표현

커피와 차는 많은 속성을 공유하지만, 매우 상이한 상황, 분위기, 그리고 정서적 연상(affective associations)을 불러일으킵니다. 단어 의미의 이러한 상황적 차원(situated dimensions)은 실재하며 체계적이지만, 어휘 의미에 대한 대부분의 계산적 표현(computational representations)에서는 암묵적인 상태로 남아 있습니다. 우리는 단어가 사용 맥락 전반에 걸쳐 참여하는 해석적 장면(interpretive scenes)의 구조적 표현을 구축하기 위한 프레임워크인 장면 추상화(Scene Abstraction)를 제안합니다. 각 장면은 문맥적 장면(Contextual Scene: 사건(Events), 개체(Entities), 설정(Setting))과 표현 중심의 표현 프로필(Expression Profile: 관여된 사건(Engaged events), 일반화 가능한 속성(Generalizable properties), 유발된 감정(Evoked emotions))로 구성되며, 대규모 언어 모델(Large Language Model, LLM)의 퓨샷 프롬프팅(few-shot prompting)을 통해 실행됩니다. 우리의 기여는 세 가지입니다: (1) 상황적 어휘 의미를 위한 구조적 표현 프레임워크; (2) 별도의 장면 식별을 위해 26개의 키워드에 걸쳐 520개의 사용 사례를 담은 데이터셋인 COCA-Scenes; (3) 장면이 인간 관찰자들 사이에서 안정적으로 식별 가능하다는 것(정확도 82.4%, 텍스트 전용 임베딩(text-only embeddings) 대비 +11.8 pp)과 우리의 장면 프로필이 ATOMIC 기반의 대안들보다 문맥 내 단어에 대한 인간의 해석과 더 밀접하게 일치한다는 것(세 가지 의미론적 차원에서 86.4%의 선호도)을 보여주는 두 가지 실험의 실증적 증거입니다.

Insights

어휘 의미론을 위한 장면 추상화: 상황적 의미의 구조적 표현

요약

핵심 포인트

댓글

복리적 코드(Compounding Code)를 위한 신경계로서의 GitHub: 변화의 속도에서 살아남기

KPMG, AI 네이티브 기업 시스템 개발을 위해 OpenAI와 파트너십 체결

Microsoft와 Mistral, 기업용 AI 배포를 위한 파트너십 확대

Alphabet 실적 발표를 앞두고 반도체 랠리가 주춤하며 Nasdaq 선물 하락

복리적 코드(Compounding Code)를 위한 신경계로서의 GitHub: 변화의 속도에서 살아남기

KPMG, AI 네이티브 기업 시스템 개발을 위해 OpenAI와 파트너십 체결

Microsoft와 Mistral, 기업용 AI 배포를 위한 파트너십 확대

Alphabet 실적 발표를 앞두고 반도체 랠리가 주춤하며 Nasdaq 선물 하락