SAM-NER: 도메인 변화에 대한 제로샷 명사 인식 (ZS-NER) 을 위한 의미 원형 매개
요약
본 논문은 제로샷 명사 인식(ZS-NER)이 도메인이나 스키마가 변경될 때 취약한 문제를 해결하기 위해 SAM-NER이라는 새로운 프레임워크를 제안합니다. SAM-NER는 '의미 원형 매개(Semantic Archetype Mediation)'라는 개념을 도입하여, 엔티티 정보를 도메인 불변의 원형 공간으로 투영하고 이를 통해 교차 도메인 전이의 안정성을 확보합니다. 이 3단계 프레임워크는 엔티티 발견, 추상 매개, 의미 보정 과정을 거쳐 높은 성능과 일반화 능력을 보여줍니다.
핵심 포인트
- SAM-NER는 ZS-NER의 주요 문제점인 도메인/스키마 변화에 대한 취약성을 해결합니다.
- 핵심 방법론은 '의미 원형 매개(Semantic Archetype Mediation)'를 통해 엔티티 정보를 도메인 불변의 원형 공간으로 안정화하는 것입니다.
- 프레임워크는 (1) 엔티티 발견, (2) 추상 매개(원형 투영), (3) 의미 보정(최종 예측)의 3단계 구조로 작동합니다.
- CrossNER 벤치마크에서 기존 ZS-NER 베이스라인 대비 우수한 성능을 입증했습니다.
제로샷 명사 인식 (Zero-shot Named Entity Recognition, ZS-NER) 은 도메인 및 스키마 변경 하에서 취약하며, 보이지 않는 레이블 정의는 종종 대형 언어 모델의 (LLM's) 내재적 의미 조직과 불일치합니다. 따라서 엔티티 언급을 세밀한 목표 레이블로 직접 매핑하면, 특히 목표 스키마가 새로운 경우 또는 의미적으로 중첩된 경우 체계적인 의미 드리프트를 유발할 수 있습니다. 우리는 extbf{SAM-NER} 을 제안하며, 이는 도메인 불변 원형 공간을 통해 교차 도메인 전이를 안정화하는 extit{Semantic Archetype Mediation} (의미 원형 매개) 기반 3 단계 프레임워크입니다. SAM-NER 은: (i) 협력 추출 및 합의 기반 노이즈 제거를 통한 extit{Entity Discovery} (엔티티 발견) 을 수행하여 고 커버리지, 고 충실도 엔티티 스페인을 얻습니다; (ii) 상위 계층 오نت올로지 추상화에서 정제된 보편적 의미 원형 집합으로 엔티티를 투영하는 extit{Abstract Mediation} (추상 매개) 를 수행합니다; 및 (iii) 제약된 정의에 맞춘 추론을 통해 원형 수준 예측을 목표 도메인 유형으로 해결하는 extit{Semantic Calibration} (의미 보정) 을 적용합니다. CrossNER 벤치마크 실험에서 SAM-NER 은 교차 도메인 설정에서 강력한 이전 ZS-NER 베이스라인을 일관되게 우위합니다. 우리의 구현은 https://github.com/DMIRLAB-Group/SAM-NER 에서 오픈 소스화될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기