본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 05:58

GLiNER-Relex: 개체명 인식 및 관계 추출을 위한 통합 프레임워크

요약

GLiNER-Relex는 개체명 인식(NER)과 관계 추출(RE)를 단일 통합 프레임워크에서 수행할 수 있도록 설계된 새로운 NLP 아키텍처입니다. 이 프레임워크는 공유 트랜스포머 인코더를 사용하여 텍스트, 개체 유형, 관계 유형을 공동으로 표현하며, 이를 통해 제로샷 추출이 가능합니다. GLiNER-Relex는 높은 성능과 계산 효율성을 유지하면서도 사용자가 임의의 개체 및 관계 유형에 대해 단일 호출로 트리플렛(triplets)을 얻을 수 있는 오픈 소스 API를 제공합니다.

핵심 포인트

  • NER과 RE를 분리된 작업이 아닌 통합 아키텍처로 접근하여 모델 복잡성을 줄임.
  • 공유 양방향 트랜스포머 인코더를 활용하여 텍스트, 개체, 관계 정보를 공동으로 표현함.
  • 제로샷 추출(zero-shot extraction)을 지원하여 추론 시점에 임의의 유형에 대한 처리가 가능함.
  • CoNLL04, DocRED 등 표준 벤치마크에서 전문 모델 및 LLM과 경쟁할 만한 성능을 입증함.
  • 오픈 소스 Python 패키지로 제공되어 사용자가 쉽게 접근하고 활용할 수 있음.

개체명 인식(Named Entity Recognition, NER)과 관계 추출(Relation Extraction, RE)의 결합은 비정형 텍스트로부터 지식 그래프를 구축하는 자연어 처리(NLP)의 기본적인 과제입니다. 최근 접근 방식들은 NER과 RE를 별개의 작업으로 간주하여 개별 모델을 필요로 했지만, 우리는 GLiNER 프레임워크를 확장하여 엔티티 인식과 관계 추출을 단일 모델에서 모두 수행할 수 있는 통합 아키텍처인 GLiNER-Relex를 소개합니다. 우리의 접근 방식은 공유된 양방향 트랜스포머 인코더(bidirectional transformer encoder)를 활용하여 텍스트, 개체 유형 레이블, 그리고 관계 유형 레이블을 공동으로 표현하며, 이를 통해 추론 시점에 지정된 임의의 개체 및 관계 유형에 대한 제로샷 추출(zero-shot extraction)이 가능하게 합니다. GLiNER-Relex는 인식된 스팬(span)으로부터 개체 쌍 표현을 구성하고 전용 관계 점수화 모듈(relation scoring module)을 사용하여 이를 관계 유형 임베딩과 비교하여 점수를 매깁니다. 우리는 네 가지 표준 관계 추출 벤치마크인 CoNLL04, DocRED, FewRel, 그리고 CrossRE에서 모델을 평가했으며, 전문적인 관계 추출 모델뿐만 아니라 대규모 언어 모델(large language models)과도 경쟁력 있는 성능을 입증하는 동시에 GLiNER 계열이 가진 계산 효율성을 유지합니다. 이 모델은 사용자가 추론 시점에 임의의 개체 및 관계 유형 레이블을 지정하고 단일 호출로 개체와 관계 트리플렛(relation triplets)을 모두 얻을 수 있도록 하는 간단한 추론 API가 포함된 오픈 소스 Python 패키지로 공개됩니다. 모든 모델과 코드는 공개적으로 이용 가능합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0