GLiNER-Relex: 개체명 인식 및 관계 추출을 위한 통합 프레임워크

개체명 인식(Named Entity Recognition, NER)과 관계 추출(Relation Extraction, RE)의 결합은 비정형 텍스트로부터 지식 그래프를 구축하는 자연어 처리(NLP)의 기본적인 과제입니다. 최근 접근 방식들은 NER과 RE를 별개의 작업으로 간주하여 개별 모델을 필요로 했지만, 우리는 GLiNER 프레임워크를 확장하여 엔티티 인식과 관계 추출을 단일 모델에서 모두 수행할 수 있는 통합 아키텍처인 GLiNER-Relex를 소개합니다. 우리의 접근 방식은 공유된 양방향 트랜스포머 인코더(bidirectional transformer encoder)를 활용하여 텍스트, 개체 유형 레이블, 그리고 관계 유형 레이블을 공동으로 표현하며, 이를 통해 추론 시점에 지정된 임의의 개체 및 관계 유형에 대한 제로샷 추출(zero-shot extraction)이 가능하게 합니다. GLiNER-Relex는 인식된 스팬(span)으로부터 개체 쌍 표현을 구성하고 전용 관계 점수화 모듈(relation scoring module)을 사용하여 이를 관계 유형 임베딩과 비교하여 점수를 매깁니다. 우리는 네 가지 표준 관계 추출 벤치마크인 CoNLL04, DocRED, FewRel, 그리고 CrossRE에서 모델을 평가했으며, 전문적인 관계 추출 모델뿐만 아니라 대규모 언어 모델(large language models)과도 경쟁력 있는 성능을 입증하는 동시에 GLiNER 계열이 가진 계산 효율성을 유지합니다. 이 모델은 사용자가 추론 시점에 임의의 개체 및 관계 유형 레이블을 지정하고 단일 호출로 개체와 관계 트리플렛(relation triplets)을 모두 얻을 수 있도록 하는 간단한 추론 API가 포함된 오픈 소스 Python 패키지로 공개됩니다. 모든 모델과 코드는 공개적으로 이용 가능합니다.

Insights

GLiNER-Relex: 개체명 인식 및 관계 추출을 위한 통합 프레임워크

요약

핵심 포인트

댓글

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축

에이전트적 컨텍스트 관리 (Agentic Context Management): 에이전트의 메모리와 비용 문제를 라이프사이클 및 아키텍처 문제로

Digital Realty, 42.5억~47.5억 달러 규모의 자본 지출 (Capex) 계획을 바탕으로 프로모트를 제외한 2026년 주당 핵심

무작위 설계를 통한 KV-Cache 제거를 위한 오류 인증 (Error Certificates)

GS-Agent: 생성형 시뮬레이션을 통한 4D 물리 세계 구축

에이전트적 컨텍스트 관리 (Agentic Context Management): 에이전트의 메모리와 비용 문제를 라이프사이클 및 아키텍처 문제로