제5회 다국어 상호 참조 해결 (Multilingual Coreference Resolution) 공유 과제 결과: 장거리 엔티티

본 논문은 CODI-CRAC 2026 워크숍과 연계하여 개최된 제5회 다국어 상호 참조 해결 (Multilingual Coreference Resolution) 공유 과제 (Shared Task)에 대해 기술합니다. 이전 회차들을 바탕으로, 이번 과제는 참가자들이 언급 식별 (mention identification) 및 정체성 기반 상호 참조 클러스터링 (identity-based coreference clustering)이 가능한 시스템을 개발할 것을 요구했습니다. 2026년 버전은 특히 많은 단어와 문장에 걸쳐 상당한 거리를 가로지르는 상호 참조 체인 (coreferential chains)으로 정의되는 장거리 엔티티 (long-range entities)를 강조합니다. 본 과제는 5개의 새로운 데이터셋과 2개의 추가 언어를 통합함으로써 언어적 범위를 확장했습니다. 이러한 추가 사항은 19개 언어의 27개 데이터셋으로 구성된 조화된 다국어 컬렉션인 CorefUD 버전 1.4를 활용합니다. 총 10개의 시스템이 참여했으며, 여기에는 4개의 LLM 기반 접근 방식 (3개의 미세 조정 (fine-tuned) 모델과 1개의 퓨샷 (few-shot) 접근 방식)이 포함되었습니다. 전통적인 시스템들이 여전히 우위를 유지하고 있었으나, LLM은 상당한 잠재력을 보여주었으며, 이는 향후 회차에서 기존의 접근 방식들을 곧 위협할 수 있음을 시사합니다.

Insights

제5회 다국어 상호 참조 해결 (Multilingual Coreference Resolution) 공유 과제 결과: 장거리 엔티티

요약

핵심 포인트

댓글

자기 진화 AI 에이전트에 대한 종합 조사: 파운데이션 모델과 평생 에이전트 시스템을 연결하는 새로운 패러다임

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.

Apple이 Hugging Face에 HAT을 공개하다

Grok 4.5의 실제 사용 비용은 Opus 4.8의 1/17 수준입니다.

Grok 4.5가 Cursor에서 공식 출시되었습니다.