대규모 언어 모델(LLM)을 이용한 교차 언어 관계 추출: 루마니아어에 대한 Zero-Shot, Few-Shot 및 Fine-Tuned 평가

저자원 언어(low-resource languages)를 위한 관계 추출 (RE)은 일반적으로 주석이 달린 코퍼스(annotated corpora)의 부족으로 인해 제약을 받습니다. 본 연구에서는 자동 데이터셋 번역과 대규모 언어 모델 (LLM) 추론을 결합하여 루마니아어에 대한 교차 언어 RE의 타당성을 조사합니다. 우리는 LLM 기반 번역 파이프라인을 사용하여 SemEval-2010 Task 8 벤치마크를 영어에서 루마니아어로 번역하였으며, 125M에서 560M 파라미터에 이르는 4개의 인코더 베이스라인(XLM-RoBERTa (base 및 large), Romanian BERT, RoBERT-large)과 비교하여 zero-shot, few-shot, 그리고 QLoRA fine-tuned 설정 하에서 Gemma 4 31B를 평가합니다. 우리는 두 가지 태스크 구성인 표시된 엔티티를 활용한 관계 분류 (relation classification)와 엔드투엔드 추출 (end-to-end extraction)을 평가합니다. 연구 결과에 따르면, 프롬프트 전용 (prompt-only) 설정에서 루마니아어는 영어 대비 35 퍼센트 포인트 (pp)의 성능 저하가 발생하며, few-shot 프롬프팅은 zero-shot에 비해 미미한 이득을 제공함을 확인했습니다. 반면, QLoRA 미세 조정 (fine-tuning)은 두 언어 모두에서 macro F1-Score를 22 퍼센트 포인트 이상 향상시키는 동시에, 교차 언어 격차를 3.3pp에서 1.4pp로 줄였습니다. 인코더 베이스라인들은 50250배 더 작음에도 불구하고 루마니아어에서 QLoRA Gemma의 성능에 1~4pp 이내로 근접하였으며, 125M 파라미터의 단일 언어 루마니아어 BERT는 278M의 다국어 XLM-R과 대등한 성능을 보였습니다. 따라서 연산 자원 (compute)이 중요한 배포 시나리오에서 루마니아어 단일 태스크 RE를 위해 31B 모델을 사용하는 근거는 약합니다. 우리는 번역된 데이터셋, 평가 코드 및 학습된 모델을 공개합니다.

Insights

대규모 언어 모델(LLM)을 이용한 교차 언어 관계 추출: 루마니아어에 대한 Zero-Shot, Few-Shot 및 Fine-Tuned 평가

요약

핵심 포인트

댓글

해커, 테무 고객 데이터로 추정되는 정보를 판매 중이라고 주장

또 다른 암호화폐 기업, Russell 1000 지수 편입

J.P. Morgan, 스트레스 테스트 이후 500억 달러 규모의 자사주 매입 발표

Kilo CLI 실전 — roll-call로 500개 이상의 모델을 병렬 헬스 체크하기

해커, 테무 고객 데이터로 추정되는 정보를 판매 중이라고 주장

또 다른 암호화폐 기업, Russell 1000 지수 편입

J.P. Morgan, 스트레스 테스트 이후 500억 달러 규모의 자사주 매입 발표

Kilo CLI 실전 — roll-call로 500개 이상의 모델을 병렬 헬스 체크하기