arXiv논문2026. 06. 11. 12:20

CCL25-Eval Task 5 시스템 보고서: 새로운 데이터셋 및 LoRA 미세 조정된 Qwen2.5

요약

본 보고서는 고전 중국어 시 번역 및 감정 이해 분야의 한계를 극복하고자 합니다. 연구진은 49,404개의 고품질 데이터셋(CCPoetry-49K)을 구축하고, 이를 활용하여 Qwen2.5-14B 모델에 LoRA 미세 조정을 적용한 'PoetryQwen'이라는 도메인 특화 LLM을 제안했습니다. 실험 결과, PoetryQwen은 기존 모델 대비 성능 향상을 입증하며 해당 분야의 새로운 방법론적 기반을 제시합니다.

핵심 포인트

고전 중국어 시 번역/감정 이해는 독특한 도메인 특성이 필요함.
CCPoetry-49K라는 4만 개 이상의 고품질 데이터셋을 구축하여 한계를 극복함.
LoRA를 활용해 Qwen2.5-14B 모델을 미세 조정(PoetryQwen)하여 성능을 개선함.
제안된 PoetryQwen은 기존 기준선 대비 높은 성능 향상을 보임.

최근 대규모 언어 모델(LLMs)은 고전 중국어 번역과 고전 시 창작 분야에서 유망한 발전을 이루었습니다. 하지만, 고전 시의 정밀한 번역 및 감정-의미론적 이해에 대한 도메인 특화 연구는 여전히 제한적입니다. 주요 과제는 대부분의 연구가 시적 감상 작업을 일반 영역 문제로 취급하여 시적 감상의 독특한 특징을 간과하고 있다는 점이며, 고품질의 도메인 특화 데이터셋이 극도로 부족하다는 것입니다. 이러한 한계를 해결하기 위해, 저희는 이 작업을 세 가지 하위 작업으로 분해했습니다: 용어 해석(term interpretation), 의미 해석(semantic interpretation), 그리고 감정 추론(emotional inference). 여러 오픈 소스 데이터셋을 기반으로 데이터 정제 및 정렬을 수행하여, 본 도메인에 명시적으로 최적화된 49,404개의 고품질 명령어-응답 쌍으로 구성된 고전 중국어 시 명령어 쌍 데이터셋(CCPoetry-49K)을 구축했습니다. 그런 다음, Low-Rank Adaptation (LoRA)을 적용하여 Qwen2.5-14B 모델을 미세 조정함으로써 'PoetryQwen'이라는 도메인 특화 LLM을 제안합니다. CCL25-Eval Task 5 벤치마크에서의 실험 결과는 PoetryQwen이 Qwen2.5-14B-Instruct 기준선(0.690) 대비 9.7% 향상된 점수인 0.757의 점수를 달성했음을 보여줍니다. 이러한 발견은 PoetryQwen이 고전 시의 정밀한 번역 및 감정 이해 성능을 크게 향상시킨다는 것을 명확하게 나타냅니다. 저희는 LLM의 도메인 특화 최적화를 지원하기 위한 새로운 데이터셋과 방법론적 고려 사항들을 제시합니다.

AI 자동 생성 콘텐츠

원문 바로가기

CCL25-Eval Task 5 시스템 보고서: 새로운 데이터셋 및 LoRA 미세 조정된 Qwen2.5

요약

핵심 포인트

댓글