Fine-Tuned PEGASUS를 통한 생성적 요약 (Abstractive Summarization) 최적화
요약
본 연구는 XL-Sum 영어 코퍼스를 활용하여 PEGASUS 모델을 미세 조정함으로써 생성적 요약 성능을 최적화하는 방법을 다룹니다. 실험 결과, 미세 조정된 PEGASUS는 mT5 베이스라인 대비 ROUGE 지표에서 유의미한 성능 향상을 보이며 최첨단 성능을 달성했습니다.
핵심 포인트
- PEGASUS 모델 미세 조정을 통한 생성적 요약 최적화
- XL-Sum 영어 코퍼스 데이터셋 활용
- mT5 베이스라인 대비 ROUGE-2 점수 15.25% 향상
- ROUGE 지표를 통한 요약 성능의 정량적 검증
생성적 텍스트 요약 (Abstractive text summarization)은 원문에서 핵심적인 문장들의 부분 집합을 추출하는 방식이 아니라, 원문의 핵심 아이디어를 포함하는 짧고 간결한 요약문을 생성하는 기술입니다. BART, T5, PEGASUS와 같은 트랜스포머 (Transformer) 모델의 도입은 이러한 요약 프로세스를 더욱 효율적이고 정확하게 만들었습니다. 본 논문의 목적은 XL-Sum 영어 코퍼스 (English corpus)에서 PEGASUS를 미세 조정 (Fine-tune)하여 베이스라인인 mT5 모델보다 더 나은 성능을 달성하는 것입니다. 미세 조정된 모델로부터 생성된 요약문의 성능은 ROUGE 지표를 사용하여 평가되며, 이 지표는 기본적으로 자동 생성된 요약문을 사람이 작성한 요약문과 비교합니다. 저희가 알고 있는 바로는, 미세 조정된 PEGASUS 모델의 결과는 XL-Sum 영어 코퍼스에서 최첨단 (State-of-the-art) 성능을 보여줍니다. 개선 사항을 정량화하면, 베이스라인 모델 대비 ROUGE-1 점수에서 4.04% 향상, ROUGE-2 점수에서 15.25% 증가, 그리고 ROUGE-L 점수에서 3.39%의 향상이 있었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기