언어 모델을 이용한 연구 논문 제목의 자동 생성
요약
본 연구는 초록을 기반으로 연구 논문의 제목을 자동으로 생성하는 기술을 제안합니다. 새로운 데이터셋인 SpringerSSAT를 소개하며, 다양한 LLM의 성능을 비교 분석했습니다.
핵심 포인트
- 초록 기반 논문 제목 자동 생성 기술 제안
- 새로운 사회과학 데이터셋 SpringerSSAT 소개
- Fine-tuned PEGASUS-large가 주요 지표에서 우수한 성능 기록
- ChatGPT의 창의적인 논문 제목 생성 능력 입증
연구 논문의 제목은 논문의 주요 아이디어와 때로는 결론을 명확하고 간결하게 전달합니다. 적절한 제목을 선택하는 것은 종종 어려운 일이며, 자동화된 제목 생성은 저자들이 이 작업을 수행하는 데 도움을 줄 수 있습니다. 본 연구에서는 오픈 웨이트 (open-weight) 사전 학습된 대규모 언어 모델 (LLM)을 사용하여 초록 (abstract)으로부터 논문 제목을 생성하는 기술을 제안합니다. 우리는 CSPubSum 및 LREC-COLING-2024 데이터셋을 사용하며, 사회과학 분야의 4개 Springer 저널에서 선별한 새로운 데이터셋인 SpringerSSAT를 소개합니다. 또한, 제로샷 (zero-shot) 설정에서 GPT-3.5-turbo를 사용하여 제목을 생성합니다. 모델 성능은 ROUGE, METEOR, MoverScore, BERTScore 및 SciBERTScore 지표로 평가됩니다. 실험 결과, 미세 조정된 (fine-tuned) PEGASUS-large가 미세 조정된 LLaMA-3-8B 및 제로샷 GPT-3.5-turbo를 포함한 다른 모델들보다 대부분의 지표에서 더 나은 성능을 보임을 확인했습니다. 나아가 우리는 ChatGPT가 창의적인 논문 제목을 생성할 수 있음을 입증합니다. 전반적으로 AI가 생성한 제목은 일반적으로 적절하고 신뢰할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기