arXiv논문2026. 06. 24. 11:16

태스크와 목적의 매칭: 인코더-디코더 사전 학습 언어 모델을 위한 미세 조정(Fine-Tuning) 및 프롬프트

요약

인코더-디코더 언어 모델의 성능을 극대화하기 위해 태스크와 사전 학습 목적 함수를 매칭하는 MTO 프레임워크를 제안합니다. 이 방식은 퓨샷 설정에서 기존 방식 대비 120% 이상의 성능 향상을 보이며, 프롬프트 튜닝 최적화에도 효과적입니다.

핵심 포인트

태스크와 목적 함수를 매칭하는 MTO 프레임워크 제안
퓨샷 설정에서 기존 방식 대비 120% 이상의 성능 향상 달성
사전 학습 및 미세 조정 단계의 목적 함수 일치 강조
소프트 프롬프트 엔지니어링 및 최적화 가이드 제공

프롬프트 기반 학습(Prompt-based learning)은 자연어 처리(NLP) 분야에서 지배적인 패러다임으로 부상했습니다. 본 연구는 상식 지식 검색 및 완성에 초점을 맞추어, 생성(generation) 및 질의응답(question answering) 태스크 전반에 걸쳐 다양한 사전 학습 목적 함수(pre-training objectives)가 인코더-디코더 사전 학습 언어 모델(encoder-decoder pre-trained language models)의 성능에 미치는 영향을 탐구합니다. 우리는 사전 학습(pre-training)과 미세 조정(fine-tuning) 단계 모두에서 다중 목적 함수를 통합하는 것의 이점을 강조합니다. 우리는 태스크를 목적에 매칭하는(Match Task to Objective, MTO) 프레임워크와 주어진 태스크에 적합한 목적 함수를 결정하는 방법을 소개합니다. 이 프레임워크는 식별된 목적 함수를 기반으로, 비지도 학습(unsupervised training)을 통해 적응(adaptation)을 위한 태스크 관련 데이터를 준비하는 자동화된 방법을 제공합니다. 미세 조정(fine-tuning) 단계에서는 사전 학습 및 적응 단계의 목적 함수와 일치하는 새로운 템플릿을 설계합니다. 태스크 요구 사항과 일치할 때, 이러한 전략은 퓨샷(few-shot) 설정에서 기존 방식 대비 120% 이상의 성능 향상을 달성할 수 있습니다. 이들은 퓨샷 설정에서 관련 연구들을 크게 능가하며, 전체 데이터셋(full-dataset) 시나리오에서도 베이스라인(baseline)을 초과합니다. 나아가, 우리는 이 접근 방식을 프롬프트 튜닝(prompt-tuning) 방법론까지 확장하여, 더욱 효과적인 소프트 프롬프트 엔지니어링(soft prompt engineering) 및 최적화를 위한 가이드를 제공합니다. 우리의 전략은 프롬프트 튜닝 성능 또한 크게 향상시킵니다. 이러한 통찰은 특정 태스크에 맞춤화된 모델의 선택과 최적화를 정밀하게 안내한다는 점에서 상당한 가치를 지닙니다. 코드는 https://github.com/puraminy/MTO/ 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

태스크와 목적의 매칭: 인코더-디코더 사전 학습 언어 모델을 위한 미세 조정(Fine-Tuning) 및 프롬프트

요약

핵심 포인트

댓글