대규모 언어 모델(LLM)에서의 문맥 특성 민감도 발현
요약
본 연구는 LLM의 지시어 미세 조정(IFT) 단계에 따라 문맥 특성 민감도가 어떻게 변화하는지 분석합니다. SFT, DPO, RLVR 과정을 거치며 모델이 문맥을 활용하는 방식이 능동적으로 재형성됨을 실험을 통해 입증했습니다.
핵심 포인트
- SFT 단계에서 모델은 길이와 유사도가 높은 문맥을 선호하는 경향을 보임
- IFT 단계별로 문맥 활용 방식이 능동적으로 재형성됨을 확인
- 견고한 문맥 활용을 위해 균형 잡힌 IFT 데이터셋 설계가 필수적임
지시어 미세 조정 (Instruction Fine-Tuning, IFT) 과정에서 대규모 언어 모델 (Large Language Models, LLMs)은 제공된 문맥 (Context)을 사용하여 질의 (Query)에 답함으로써 지시를 따르는 법을 학습합니다. 기존 연구들은 문맥의 특성이 LLM의 문맥 사용 방식과 어떻게 상관관계를 갖는지 연구해 왔으나, 이러한 분석은 추론 (Inference) 단계에 국한되어 있어, 이러한 관계가 애초에 어떻게 습득되는지에 대해서는 여전히 미지의 영역으로 남아 있습니다. 본 연구에서는 지도 미세 조정 (Supervised Fine-Tuning, SFT), 직접 선호 최적화 (Direct Preference Optimization, DPO), 그리고 검증 가능한 보상을 활용한 강화학습 (Reinforcement Learning with Verifiable Rewards, RLVR)과 같은 연속적인 IFT 단계에 따라 모델의 이러한 특성에 대한 민감도가 어떻게 변화하는지 측정합니다. 4개의 모델과 3개의 데이터셋을 대상으로 한 실험 결과, SFT는 모델이 높은 길이 (Length), 문맥-질의 유사도 (Context-query similarity), 유창성 (Fluency)을 포함하는 것과 같이 이해하기 쉬운 문맥을 사용할 가능성을 더 높인다는 것을 보여줍니다. SFT 이후의 역학 (Dynamics)은 훈련 데이터셋에 따라 이러한 선호도를 강화하거나 해결할 수도 있습니다. 우리의 연구 결과는 문맥 사용 방식이 각 IFT 단계에서 능동적으로 재형성된다는 것을 밝혀냈으며, 지시어 미세 조정된 모델의 견고한 문맥 활용을 보장하기 위해서는 균형 잡힌 IFT 데이터셋을 설계하는 것이 중요하다는 점을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기