arXiv논문2026. 05. 21. 11:52

효율적인 미세 조정(Fine-Tuning)을 위한 선호도 인지 영향 함수 기반 데이터 선택 방법

요약

LLM 미세 조정 시 데이터 효율성을 높이기 위해 모델의 현재 선호도를 반영하여 데이터에 가중치를 부여하는 PRISM 방법론을 제안합니다. PRISM은 목표 동작과 현재 모델 간의 관련성을 고려하여 데이터 예산을 최적의 샘플에 집중시킴으로써 미세 조정 및 안전 지향적 SFT의 성능을 개선합니다.

핵심 포인트

기존 데이터 선택 방식이 모든 목표 예시를 동일하게 취급하는 비효율성을 해결하기 위해 제안됨
모델의 현재 선호도를 활용하여 목표 예시에 가중치를 부여하는 선호도 인지 목표 표현 구축
PRISM은 후보 샘플과 목표 표현 간의 정렬 정도를 기준으로 데이터 점수를 매겨 예산 효율성 극대화
다양한 모델 규모에서 실험 결과, 효율적인 미세 조정과 안전 지향적 SFT 복구 성능 향상 입증

LLM(Large Language Models)이 계속해서 확장됨에 따라, 훈련 효율성을 개선하는 것은 점점 더 데이터를 더 효과적으로 사용하는 것에 달려 있습니다. 데이터 선택(Data selection)은 제한된 훈련 예산을 목표 동작(target behavior)을 가장 잘 촉진하는 샘플에 할당함으로써 이 문제를 해결합니다. 기존 방법들은 대개 일련의 목표 예시(target examples)로 목표 동작을 나타내지만, 종종 이러한 예시들을 동일하게 중요한 것으로 취급합니다. 이는 목표 예시들이 현재 모델과의 관련성 측면에서 서로 다를 수 있기 때문에 비효율적일 수 있습니다. 즉, 모델의 현재 동작과 더 가까운 예시가 멀리 떨어진 예시보다 더 실행 가능한 가이드를 제공합니다. 우리는 현재 모델의 선호도(preference)를 사용하여 목표 예시에 가중치를 부여하고 선호도 인지 목표 표현(preference-aware target representation)을 구축하는 PRISM (PReference-aware Influence-function-based Data Selection Method for Efficient Fine-Tuning)을 제안합니다. 그런 다음 PRISM은 이 표현과의 정렬(alignment) 정도에 따라 후보 훈련 샘플의 점수를 매겨, 모델을 목표 동작으로 이동시킬 가능성이 더 높은 샘플에 데이터 예산을 집중시킵니다. 이론적 분석에 따르면, 이러한 선호도 가중치 부여는 목표 동작 선호도를 높이기 위한 더 효과적인 1차 방향(first-order direction)을 제공합니다. 다양한 모델 제품군과 규모에 걸친 실험을 통해 PRISM이 효율적인 미세 조정(fine-tuning)과 안전 지향적 SFT(Supervised Fine-Tuning) 복구 모두를 개선함을 보여주며, 이는 정밀한 목표 동작 특성화가 예산 효율적인 데이터 선택의 핵심임을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

효율적인 미세 조정(Fine-Tuning)을 위한 선호도 인지 영향 함수 기반 데이터 선택 방법

요약

핵심 포인트

댓글