arXiv논문2026. 06. 02. 10:13

경량화된 신뢰성을 향하여: 대규모 언어 모델(LLM)의 환각 완화를 위한 소프트 프롬프트(Soft Prompts) 활용

요약

LLM의 환각 현상을 완화하기 위해 소프트 프롬프트를 활용하는 RCSP(Responsible Contrastive Soft Prompting) 방법론을 제안합니다. 이 방식은 매개변수 효율적인 학습을 통해 환각 억제, 불확실성 시 기권, 사실적 회상 보존 사이의 균형을 맞춥니다.

핵심 포인트

RCSP는 대조 학습과 커리큘럼 학습을 통합한 복합 손실 함수를 사용함
Gemma 3 및 Llama 3.1 모델에서 우수한 F-score를 입증함
매우 적은 매개변수만 학습하여 계산 효율성을 극대화함
환각 억제와 사실적 정보 회상 사이의 효과적인 균형 제공

대규모 언어 모델(LLMs)은 다양한 영역에서 광범위하게 채택되어 왔으나, 그 신뢰성은 그럴듯해 보이지만 사실과 다른 응답인 환각(hallucinations)에 의해 빈번하게 저해됩니다. 이해관계가 큰(high-stakes) 영역에서 이러한 오류는 신뢰도를 떨어뜨리고 실질적인 위험을 초래할 수 있습니다. 이 과제를 해결하기 위해, 우리는 생성형 질의응답(QA) 작업에서 환각 콘텐츠를 완화하고 책임감 있는 기권(responsible abstention)을 촉진하기 위해 소프트 프롬프트(soft prompts)를 사용하는 매개변수 효율적인(parameter-efficient) 접근 방식을 제시합니다. Responsible Contrastive Soft Prompting (RCSP)라고 불리는 우리의 방법은 세 가지 목표, 즉 환각 콘텐츠의 억제, 불확실성 하에서의 기권 장려, 그리고 사실적 회상(factual recall)의 보존 또는 향상의 균형을 맞추는 소프트 프롬프트를 학습시키기 위해 복합 손실(composite loss)을 사용합니다. 이러한 목표를 달성하기 위해, 우리는 학습 메커니즘에 대조 학습(contrastive loss), 커리큘럼 학습(curriculum learning), 그리고 KL 정규화(KL regularization)를 통합합니다. 우리는 LLM-as-a-Judge 프레임워크를 사용하여 다섯 가지의 다양한 생성형 QA 데이터셋에서 우리의 접근 방식을 평가합니다. Gemma 3 (12B) 및 Llama 3.1 (8B) 백본(backbones)에 대한 실험 결과는 RCSP가 사실적 회상과 환각 억제 및 기권 사이의 균형을 효과적으로 맞추며, 표준 추론(reasoning) 및 지시 기반 프롬프팅(instruction-based prompting) 베이스라인보다 일반적으로 우수한 F-score를 산출함을 입증합니다. 특히, 이러한 개선은 다른 튜닝 기술에 필요한 매개변수의 아주 일부분만을 학습함으로써 달성됩니다. 우리의 결과는 소프트 프롬프트가 LLM의 신뢰성을 향상시키기 위한 모듈식이며 계산 효율적인 경로를 제공함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

경량화된 신뢰성을 향하여: 대규모 언어 모델(LLM)의 환각 완화를 위한 소프트 프롬프트(Soft Prompts) 활용

요약

핵심 포인트

댓글