PRIDE: 공감 대화 생성을 위한 특권 정보 강화 증류 (Privileged Information-enhanced Distillation)
요약
공감 대화 생성을 위해 학습 시에만 활용 가능한 특권 정보를 활용하는 지식 증류 방법론인 PRIDE를 제안합니다. 심리학적 주석 등을 활용해 교사 모델의 공감적 추론 능력을 소형 모델로 효과적으로 전달합니다.
핵심 포인트
- 학습 시에만 사용 가능한 특권 정보(Privileged Information) 활용
- 공감 추론 프롬프트를 통한 단계별 감정 및 상황 분석 유도
- 다중 소스 어텐션 메커니즘으로 특권 정보 통합 최적화
- 이중 정렬 손실을 통한 로짓 및 특징 수준의 견고한 지식 전달
대규모 언어 모델(Large language models)은 공감 대화(empathetic dialogue)를 위해 다양하고 문맥을 인식하는 응답을 생성하는 데 있어 상당한 능력을 입증해 왔습니다. 그러나 이들의 계산 요구 사항은 자원이 제한된 환경에서의 배포를 심각하게 제한합니다. 지식 증류(knowledge distillation)가 유망한 압축 솔루션을 제공하지만, 인간의 연결을 안내하는 암시적인 문맥적 단서(implicit contextual cues)를 간과하기 때문에 공감에 필수적인 미묘한 이해를 전달하는 데 종종 실패합니다. 이 간극을 메우기 위해, 우리는 공감 대화 생성을 위한 특권 정보 강화 지식 증류 방법(privileged information-enhanced knowledge distillation method, PRIDE)을 제안합니다. 우리의 방법은 전문가의 심리학적 주석(expert psychological annotations)이나 미래 사건 요약(future event summaries)과 같이 학습 시에만 독점적으로 사용할 수 있고 추론(inference) 시에는 사용할 수 없는 특권 정보(privileged information)를 활용합니다. 이를 통해 배포 시 추가적인 입력에 의존하지 않고도 교사 모델(teacher model)의 공감적 추론(empathetic reasoning)을 더 작은 모델로 전달할 수 있습니다. 구체적으로, PRIDE는 세 가지 핵심 구성 요소를 가집니다: (1) 교사가 공감 과정을 감정 이해와 상황 분석으로 단계별로 명시적으로 분해하도록 안내하는 공감 추론 프롬프트(empathy-reasoning prompt); (2) 학생 모델(student model)이 특권 정보를 효과적으로 통합하도록 유도하는 다중 소스 어텐션 메커니즘(multi-source attention mechanism); (3) 로짓(logit) 및 특징(feature) 수준 모두에서 견고한 지식 전달을 보장하기 위해 역 Kullback-Leibler 발산(reversed Kullback-Leibler divergence)과 최대 평균 불일치(maximum mean discrepancy)를 결합한 이중 정렬 손실(dual-alignment loss). 멀티모달(multi-modal) 및 텍스트 전용(text-only) 데이터셋에 대한 실험은 우리의 방법이 경쟁력 있는 성능을 달성하며, 일부 경우에는 정확도와 의미적 관련성(semantic relevance) 측면에서 더 큰 교사 모델과 일치하거나 심지어 능가함을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기