본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 10:58

DIVE: 자기 제한적 그래디언트 업데이트를 통한 임베딩 압축

요약

DIVE는 대규모 언어 모델의 고차원 임베딩을 효율적으로 압축하기 위해 제안된 새로운 어댑터 기술입니다. 기존 압축 방식이 소규모 데이터셋에서 과적합되어 성능이 저하되는 문제를 해결하기 위해 자기 제한적 힌지 기반 트리플렛 손실과 헤드 단위의 NT-Xent 대조 손실을 도입했습니다. 실험 결과, DIVE는 다양한 데이터셋과 압축 비율에서 기존 베이스라인보다 우수한 검색 성능을 입증했습니다.

핵심 포인트

  • 기존 임베딩 압축 방식의 고질적인 문제인 소규모 데이터셋에서의 과적합 문제를 해결함
  • 자기 제한적 힌지 기반 트리플렛 손실을 통해 사전 학습된 임베딩 공간의 섭동을 제한함
  • 헤드 단위의 NT-Xent 대조 손실을 사용하여 암시적 뷰(implicit views)를 통한 밀집된 자기 지도 학습 그래디언트를 제공함
  • 6개의 BEIR 데이터셋 테스트 결과, 모든 압축 비율에서 기존 어댑터 대비 우수한 성능을 기록함

대규모 언어 모델 (LLM)의 고차원 임베딩은 벡터 검색 시스템에 상당한 저장 및 계산 비용을 발생시킵니다. Matryoshka-Adaptor (EMNLP 2024), Search-Adaptor (ACL 2024), 그리고 SMEC (EMNLP 2025)를 포함한 최근의 임베딩 압축 방법들은 경량 잔차 어댑터 (lightweight residual adapters)를 통해 차원 축소를 가능하게 하지만, 이들의 학습 목적 함수는 레이블이 지정된 데이터가 부족할 때 심각한 과적합 (overfitting)을 유발하여 검색 성능을 고정된 베이스라인 (frozen baseline) 미만으로 저하시킵니다. 우리는 두 가지 메커니즘을 통해 이러한 실패 문제를 해결하는 압축 어댑터인 \textsc{DIVE} (\textbf{D}imensionality reduction with \textbf{I}mplicit \textbf{V}iew \textbf{E}nsembles)를 제안합니다. 첫째, 자기 제한적 힌지 기반 트리플렛 손실 (self-limiting hinge-based triplet loss)은 트리플렛이 마진 제약 조건을 만족하면 그래디언트 (gradient)를 0으로 생성하여, 사전 학습된 임베딩 공간에 적용되는 총 섭동 (perturbation)을 제한합니다. 둘째, 헤드 단위의 NT-Xent 대조 손실 (head-wise NT-Xent contrastive loss)은 각 임베딩의 여러 학습된 투영 (projections)을 암시적 뷰 (implicit views)로 취급하여, 소규모 데이터셋에서 트리플렛 신호의 희소성을 보완하는 밀집된 자기 지도 학습 (self-supervised) 그래디언트를 제공합니다. 6개의 BEIR 데이터셋에 걸쳐, \textsc{DIVE}는 1,400만 개의 파라미터를 가진 오픈 소스 구현을 통해 모든 데이터셋과 모든 평가된 압축 비율에서 세 가지 베이스라인 어댑터보다 우수한 성능을 보였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0