SURGELLM: 클래스 균형 정규화(Class-Balanced Normalization)와 태스크 인지적 특징 게이팅(Task-Aware
요약
SURGELLM은 NLP 태스크 간의 귀납적 편향 불일치와 클래스 불균형 문제를 해결하기 위한 통합 트랜스포머 프레임워크입니다. 수술적 특징 게이트와 인스턴스 가중 정규화(IWN)를 통해 다양한 태스크에서 성능을 크게 향상시켰습니다.
핵심 포인트
- 클래스 불균형 오염을 해결하는 인스턴스 가중 정규화(IWN) 도입
- 태스크 인지적 특징 게이팅을 통한 효율적인 특징 선택
- SST-2, 저자 탐지 등 다양한 NLP 태스크에서 높은 성능 입증
- 특징 정렬의 이점을 수학적 초과 위험 경계로 증명
이질적인 NLP 태스크 전반에 배치된 미세 조정된(Fine-tuned) 인코더들은 세 가지 복합적인 문제에 직면합니다: 일치하지 않는 귀납적 편향(inductive biases), 특징 통계량의 클래스 불균형 오염(class-imbalance corruption), 그리고 외부 어휘 지식에 따라 어텐션(attention)을 조건화할 메커니즘의 부재입니다. 우리는 각 문제를 전용 경량 모듈로 해결하는 통합 트랜스포머(transformer) 프레임워크인 \textbf{\surgellm}을 소개합니다: \emph{수술적 특징 게이트(surgical feature gate)} (선별된 어휘 지표 및 \texttt{[CLS]}에 대해 차원별로 학습된 시그모이드(sigmoid); 특징이 유익하지 않을 때 항등 함수(identity)로 퇴화함이 증명됨), \emph{태스크 조건부 접두사 토큰(task-conditioned prefix tokens)} (양자화된 특징 값과 태스크 식별자를 모든 입력 앞에 추가), 그리고 \emph{인스턴스 가중 정규화(Instance-Weighted Normalization, IWN)} (게이트 통계량에서 클래스 사전 확률 편향을 제거)입니다. 우리는 게이트의 이점과 \emph{수술적 특징 정렬(surgical feature alignment)}을 연결하는 초과 위험 경계(excess-risk bound)를 증명합니다. SST-2, 멀티홉 검색(multi-hop retrieval), LLM 프롬프트 귀속(LLM-prompt attribution), 저자 탐지(authorship detection)를 포함하는 4개의 태스크에 대해, 17,830개의 예시와 3개의 시드에 걸친 11개의 모델 변형을 대상으로 실험한 결과, IWN 변형은 macro-F1 \textbf{0.940}을 달성했습니다 (가장 강력한 비-IWN 베이스라인 대비 $+0.036$; 저자 탐지에서 $+0.130$). 무작위 어휘 대조군($-0.028$ 평균 F1)은 이러한 이점이 파라미터(parametric)가 아닌 어휘적(lexical)인 것임을 확인시켜 줍니다. 코드, 어휘집, 그리고 $99.5%$ 복구 자동 추출 레시피가 공개되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기