arXiv논문2026. 06. 04. 13:15

인컨텍스트 러닝 (In-Context Learning)을 위한 활성화 기반 능동 학습 (Active Learning): 과제와 통찰

요약

본 논문은 트랜스포머의 MLP 활성화 값을 활용하여 인컨텍스트 러닝을 위한 샘플을 선택하는 능동 학습 방법론을 분석합니다. Llama-3.2-3B 및 Qwen2.5-3B 모델 실험 결과, 활성화 기반 샘플링이 예시 품질이나 성능과 상관관계가 낮음을 발견했습니다.

핵심 포인트

MLP 활성화 기반 샘플링과 작업 성능 간 상관관계 미비
스피어만 상관계수 최대 0.33으로 낮은 유효성 확인
중첩(Superposition) 현상이 성능 상관관계 저해 원인으로 추정
향후 SAE(Sparse Autoencoders) 활용 연구의 필요성 제시

심층 능동 학습 (Deep active learning)은 이전에 LLM의 인컨텍스트 샘플 선택을 위해 탐구된 바 있으나, 트랜스포머 (Transformer) 활성화 (Activations)에 대한 이해의 최신 발전을 활용하는 방식으로는 이루어지지 않았습니다. 본 논문에서는 모델 활성화가 인컨텍스트 예시 (In-context examples) 선택을 최적화하기 위한 세밀한 신호를 제공할 수 있다는 가설을 테스트합니다. 우리는 Llama-3.2-3B 및 Qwen2.5-3B 베이스 모델을 사용하여, 다양한 분류 및 생성 데이터셋 전반에서 서로 다른 어텐션 마스킹 (Attention masking) 전략이 능동 학습에 미치는 영향을 포함하여, 인컨텍스트 러닝 (In-context learning)에 적용된 MLP 활성화 기반 심층 능동 학습 방법론에 대해 현재까지 가장 포괄적인 분석을 제시합니다. 그러나 우리는 부정적인 결과를 발견했습니다. 대규모 활성화 또는 처음 4개의 모멘트 (First four moments)의 관점에서 본 MLP 출력은 예시의 품질이나 작업 성능과 상관관계가 없었습니다. 구체적으로, 우리가 테스트한 모든 작업과 모델에 대해 스피어만 상관계수 (Spearman correlation coefficient)의 절대값은 최대 0.33에 불과했으며, 이는 이러한 활성화 기반 샘플링이 인컨텍스트 러닝에 사용되어서는 안 된다는 것을 보여줍니다. 우리는 이것이 모델이 차원 수보다 더 많은 특징을 표현하는 중첩 (Superposition) 현상 때문일 수 있다고 가설을 세우며, 이는 희소 오토인코더 (Sparse Autoencoders, SAEs)와 같은 방법이 유망한 미래 방향이 될 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

인컨텍스트 러닝 (In-Context Learning)을 위한 활성화 기반 능동 학습 (Active Learning): 과제와 통찰

요약

핵심 포인트

댓글