LLM을 위한 뉴런 인식 능동적 퓨샷 학습 (Neuron-Aware Active Few-Shot Learning)
요약
LLM의 전문 분야 적응을 위해 모델 내부의 뉴런 활성화 패턴을 활용하는 NeuFS 프레임워크를 제안합니다. 기존의 출력 기반 방식 대신 뉴런의 다양성과 합의를 기준으로 샘플을 선택하여 환각을 줄이고 성능을 높입니다.
핵심 포인트
- 출력 신호 대신 모델 내부의 뉴런 역학을 활용한 샘ples 식별
- 뉴런 패턴을 통한 퓨샷 샘플의 다양성 확보 전략
- 뉴런 합의 정량화를 통해 환각 가능성이 높은 도전적 샘플 식별
- 추론 및 텍스트 분류 작업에서 기존 AFSL 대비 우수한 성능 입증
능동적 퓨샷 학습 (Active Few-Shot Learning, AFSL)은 주석(annotation)을 달기에 가장 가치 있는 미라벨링(unlabeled) 샘플을 식별하여 이를 퓨샷 데몬스트레이션 (few-shot demonstrations)으로 사용함으로써, LLM을 전문 분야에 적응시키고 인간의 주석 비용을 효과적으로 줄이는 동시에 높은 성능을 촉진합니다. 그러나 기존 방법들은 일반적으로 예측 엔트로피 (predictive entropy)나 외부 임베딩 (external embeddings)에 기반한 테스트 시점 데이터와의 의미적 유사성 (semantic similarities)과 같은 출력 수준의 신호 (output-level signals)에 의존하여 샘플을 식별하며, 이는 특정 지식 격차를 정확히 짚어낼 수 있는 모델의 내부 역학 (internal dynamics)을 간과하는 경우가 많습니다. 이러한 격차를 해소하기 위해, 우리는 선택 패러다임을 출력 수준의 대리 지표 (output-level proxies)에서 모델의 내부 역학으로 전환하는 뉴런 인식 능동적 퓨샷 학습 프레임워크인 NeuFS를 제안합니다. NeuFS는 샘플을 직접적으로 표현하기 위해 뉴런 활성화 패턴 (neuron activation patterns)을 활용하며, 다음과 같은 이중 기준 선택 전략을 포함합니다: (1) 더 넓은 예시 범위를 확보하기 위해 뉴런 패턴을 통한 퓨샷 샘플의 다양성 (diversity)을 보장하고, (2) 뉴런 합의 (neuron consensus)를 정량화함으로써 LLM이 환각 (hallucinate)을 일으키기 쉬운 정보가 풍부하고 도전적인 퓨샷 샘플을 식별하는 데 우선순위를 둡니다. 세 가지 데이터셋에 대한 실험을 통해 NeuFS가 추론 (reasoning) 및 텍스트 분류 (text classification) 작업 모두에서 뛰어나며, 기존 AFSL 베이스라인 (baselines)보다 우수한 성능을 보임을 입증했습니다. 절제 연구 (Ablation studies)는 내부 뉴런 활성화가 외부 임베딩보다 더 원칙적이고 효과적인 선택 신호를 제공한다는 점을 추가로 강조하며, 제안된 NeuFS의 우수성을 검증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기