LLM을 위한 뉴런 인식 능동적 퓨샷 학습 (Neuron-Aware Active Few-Shot Learning)

능동적 퓨샷 학습 (Active Few-Shot Learning, AFSL)은 주석(annotation)을 달기에 가장 가치 있는 미라벨링(unlabeled) 샘플을 식별하여 이를 퓨샷 데몬스트레이션 (few-shot demonstrations)으로 사용함으로써, LLM을 전문 분야에 적응시키고 인간의 주석 비용을 효과적으로 줄이는 동시에 높은 성능을 촉진합니다. 그러나 기존 방법들은 일반적으로 예측 엔트로피 (predictive entropy)나 외부 임베딩 (external embeddings)에 기반한 테스트 시점 데이터와의 의미적 유사성 (semantic similarities)과 같은 출력 수준의 신호 (output-level signals)에 의존하여 샘플을 식별하며, 이는 특정 지식 격차를 정확히 짚어낼 수 있는 모델의 내부 역학 (internal dynamics)을 간과하는 경우가 많습니다. 이러한 격차를 해소하기 위해, 우리는 선택 패러다임을 출력 수준의 대리 지표 (output-level proxies)에서 모델의 내부 역학으로 전환하는 뉴런 인식 능동적 퓨샷 학습 프레임워크인 NeuFS를 제안합니다. NeuFS는 샘플을 직접적으로 표현하기 위해 뉴런 활성화 패턴 (neuron activation patterns)을 활용하며, 다음과 같은 이중 기준 선택 전략을 포함합니다: (1) 더 넓은 예시 범위를 확보하기 위해 뉴런 패턴을 통한 퓨샷 샘플의 다양성 (diversity)을 보장하고, (2) 뉴런 합의 (neuron consensus)를 정량화함으로써 LLM이 환각 (hallucinate)을 일으키기 쉬운 정보가 풍부하고 도전적인 퓨샷 샘플을 식별하는 데 우선순위를 둡니다. 세 가지 데이터셋에 대한 실험을 통해 NeuFS가 추론 (reasoning) 및 텍스트 분류 (text classification) 작업 모두에서 뛰어나며, 기존 AFSL 베이스라인 (baselines)보다 우수한 성능을 보임을 입증했습니다. 절제 연구 (Ablation studies)는 내부 뉴런 활성화가 외부 임베딩보다 더 원칙적이고 효과적인 선택 신호를 제공한다는 점을 추가로 강조하며, 제안된 NeuFS의 우수성을 검증합니다.

Insights

LLM을 위한 뉴런 인식 능동적 퓨샷 학습 (Neuron-Aware Active Few-Shot Learning)

요약

핵심 포인트

댓글

Claude Code의 스테가노그래피(Steganography)가 중국 사용자들을 식별하여 Anthropic이 기능을 롤백함

실시간 음성 에이전트 구축하기: 800ms 미만의 지연 시간 예산과 끼어들기 (Barge-In)

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때

Claude Code의 스테가노그래피(Steganography)가 중국 사용자들을 식별하여 Anthropic이 기능을 롤백함

실시간 음성 에이전트 구축하기: 800ms 미만의 지연 시간 예산과 끼어들기 (Barge-In)

Long-Context vs RAG: 1M 토큰이 검색 파이프라인을 대체할 때