적은 데이터, 큰 노이즈: 강건한 매개변수 효율적 미세 조정(PEFT)을 위한 적대적 학습
요약
적은 데이터와 높은 노이즈 환경에서 PEFT의 강건성을 높이기 위한 SDBN 프레임워크를 제안합니다. 적대적 학습을 도입하여 모델의 일반화 능력을 향상시키며, 저자원 환경에서도 뛰어난 성능을 보입니다.
핵심 포인트
- PEFT에 적대적 학습을 결합한 SDBN 프레임워크 제안
- 데이터 부족 및 노이즈 상황에서의 모델 강건성 개선
- SDBN-h(문자 편집) 및 SDBN-p(LLM 생성 변형) 방식 도입
- 추가 매개변수나 과도한 계산 비용 없이 성능 최적화
매개변수 효율적 미세 조정 (Parameter-Efficient Fine-Tuning, PEFT)은 파운데이션 모델 (foundation models)을 다운스트림 NLP 태스크에 적응시키는 데 필수적인 요소가 되었습니다. 그러나 현재의 PEFT 방법들은 노이즈에 대한 강건성 (robustness) 문제와 제한된 학습 데이터에서의 성능 저하 문제로 어려움을 겪는 경우가 많습니다. 우리는 SDBN (Small Data Big Noise)을 제안합니다. 이는 PEFT에 적대적 학습 (adversarial training)을 도입한 통합 프레임워크입니다. 적대적 학습과 PEFT는 서로 보완적인 강점을 가짐에도 불구하고 PEFT 환경에서는 연구가 미비한 조합이며, SDBN은 모델의 강건성과 일반화 (generalization) 능력을 향상시켜 기존의 다른 접근 방식들을 능가합니다. 또한 우리는 이산적 불확실성 집합 (discrete uncertainty sets)을 사용하는 두 가지 변형 방법을 소개합니다. 하나는 문자 수준의 편집 (character-level edits)을 열거하고 그래디언트 (gradients)를 사용하여 최악의 사례 변형을 선택하는 SDBN-h이며, 다른 하나는 생성 태스크에서의 강건한 최적화 (robust optimization)를 위해 LLM이 생성한 변형을 사용하는 SDBN-p입니다. 다양한 벤치마크를 통한 실험 결과, 특히 저자원 (low-resource) 환경과 단어 수준 및 문자 수준의 오염 (corruptions) 상황 모두에서 상당한 개선이 있음을 확인했습니다. 이 프레임워크는 추가적인 매개변수를 도입하거나 과도한 계산 오버헤드 (computational overhead)를 발생시키지 않으면서도, 적대적 학습과 매개변수 효율적 적응 (parameter-efficient adaptation) 사이의 미개척 영역을 다룹니다. 이를 통해 데이터 부족과 언어적 변동성 (linguistic variability)이 공존하는 실제 시나리오에서 PEFT 배포를 더욱 신뢰할 수 있게 만듭니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기