본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 04. 20:03

Backward Spreading 에서 Forward Replay 로: LLM 파라미터 편집의 타겟 구성 재검토

요약

기존 LLM 파라미터 편집 기법은 목표 레이어에서 계산된 이상적인 히든 스테이트를 이전 레이어로 역전파(backward spreading)하여 적용하는 방식이었습니다. 본 논문은 이 방법의 이론적 한계와 실패 모드를 분석하고, 이를 개선한 새로운 접근 방식을 제안합니다. 새롭게 제안된 'Forward Replay' 기법은 첫 번째 편집 레이어에서 앵커 포인트를 최적화하고 이를 순전파(forward propagation)하여 모든 후속 레이어의 타겟 히든 스테이트를 얻습니다. 이 방법은 기존 방식과 동일한 계산 복잡도를 유지하면서도 더 정확하고 상호 호환성이 높은 레이어별 타겟을 생성합니다.

핵심 포인트

  • 기존 LLM 파라미터 편집은 'Backward Spreading' 방식을 사용하며, 이는 이론적 기반 연구가 부족했습니다.
  • 제안된 대안인 'Forward Replay'는 첫 번째 편집 레이어에서 앵커 포인트를 최적화하는 방식으로 작동합니다.
  • 이 방식은 순전파(forward propagation)를 활용하여 모든 후속 레이어에 정확하고 상호 호환 가능한 타겟 히든 스테이트를 생성합니다.
  • Forward Replay는 기존 방법과 동일한 계산 복잡도를 유지하면서도 더 높은 정확도의 편집 결과를 제공합니다.

LLM 파라미터 편집 방법은 일반적으로 목표 레이어 (anchor point) 의 이상적인 타겟 히든 스테이트를 계산하고, 이를 여러 이전 레이어로 분배하는 방식 (backward spreading) 을 사용합니다. 이는 오랫동안 널리 사용되어 왔으나, 그 근본 원리는 체계적으로 연구되지 않았습니다. 본 논문에서는 이 방법의 기초를 체계적으로 연구하여, 그 능력의 한계, 실용적 고려사항 및 잠재적 실패 모드를 명확히 합니다. 또한, backward spreading 을 forward-propagation 으로 대체하는 간단하고 우아한 대안을 제안합니다. 마지막 편집 레이어에서 타겟을 최적화하는 것이 아니라, 첫 번째 편집 레이어에서 anchor point 를 최적화하고 이를 앞으로 전파하여 모든 후속 편집 레이어에 대해 정확한 상호 호환 가능한 타겟 히든 스테이트를 얻습니다. 이 방법은 기존 방법과 동일한 계산 복잡도를 달성하면서도 더 정확한 레이어별 타겟을 생성합니다. 본 방법은 초기 타겟 히든 스테이트 또는 후속 편집 파이프라인의 다른 구성 요소와 간섭하지 않는 단순한 접근법으로, 다양한 LLM 파라미터 편집 방법에게 이점을 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0