본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 29. 11:11

경사 기반 행동 벡터를 이용한 ML 지원 시스템의 진화 인지형 회귀 테스트 우선순위 지정

요약

ML 지원 시스템의 모델 업데이트 시 발생하는 성능 변화를 예측하기 위해 경사 기반 행동 벡터(GBV-PD)를 활용한 회귀 테스트 우선순위 지정 방법을 제안합니다. 테스트 케이스를 저차원 경사 벡터로 표현하여 모델 진화에 따른 손실 변화를 효율적으로 추정합니다.

핵심 포인트

  • 모델 진화에 따른 회귀 테스트 우선순위 지정의 방향성 문제 해결
  • GBV-PD를 통한 테스트 케이스의 저차원 경사 기반 벡터 구현
  • 모델을 직접 실행하지 않고도 파라미터 업데이트 정렬로 손실 변화 추정
  • 기존 비방향성 베이스라인 대비 우수한 성능 및 효율적인 캐싱 지원

ML 지원 시스템(ML-enabled system)의 머신러닝(ML) 구성 요소는 재학습(retraining), 미세 조정(fine-tuning), 최적화(optimization)를 통해 진화하므로, 이전에 유효했던 테스트 결과가 더 이상 유효하지 않을 수 있습니다. 단 한 번의 진화 단계만으로도 일부 테스트 케이스의 성능은 악화되는 반면 다른 케이스는 개선될 수 있으며, 이는 회귀 테스트 우선순위 지정(regression test prioritization)이 본질적으로 방향성을 가짐을 의미합니다. 본 논문에서는 진화 인지형 회귀 테스트 우선순위 지정을 위해 행동 벡터 공간(behavior vector space)을 실행 가능한 형태로 구현한 최초의 접근 방식인 Gradient-based Behavior Vector-Parameter Delta(GBV-PD)를 제시합니다. GBV-PD는 각 테스트 케이스를 원래 모델에서의 손실 경사(loss gradient)를 저차원으로 투영한 경사 기반 벡터(GBV, Gradient-based Vector)로 표현합니다. 그런 다음 진화된 모델의 관찰된 파라미터 업데이트(parameter update)를 동일한 PCA 기저(basis)로 투영하며, 우선순위 지정 과정에서 진화된 모델을 테스트 케이스에 직접 실행하지 않고도 결과적인 정렬(alignment)을 사용하여 각 테스트 케이스의 손실(loss)이 증가할지 감소할지를 추정합니다. 분류(classification) 및 회귀(regression) 작업에 걸친 실증적 연구를 통해, GBV-PD는 비방향성 베이스라인(non-directional baselines)보다 일관되게 우수한 성능을 보였으며 전체 경사(full-gradient) 참조 모델과 비교해도 경쟁력 있는 성능을 유지하는 동시에, 재사용 가능한 GBV 캐싱(caching)을 통해 반복적인 업데이트 시 더 나은 시간 및 저장소 프로필을 제공함을 확인했습니다. 이러한 결과는 행동 공간(behavior-space) 개념이 진화하는 ML 지원 시스템의 반복 업데이트 회귀 테스트를 위한 실용적이고 효율적인 메커니즘으로 구현될 수 있음을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0