arXiv논문2026. 06. 29. 11:11

경사 기반 행동 벡터를 이용한 ML 지원 시스템의 진화 인지형 회귀 테스트 우선순위 지정

요약

ML 지원 시스템의 모델 업데이트 시 발생하는 성능 변화를 예측하기 위해 경사 기반 행동 벡터(GBV-PD)를 활용한 회귀 테스트 우선순위 지정 방법을 제안합니다. 테스트 케이스를 저차원 경사 벡터로 표현하여 모델 진화에 따른 손실 변화를 효율적으로 추정합니다.

핵심 포인트

모델 진화에 따른 회귀 테스트 우선순위 지정의 방향성 문제 해결
GBV-PD를 통한 테스트 케이스의 저차원 경사 기반 벡터 구현
모델을 직접 실행하지 않고도 파라미터 업데이트 정렬로 손실 변화 추정
기존 비방향성 베이스라인 대비 우수한 성능 및 효율적인 캐싱 지원

ML 지원 시스템(ML-enabled system)의 머신러닝(ML) 구성 요소는 재학습(retraining), 미세 조정(fine-tuning), 최적화(optimization)를 통해 진화하므로, 이전에 유효했던 테스트 결과가 더 이상 유효하지 않을 수 있습니다. 단 한 번의 진화 단계만으로도 일부 테스트 케이스의 성능은 악화되는 반면 다른 케이스는 개선될 수 있으며, 이는 회귀 테스트 우선순위 지정(regression test prioritization)이 본질적으로 방향성을 가짐을 의미합니다. 본 논문에서는 진화 인지형 회귀 테스트 우선순위 지정을 위해 행동 벡터 공간(behavior vector space)을 실행 가능한 형태로 구현한 최초의 접근 방식인 Gradient-based Behavior Vector-Parameter Delta(GBV-PD)를 제시합니다. GBV-PD는 각 테스트 케이스를 원래 모델에서의 손실 경사(loss gradient)를 저차원으로 투영한 경사 기반 벡터(GBV, Gradient-based Vector)로 표현합니다. 그런 다음 진화된 모델의 관찰된 파라미터 업데이트(parameter update)를 동일한 PCA 기저(basis)로 투영하며, 우선순위 지정 과정에서 진화된 모델을 테스트 케이스에 직접 실행하지 않고도 결과적인 정렬(alignment)을 사용하여 각 테스트 케이스의 손실(loss)이 증가할지 감소할지를 추정합니다. 분류(classification) 및 회귀(regression) 작업에 걸친 실증적 연구를 통해, GBV-PD는 비방향성 베이스라인(non-directional baselines)보다 일관되게 우수한 성능을 보였으며 전체 경사(full-gradient) 참조 모델과 비교해도 경쟁력 있는 성능을 유지하는 동시에, 재사용 가능한 GBV 캐싱(caching)을 통해 반복적인 업데이트 시 더 나은 시간 및 저장소 프로필을 제공함을 확인했습니다. 이러한 결과는 행동 공간(behavior-space) 개념이 진화하는 ML 지원 시스템의 반복 업데이트 회귀 테스트를 위한 실용적이고 효율적인 메커니즘으로 구현될 수 있음을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

경사 기반 행동 벡터를 이용한 ML 지원 시스템의 진화 인지형 회귀 테스트 우선순위 지정

요약

핵심 포인트

댓글