arXiv논문2026. 06. 04. 13:45

심층 신경망 (DNN)을 위한 잠재 앵커 기반 테스트 생성

요약

심층 신경망(DNN)의 취약점을 식별하기 위해 잠재 공간을 활용하는 블랙박스 테스트 프레임워크 'Latte'를 제안합니다. VQ-VAE를 통해 의미론적 유사성을 유지하면서도 결함 노출과 다양성을 극대화하는 테스트 케이스 생성이 가능합니다.

핵심 포인트

VQ-VAE 기반의 단일 단계 잠재 변이 방식 제안
의미론적 드리프트 최소화 및 결함 다양성 확보
기존 방식 대비 동일 예산 내 높은 결함 노출 성능
다양한 데이터셋과 모델을 통한 프레임워크 검증

심층 신경망 (Deep Neural Networks, DNNs)이 보안이 중요하거나 안전에 민감한 애플리케이션에 점점 더 많이 배치됨에 따라, 모델의 약점을 식별하고 완화하기 위한 엄격한 테스트가 필수적이 되고 있습니다. 기존의 DNN 테스트 접근 방식은 입력 공간 (input space) 또는 학습된 잠재 공간 (latent space) 중 하나를 탐색합니다. 잠재 공간 생성이 직접적인 입력 공간 변이 (input-space mutation)보다 타당성 (plausibility)을 더 잘 유지할 수 있지만, 현재의 방법들은 여전히 탐색 제어 가능성 (exploration controllability), 결함 다양성 (failure diversity), 그리고 시드 상대적 의미론적 드리프트 (seed-relative semantic drift) 사이의 트레이드오프 문제에 직면해 있습니다. 이러한 한계를 극복하기 위해, 우리는 잠재 공간을 활용하여 의미론적으로 근접하고, 다양하며, 결함을 드러내는 테스트 케이스를 생성하는 블랙박스 테스트 프레임워크인 Latte를 제안합니다. 구체적으로, Latte는 사전 학습된 VQ-VAE를 사용하여 각 입력 시드 (input seed)를 인코딩하고, 다른 클래스에서 샘플링된 앵커 (anchors)에 의해 정의된 방향을 따라 시드 중심의 단일 단계 잠재 변이 (one-step latent mutation)를 수행한 다음, 양자화 (quantization) 및 입력 공간으로의 디코딩을 수행합니다. 이는 학습된 잠재 매니폴드 (latent manifold) 내에서 각 시드 주변의 국소 이웃 (local neighborhoods)을 탐색하며, 그 결과 동일한 예산 (budget) 하에서 오라클을 트리거하는 예측 불일치 (prediction discrepancies)의 수와 다양성을 더 넓게 확보할 수 있습니다. 우리는 단일 모델 및 다중 모델 테스트 시나리오에서 5개의 데이터셋과 10개의 DNN 모델을 대상으로 Latte를 평가했습니다. 평가된 데이터셋과 모델 전반에 걸쳐, Latte는 동일한 테스트 예산 하에서 결함 노출 (fault exposure)과 행동 다양성 (behavioral diversity)을 향상시킵니다. 단일 모델 설정 하에서, Latte는 소스 시드에 대해 낮은 시드 상대적 의미론적 드리프트 (seed-relative semantic drift)를 유지합니다.

AI 자동 생성 콘텐츠

원문 바로가기

심층 신경망 (DNN)을 위한 잠재 앵커 기반 테스트 생성

요약

핵심 포인트

댓글