arXiv논문2026. 06. 18. 12:30

네트워크 침입 데이터셋을 활용한 XGBoost 모델의 머신 언러닝 (Machine Unlearning)

요약

정형 데이터 기반의 네트워크 침입 탐지 환경에서 XGBoost 모델의 특정 데이터를 효율적으로 제거하는 'XGBoost-Forget' 기술을 제안합니다. IoT-23 및 GeNIS 데이터셋 실험을 통해 기존 딥러닝 중심의 머신 언러닝 연구 공백을 메우고 성능과 효율성을 입증했습니다.

핵심 포인트

전체 재학습 없이 특정 데이터를 제거하는 머신 언러닝 기술 제안
정형 데이터(Tabular Data) 및 XGBoost 모델에 특화된 접근 방식
IoT-23, GeNIS 데이터셋을 통한 모델 성능 및 망각 품질 검증
기존 모델의 예측 성능을 유지하며 빠른 언러닝 속도 구현

머신 언러닝 (Machine Unlearning, MU)은 전체 재학습을 요구하지 않고 학습된 모델에서 특정 데이터 포인트를 제거하기 위한 중요한 기술로 부상했습니다. 그러나 기존의 대부분의 MU 연구는 딥러닝 (Deep Learning)과 이미지 데이터에 집중되어 있어, 정형 데이터 (Tabular Data)에 크게 의존하는 네트워크 침입 탐지 (Network Intrusion Detection) 영역에는 공백이 존재합니다. 본 연구는 이러한 공백을 메우기 위해 XGBoost 모델을 위한 언러닝 접근 방식인 XGBoost-Forget을 소개합니다. 이 접근 방식은 두 가지 정형 네트워크 침입 (Network Intrusion, NI) 데이터셋인 IoT-23 및 GeNIS를 사용하여 모델 성능, 언러닝 효율성 및 망각 품질 (Forgetting Quality)을 평가하기 위해 여러 지표를 사용해 평가되었습니다. 결과에 따르면 XGBoost-Forget은 원래 모델에 근접한 예측 성능을 유지하면서도 훨씬 빠른 언러닝을 제공하며, 정형 NI 환경에서 MU의 잠재력을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

네트워크 침입 데이터셋을 활용한 XGBoost 모델의 머신 언러닝 (Machine Unlearning)

요약

핵심 포인트

댓글