머신러닝 기반 네트워크 침입 탐지 시스템의 범주적 강건성 평가
요약
본 논문은 네트워크 침입 탐지 시스템(NIDS)의 적대적 공격 취약성을 평가했습니다. 1D CNN, LSTM, Random Forest 세 가지 아키텍처를 ACI-IoT-2023 데이터셋에 적용하고 FGSM 및 PGD 공격을 가한 결과, 높은 기준선 정확도가 안전성을 보장하지 못함을 확인했습니다. 그 결과, 적대적 환경에서 CNN 기반 아키텍처가 가장 안정적인 성능을 보여 실무자들에게 배포 지침을 제시합니다.
핵심 포인트
- 높은 초기 정확도는 적대적 공격에 취약할 수 있습니다.
- Random Forest는 기준선 정확도가 높았으나 교란에 매우 취약했습니다.
- CNN 아키텍처가 다양한 교란 수준에서 가장 안정적인 성능을 보였습니다.
- 실무자들은 CNN 기반 모델을 사용하여 침입 탐지 시스템을 배포하는 것이 권장됩니다.
네트워크 침입 탐지 시스템(NIDS)은 머신러닝(ML)을 광범위하게 활용하지만, ML 모델은 적대적 공격(adversarial attacks)을 통해 조작될 수 있습니다. 이러한 공격은 네트워크 트래픽 데이터에 신중하게 제작된 교란(perturbations)을 추가하여 오분류를 유발합니다. 이전 연구에서 고립된 환경에서의 적대적 취약성이 입증되었지만, 통제된 공격 조건 하에서 시스템적인 크로스-아키텍처 비교는 물론 공격 유형 및 범주 기반의 비교가 여전히 제한적이어서, 실무자들은 어떤 모델을 적대적 환경에 배포해야 할지에 대한 명확한 지침을 얻지 못하고 있습니다. 본 논문은 간단한 질문을 던집니다: 실제로 공격자가 시스템을 조작하려고 시도할 때 어떤 유형의 분류기 아키텍처가 버텨낼 수 있는가? 우리는 세 가지 인기 있는 아키텍처, 즉 1D Convolutional Neural Network(CNN), Long Short-Term Memory(LSTM) 네트워크, 그리고 Random Forest(RF) 앙상블을 테스트했습니다. ACI-IoT-2023 데이터셋(12가지 공격 유형에 걸친 120만 샘플 이상)을 사용하여, 우리는 각 모델에 FGSM 및 PGD 적대적 공격을 가했습니다. 이 공격들은 확립된 적대적 ML 평가 프로토콜과 일치하는 정규화된 특징 공간에서 기울기 기반 교란(gradient-based perturbations)을 적용하며, $ ext{ε}=0.01$부터 $ ext{ε}=0.1$까지의 교란 예산 범위에 걸쳐 진행되었습니다. 놀랍게도 Random Forest는 거의 완벽한 기준선 정확도(99.98%)를 달성했지만, 테스트한 가장 작은 교란에서도 73%포인트가 하락하며 치명적으로 무너졌습니다. 반면 CNN은 $ ext{ε}=0.01$에서 95.5%의 정확도를 유지했으며, 교란이 증가함에 따라 점진적으로 성능 저하를 보였습니다. LSTM은 그 중간 정도의 성능을 보였습니다. 이러한 발견들은 높은 기준선 정확도가 적대적 압력의 첫 징후가 있을 때 아무 의미가 없다는 기존 통념을 뒤집습니다. 따라서 적대적 환경에서 침입 탐지를 배포하는 실무자들에게는 CNN 기반 아키텍처를 권장하며, 시나리오별 배포 지침을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기