CLAD: A Clustered Label-Agnostic Federated Learning Framework for Joint Anomaly
요약
CLAD는 IoT 및 IIoT 환경의 보안 문제를 해결하기 위해 제안된 포괄적인 연합 학습(FL) 프레임워크입니다. 이 프레임워크는 클러스터링과 새로운 듀얼 모드 마이크로 아키텍처($ ext{DM}^2 ext{A}$)를 통합하여, 기기 간의 이질성 문제와 라벨 부족 문제를 동시에 해결합니다. CLAD는 지도 학습(공격 분류)과 비지도 이상 탐지를 결합하고, 클러스터링을 통해 전역 모델 발산을 방지함으로써, 제한된 환경에서도 높은 보안 성능과 효율성을 달성할 수 있습니다.
핵심 포인트
- CLAD는 IoT/IIoT의 이질적 공격 표면 문제를 해결하는 연합 학습(FL) 프레임워크이다.
- 새로운 $ ext{DM}^2 ext{A}$ 아키텍처를 사용하여 비지도 이상 탐지 및 지도 학습 기반 공격 분류를 동시에 수행한다.
- 클러스터링 구성 요소가 유사한 트래픽 패턴을 가진 기기를 그룹화하여 모델 발산을 방지하고 효율성을 높인다.
- 라벨링되지 않은 클라이언트의 데이터를 활용할 수 있어 데이터 부족 문제를 해결하며, 성능 개선과 통신 비용 절감을 입증했다.
인터넷 오브 더 thing (IoT) 및 산업용 IoT (IIoT) 의 급격한 확장은 전통적인 네트워크 보안 기제를 도전에 부딪히는 거대하고 이질적인 공격 표면을 만들어냈습니다. 분산 학습 (FL) 은 중앙 집중식 침입 탐지 시스템 (IDS) 에 대한 프라이버시 보존 대안을 제공하지만, 표준 접근법은 다양한 기기 동작을 일반화하는 데 어려움을 겪으며 현실적인 엣지 환경에 존재하는 방대한 양의 라벨링되지 않은 데이터를 활용하지 못하는 경우가 많습니다. 이러한 격차를 해소하기 위해 우리는 클러스터드 분산 학습 (CFL) 과 새로운 듀얼 모드 마이크로 아키텍처 ($\text{DM}^2\text{A}$) 를 통합한 CLAD 라는 포괄적인 프레임워크를 제안했습니다. 이 통합 접근법은 IoT 보안의 두 가지 주요 병목 현상인 기기 이질성과 라벨 부족을 동시에 해결합니다. $\text{DM}^2\text{A}$ 구성 요소는 공유 인코더를 뒤이어 두 개의 분지로 구성되어 있으며, 이를 통해 비지도 이상 탐지와 지도 학습 공격 분류를 동시에 수행할 수 있습니다. 이는 프레임워크가 라벨링된 클라이언트와 라벨링되지 않은 클라이언트 모두에서 지능을 수집할 수 있게 합니다. 동시에, 클러스터링 구성 요소는 동적으로 유사한 트래픽 패턴을 가진 기기를 그룹화하여 전역 모델 분발을 방지합니다. 이러한 요소들을 신중하게 결합함으로써 CLAD 는 데이터가 폐기되지 않고 고유한 운영 패턴이 보존되도록 보장합니다. 광범위한 평가 결과는 이 통합 접근법이 최첨단 기준선을 크게 상회함을 보여주며, 라벨링되지 않은 클라이언트가 80% 인 시나리오에서 탐지 성능에 대한 상대적 개선률이 30%이며 통신 비용은 절반으로 줄어듭니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기