안전한 ML 모델 실행을 위한 생명주기 인식 동적 분석
요약
ML 모델 아티팩트에 임베딩된 악성 동작을 탐지하기 위해 모델 실행 생명주기를 기반으로 한 동적 분석 접근 방식인 Moat을 제안합니다. Re-Moat 구현체를 통해 다양한 프레임워크에서 높은 탐지율과 매우 낮은 오탐률을 입증했습니다.
핵심 포인트
- 기존 정적 스캐닝의 한계를 극복하는 동적 생명주기 인식 분석 제안
- 모델 실행 단계별 호스트 시스템과의 구조적 상호작용 활용
- Hugging Face Hub의 대규모 모델을 통한 Re-Moat의 유효성 검증
- 제로에 가까운 오탐률로 다양한 공격 클래스 탐지 성공
사전 학습된 머신러닝 (ML) 모델에 대한 의존도가 높아짐에 따라 새로운 공격 표면 (attack surfaces)이 등장했습니다. 최근의 취약점들은 악의적인 동작이 모델 아티팩트 (artifacts) 내에 임베딩될 수 있으며, 종종 기존의 방어 체계를 우회할 수 있음을 보여줍니다. 현재의 모델 스캐닝 솔루션은 주로 정적이고 특정 형식에 국한된 규칙이나 알려진 공격 시그니처 (attack signatures)에 의존하며, 이는 프레임워크 전반에 걸친 일반화 능력과 새로운 악용 경로를 탐지하는 능력을 제한합니다. 이와 대조적으로, 우리는 공격이 모델을 실행하는 호스트 시스템에 미치는 영향에 집중하고, ML 모델 실행에 대한 근본적인 직관을 바탕으로 한 솔루션을 제안합니다. 특히, 우리는 ML 모델이 잘 정의된 생명주기 (lifecycle) 단계 내에서 작동하며, 각 단계 내에서 호스트 시스템과의 상호작용이 매우 구조화되어 있고 예측 가능하다는 점을 관찰했습니다. 우리는 이러한 직관을 ML 모델 실행 보안을 위한 동적 생명주기 인식 접근 방식인 Moat으로 변환하였으며, 우리의 참조 구현체인 Re-Moat을 통해 이 설계를 구체화했습니다. 우리는 Hugging Face Hub의 77,974개 실제 모델 아티팩트, CVE로부터 추출한 31개의 개념 증명 (PoCs), 그리고 최신 데이터셋의 334개 모델을 사용하여 다양한 ML 프레임워크에 대해 Re-Moat을 평가하였으며, 이를 최신 모델 스캐닝 솔루션들과 비교했습니다. 우리의 결과는 본 접근 방식이 거의 제로에 가까운 오탐률 (false-positive rate)을 유지하면서 평가된 모든 공격 클래스를 탐지함을 보여주며, 이는 우리의 직관을 검증하고 ML 모델 실행 보안을 위한 동적 분석의 필요성을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기