arXiv논문2026. 06. 30. 14:13

머신러닝 모델을 위한 소유권 증명 (Proofs of Ownership for Machine Learning Models)

요약

머신러닝 모델의 소유권을 보호하기 위한 '소유권 증명(Proof of Ownership)'에 관한 연구를 소개합니다. 모델 소유자, 도둑, 판사 간의 게임 이론적 모델링을 통해 도난된 모델의 출처를 증명할 수 있는 조건을 분석합니다.

핵심 포인트

모델 소유권 증명을 위한 삼자 게임 모델링 제시
블랙박스 설정에서의 분류기 소유권 증명 가능성 분석
자기 수정 가능성(self-correctable)과 소유권 증명 간의 관계 규명
암호학적 가정을 바탕으로 한 구성적 결과 도출

머신러닝 (Machine Learning)의 채택이 증가함에 따라, 모델 소유권을 보호하는 것이 필수적인 과제가 되었습니다. 우리는 머신러닝 모델을 위한 소유권 증명 (Proof of Ownership)에 대한 공식적인 연구를 시작합니다: 어떤 조건 하에서 도난당한 모델이 특정 제작자로부터 유래했음을 증명할 수 있는가? 우리는 소유권 증명을 세 당사자, 즉 모델 소유자 (model owner), 도둑 (thief), 그리고 판사 (judge) 사이의 게임으로 모델링합니다. 소유자는 원본 모델을 소유권 증명과 함께 약간 변형된 모델 (slightly perturbed model)로 변환합니다. 그런 다음 도둑은 변형된 모델을 획득하고, 모델이 유용성을 유지하면서도 모델 소유자의 소유라는 탐지를 피할 수 있도록 모델을 최소한으로 수정하려고 시도합니다. 마지막으로, 판사는 모델과 소유권 증명을 전달받아, 주어진 모델이 모델 소유자가 만든 어떤 모델의 수정 버전인지, 아니면 주어진 모델이 독립적으로 개발되었는지를 결정해야 합니다. 우리의 주요 결과는 블랙박스 (black-box) 설정에서의 분류기 (classifiers)에 대한 이분법 (dichotomy)입니다: 표준적인 암호학적 가정 (cryptographic assumptions) 하에서, 특정 개념 클래스 (concept class)에 대한 모델의 소유권은 Blum, Luby 및 Rubinfeld, STOC'90의 개념과 유사한 의미에서 해당 개념 클래스가 자기 수정 가능 (self-correctable)하지 {\em if and only if} (일 때 그리고 오직 그때만) 위와 같은 방식으로 증명될 수 있습니다. 이 결과는 구성적 (constructive)이며, 몇 가지 변형과 함께 다수의 관련 설정으로 확장됩니다.

AI 자동 생성 콘텐츠

원문 바로가기

머신러닝 모델을 위한 소유권 증명 (Proofs of Ownership for Machine Learning Models)

요약

핵심 포인트

댓글