arXiv논문2026. 05. 20. 11:55

지식 그래프 임베딩으로부터의 민감한 속성 추론: 공격 및 방어 전략

요약

지식 그래프 임베딩(KGE) 기술이 누락된 정보를 추론하는 과정에서 의도치 않게 민감한 사용자 정보를 노출할 수 있는 개인정보 보호 위험을 분석합니다. 본 연구는 공격자가 KGE 출력을 통해 민감한 속성을 유추하는 공격을 조사하고, 이를 완화하기 위한 사후 처리 정화(Post-processing Sanitization) 프레임워크를 제안합니다. 실험을 통해 공격의 유효성을 입증하는 동시에, 개인정보 보호와 추천 품질 사이의 트레이드오프 관계를 확인했습니다.

핵심 포인트

지식 그래프 임베딩(KGE)을 통한 정보 추론 과정에서 민감한 사용자 속성이 노출될 위험이 있음
공격자가 비민감한 출력값으로부터 민감한 정보를 유추하는 속성 추론 공격(Attribute Inference Attacks) 가능성 확인
KGE 출력에 무작위화 기반의 사후 처리 정화 기술을 적용하여 개인정보 보호 위험 완화 시도
개인정보 보호 수준을 높일수록 추천 서비스의 품질이 저하되는 트레이드오프 문제 발생

지식 그래프 (Knowledge Graphs, KGs)는 연결된 데이터의 강력한 표현 방식으로, 유연성, 의미론적 풍부함, 그리고 지식 보강 및 추론을 위한 지원을 제공합니다. 지식 그래프는 데이터 소유자가 이질적인 데이터를 조직하고 활용하여 통찰력 있는 서비스(예: 추천)를 제공할 수 있도록 돕지만, 실제 세계의 지식 그래프는 종មាន히 불완전하여 실제 사실을 숨기거나 가치 있는 통찰을 놓치기도 합니다. 지식 그래프 임베딩 (Knowledge Graph Embedding, KGE) 기술은 누락된 가치 있는 정보를 추론하는 데 흔히 사용됩니다. 그러나 지식 그래프 상에서의 추론은 해당 데이터가 명시적으로 저장되어 있지 않더라도 의도치 않게 민감한 사용자 정보를 노출할 수 있습니다. 본 연구에서는 KGE 기반 추론과 관련된 개인정보 보호 위험을 조사하며, 특히 공격자가 겉보기에 민감하지 않은 출력으로부터 민감한 사용자 속성을 유추하려고 시도하는 속성 추론 공격 (Attribute Inference Attacks)에 초점을 맞춥니다. 우리는 KGE 출력에 사후 처리 정화 (Post-processing Sanitization) 기술을 적용하여 이러한 개인정보 보호 위험을 완화하는 프레임워크를 제안하고 평가합니다. 예비 결과는 KGE 모델의 출력에 대한 이러한 공격의 효과를 입증하며, 무작위화 기반 접근 방식 (Randomization-based approaches)을 적용할 때 추천 품질과 개인정보 보호 사이의 트레이드오프 (Trade-off)를 탐색합니다. 이는 이 문제를 해결하기 위해 향후 연구에서 더 발전된 기술을 실험할 필요가 있음을 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

지식 그래프 임베딩으로부터의 민감한 속성 추론: 공격 및 방어 전략

요약

핵심 포인트

댓글