arXiv논문2026. 05. 25. 16:47

AI 보안 연구는 방어 연구에 더 많은 인센티브를 제공해야 한다

요약

AI 보안 연구가 방어보다 공격 기술 개발에 치우쳐 있는 불균형 문제를 지적합니다. 공격 연구는 위협을 과장하기 쉬운 환경에서 수행되는 반면, 방어 연구는 지나치게 엄격한 기준을 적용받아 실질적인 보호책 마련이 어렵다고 분석합니다.

핵심 포인트

AI 보안 연구의 공격 대 방어 비율의 불균형 발견
공격 연구는 위협을 과장하는 유리한 조건에서 평가됨
방어 연구는 실현하기 어려운 엄격한 기준을 적용받음
실제 배포 가능한 방어 기술 확보를 위한 인센티브 필요

본 연구는 인공지능 (AI) 보안 연구의 불균형을 조사합니다. 즉, 이 분야는 AI 시스템을 방어하는 것보다 공격하는 것에 관한 연구를 더 많이 생산하는 경향이 있습니다. 관련 학술 논문들을 바탕으로, 우리는 연합 학습 (Federated Learning), 음성 인식 (Speech Recognition), 멤버십 추론 (Membership Inference), 대규모 언어 모델 (Large Language Models) 등을 포함한 하위 분야 전반에 걸쳐 편향된 공격 대 방어 비율을 발견했습니다. 이러한 불균형은 단순히 수치상의 차이 그 이상의 의미를 가질 수 있습니다. 공격 관련 논문들은 위협이 실제보다 더 심각해 보이도록 만드는 유리한 조건 하에서 일상적으로 평가되는 반면, 방어 관련 논문들은 극소수만이 충족할 수 있는 더 엄격한 기준을 적용받습니다. 그 결과, 문헌에는 입증된 취약점은 풍부하지만, 실제로 사용 및 배포 가능한 보호책은 부족한 상태가 되었습니다. 따라서 우리는 AI 보안 연구가 방어 연구에 더 나은 인센티브를 제공해야 한다고 주장합니다.

AI 자동 생성 콘텐츠

원문 바로가기

AI 보안 연구는 방어 연구에 더 많은 인센티브를 제공해야 한다

요약

핵심 포인트

댓글