비디오 복제 탐지: 로직 게이트 네트워크(LGN) 기반 효율적 접근법
요약
기존 딥러닝 모델의 높은 연산 비용과 디스크립터 크기 한계를 극복하기 위해, 본 논문은 이산적인 로직 게이트 네트워크(Logic Gate Networks, LGN)를 활용한 비디오 복제 탐지 프레임워크를 제안합니다. LGN은 부동소수점 특징 추출기를 간결한 로직 기반 표현으로 대체하여, 모델을 순수한 불리언 회로로 이산화할 수 있게 합니다. 이를 통해 메모리 효율성과 추론 속도를 획기적으로 개선했으며, 초당 11k 샘플 이상의 빠른 처리 속도를 달성했습니다.
핵심 포인트
- LGN은 기존의 부동소수점 특징 추출기를 로직 기반 표현으로 대체하여 계산 비용을 대폭 절감합니다.
- 제안된 프레임워크는 공격적인 프레임 축소, 이진 전처리, 학습 가능한 LGN 임베딩 모델을 결합했습니다.
- 학습 후 모델은 순수 불리언 회로로 이산화되어 메모리 효율성과 속도가 극대화됩니다.
- 실험 결과, LGN 기반 모델은 기존 모델 대비 경쟁적이거나 우수한 정확도와 랭킹 성능을 유지하면서 디스크립터 크기를 수 배(orders of magnitude) 작게 만들었습니다.
Efficient Logic Gate Networks for Video Copy Detection
Video copy detection requires robust similarity estimation under diverse visual distortions while operating at very large scale. Although deep neural networks achieve strong performance, their computational cost and descriptor size limit practical deployment in high-throughput systems. In this work, we propose a video copy detection framework based on differentiable Logic Gate Networks (LGNs), which replace conventional floating-point feature extractors with compact, logic-based representations. Our approach combines aggressive frame miniaturization, binary preprocessing, and a trainable LGN embedding model that learns both logical operations and interconnections. After training, the model can be discretized into a purely Boolean circuit, enabling extremely fast and memory-efficient inference. We systematically evaluate different similarity strategies, binarization schemes, and LGN architectures across multiple dataset folds and difficulty levels. Experimental results demonstrate that LGN-based models achieve competitive or superior accuracy and ranking performance compared to prior models, while producing descriptors several orders of magnitude smaller and delivering inference speeds exceeding 11k samples per second. These findings indicate that logic-based models offer a promising alternative for scalable and resource-efficient video copy detection.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기