고속 3D CNN 을 위한 광자원자 공간 - 시간 홀로그래픽 상관기
요약
본 논문은 계산 복잡도가 높은 3D CNN의 한계를 극복하기 위해, 광자원자 공간-시간 홀로그래픽 상관기(STHC)를 활용하는 하이브리드 광전자 구조를 제안합니다. 이 시스템은 냉각 루비듐 원자 배열을 이용해 시간 정보를 저장하고, 이를 전통적인 2D 공간 상관기와 결합하여 공간 및 시간을 동시에 처리합니다. 실험 결과, 대규모 커널에서 높은 분류 정확도와 잠재적으로 매우 빠른 작동 속도를 달성하며, 비디오 분류 가속화에 새로운 방향을 제시했습니다.
핵심 포인트
- 3D CNN의 계산 복잡도 문제를 해결하기 위해 광자원자 기반 하이브리드 구조를 도입함.
- 냉각 루비듐 원자를 사용하여 시간 정보를 저장하고, 2D 공간 상관기와 결합하여 시공간 동시 처리를 구현함.
- 제안된 시스템은 대규모 커널(30x40 픽셀, 8 프레임)에서 높은 분류 정확도를 달성했음.
- 잠재적으로 최대 125,000 프레임/초의 매우 빠른 작동 속도가 예상됨.
세차원 합성곱 신경망 (3D CNNs) 은 공간적 및 시간적 특징을 모두 처리함으로써 비디오 인식 작업에서 놀라운 성능을 입증했습니다. 그러나 계산 복잡도의 세제곱 스케일링은 기존 실리콘 기반 하드웨어에 상당한 시간 및 에너지 효율성 문제를 제기합니다. 이를 해결하기 위해, 우리는 계산 집약적인 3D 합성곱 계층을 광자원자 공간 - 시간 홀로그래픽 상관기 (Spatio-temporal Holographic Correlator, STHC) 로 위임하는 하이브리드 광전자 구조를 제안합니다. 이 시스템은 이질적으로 확장된 냉각 루비듐-85 원자 배열에 원자 결맞음으로 시간 정보를 저장하고, 전통적인 2D 공간 상관기와 결합하여 공간과 시간을 동시에 상관 연산을 수행합니다. 우리는 4 클래스 인간 동작 데이터셋에서 병렬 대규모 커널 (공간적으로 30X40 픽셀, 시간적으로 8 프레임) 을 사용하여 59.72% 의 분류 정확도를 달성했으며, 최대 125,000 프레임/초의 잠재적 작동 속도가 예상됩니다. 이 접근법은 하이브리드 구조를 통해 대규모 가속화된 비디오 분류로의 길을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기