arXiv논문2026. 05. 26. 11:39

CMAX-CAMEL: 대비 극대화 (Contrast Maximization)를 위한 Coarse-to-Fine 적응형, 메모리 효율적 및

요약

이벤트 기반 모션 추정을 위한 CMAX-CAMEL 프레임워크를 제안합니다. 런타임 적응형 실행 전략과 메모리 중심 아키텍처를 통해 계산 효율성을 높이고 엣지 디바이스에서의 실시간 저전력 처리를 구현했습니다.

핵심 포인트

Coarse-to-Fine 적응형 실행으로 추정 정확도 19% 향상
메모리 중심 아키텍처를 통한 지연 시간 53.3% 감소
유효 메모리 액세스 42% 및 총 시스템 에너지 52.2% 절감
HW-SW 공동 설계를 통한 엣지 프로세서 최적화

대비 극대화 (Contrast Maximization, CMAX)는 이벤트 기반 모션 추정 (event-based motion estimation)을 위한 직접적인 기하학적 프레임워크이지만, 반복적인 워프 및 누적 (warp-and-accumulate) 파이프라인은 입력에 따라 계산량이 변하고 빈번한 메모리 액세스를 유발하여 실시간 저전력 엣지 배포에 어려움을 줍니다. 본 논문에서는 CMAX를 위한 Coarse-to-Fine 적응형, 메모리 효율적 및 저전력 엣지 프로세서인 CMAX-CAMEL을 제안합니다. CMAX-CAMEL은 런타임 적응형 실행 전략 (runtime-adaptive execution strategy)과 메모리 중심 프로세서 아키텍처 (memory-centric processor architecture)를 결합합니다. 이 프로세서는 관찰된 이벤트 분포에 따라 Coarse-to-Fine 실행을 조정하여, 가치가 낮은 반복 (low-value iterations)과 불필요한 단계 전환을 억제하는 동시에 추정 정확도를 향상시킬 가능성이 높은 단계를 우선시합니다. 아키텍처 측면에서는, 뱅크형 병렬 메모리 구조 (banked parallel memory organization)가 지연 시간 (latency)을 줄이면서 실시간 처리량 (throughput)을 유지하며, 서브샘플링 결합 누적 구조 (subsampling-coupled accumulation structure)는 워프 및 누적 데이터 흐름 (warp-and-accumulate dataflow)을 따르는 메모리 액세스 활동을 낮춥니다. 200 MHz에서 작동하는 Virtex FPGA 프로토타입에서 CMAX-CAMEL은 고정된 Coarse-to-Fine 스케줄 대비 추정 정확도를 최대 19% 향상시키고, 처리 지연 시간을 53.3% 줄이며, 유효 메모리 액세스를 42% 낮추고, 적응 오버헤드 (adaptation overheads)를 포함한 총 시스템 에너지를 52.2% 절감했습니다. 이러한 결과는 CMAX-CAMEL이 엣지에서의 실시간 저전력 이벤트 기반 모션 추정을 위해 실행 정책과 데이터 이동을 공동 최적화한 HW-SW 공동 설계 (HW-SW co-design)임을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

CMAX-CAMEL: 대비 극대화 (Contrast Maximization)를 위한 Coarse-to-Fine 적응형, 메모리 효율적 및

요약

핵심 포인트

댓글