KATANA: 실시간 추적을 위한 에지 NPU 상의 칼만 필터(Kalman Filters)에 대한 고속·저전력 매핑
요약
KATANA는 상용 NPU를 활용하여 칼만 필터(LKF, EKF)를 고속·저전력으로 실행하는 매핑 기술을 제안합니다. 대수적 그래프 재작성을 통해 연산의 100%를 NPU 행렬 엔진에서 처리함으로써 CPU 대비 에너지 효율을 극대화합니다.
핵심 포인트
- 상용 NPU를 활용한 칼만 필터의 최초 엔드 투 엔드 매핑
- 그래프 재작성을 통해 모든 연산을 NPU 행렬 엔진으로 최적화
- CPU 구현 대비 동적 에너지 소비를 최대 97.9% 절감
- 실시간 추적 시스템을 위한 고속(최대 408 FPS) 및 저전력 성능 달성
상태 추정(State estimation)은 레이더 감시 및 대드론(counter-UAV) 방어부터 자율 주행과 로보틱스에 이르기까지 모든 실시간 추적 시스템의 폐루프(closed-loop) 핵심입니다. 이러한 배포 환경은 방어 시스템이 차량이나 드론에 장착되는 에지(edge) 플랫폼이나, 민간 파이프라인이 자동차 및 휴대용 기기에서 작동하는 환경에서 실행됩니다. 여기서 추가되는 모든 컴퓨팅 전력(watt)은 임무 지속 시간이나 운용 범위를 저하시킵니다. 이에 따라 두 가지 엄격한 제약 조건이 따릅니다: 각 새로운 측정값은 다음 제어 주기(control cycle) 이전에 융합되어야 하며, 총 컴퓨팅량은 엄격한 배터리 및 열 전력 범위 내에 들어와야 합니다. 선형 및 확장 칼만 필터(LKF, EKF)는 이러한 시스템에서 지배적인 추정기이지만, 현재 이들은 다중 객체 추적(MOT) 업데이트를 직렬화하는 CPU에서 거의 독점적으로 실행되거나, 설계 주기를 늘리는 맞춤형 FPGA/ASIC 가속기에서 실행됩니다. Intel Core Ultra Series 1 및 2와 같은 현대적인 AI-PC SoC는 저전력 데이터 병렬 신경망 처리 장치(NPU)를 통합하고 있습니다. 따라서 우리는 전용 가속기를 피하고 CPU와 GPU를 주요 워크로드용으로 자유롭게 유지하면서, 실시간 및 저전력 예산을 동시에 충족하기 위해 칼만 필터를 기존의 행렬 엔진(matrix engine)에 매핑할 수 있는지 질문합니다. 우리는 상용 NPU에 LKF 및 EKF를 최초로 엔드 투 엔드(end-to-end) 매핑하는 KATANA를 제시하며, 출시된 AI-PC 실리콘에 대한 교차 플랫폼 특성 분석을 함께 제공합니다. KATANA는 세 가지 대수적 그래프 재작성(algebraic graph rewrites)을 적용합니다: 사전 계산된 음의 투영 행렬 $H_{neg}$를 통한 뺄셈-덧셈 재구성(subtract-to-add reformulation), 정적 형태 텐서 융합(static-shape tensor fusion), 그리고 블록 대각 배치 병렬화(block-diagonal batched parallelization)를 통해 연산의 100%가 DPU 행렬 엔진에서 실행되도록 보장합니다. Series 2에서 최적화된 배치(batched) EKF는 13.43W의 활성 전력에서 223.35 FPS에 도달하며, LKF는 14.05W에서 408.73 FPS에 도달하여 CPU 구현 대비 동적 에너지(dynamic energy)를 최대 97.9%까지 절감합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기