ExSpike: 이벤트 압축을 통해 불규칙한 희소성을 활용하는 범용 풀-이벤트 뉴로모픽 아키텍처
요약
SNN의 불규칙한 희소성을 활용하여 에너지 효율을 극대화한 범용 풀-이벤트 뉴로모픽 아키텍처 ExSpike를 제안합니다. 데이터플로우 최적화와 이벤트 압축 기술을 통해 FPGA 상에서 높은 에너지 효율과 성능을 입증했습니다.
핵심 포인트
- SNN의 불규칙한 희소성을 활용하는 풀-이벤트 컴퓨팅 아키텍처 제안
- 순수 이벤트 기반 실행을 위한 데이터플로우 최적화 및 어텐션 코어 지원
- 인접 위치 이벤트 압축을 통한 중복 누적 계산 감소 및 효율 향상
- 기존 SOTA FPGA 기반 가속기 대비 최대 10배 높은 에너지 효율 달성
스파이킹 신경망 (SNNs)은 희소한 시공간적 활동 (sparse spatio-temporal activity) 덕분에 에너지 효율적인 컴퓨팅을 약속합니다. 그러나 풀-이벤트 컴퓨팅 (full-event computing) 아키텍처는 여전히 충분히 탐구되지 않았기 때문에, 이러한 불규칙한 희소성 (irregular sparsity)을 실제 성능과 에너지 이득으로 효과적으로 전환하는 것은 여전히 어려운 과제로 남아 있습니다. 본 논문은 SNNs의 불규칙한 희소성을 완전히 활용하는 범용 풀-이벤트 뉴로모픽 아키텍처인 ExSpike를 제안합니다. 순수 이벤트 기반 실행 (pure event-driven execution)을 구현하기 위해, 우리는 먼저 각 SNN 레이어의 입력이 스파이크 기반 (spike-based)으로 유지되도록 보장하는 일련의 데이터플로우 최적화 (dataflow optimizations)를 제안하며, 이를 통해 네트워크 전체에서 풀-이벤트 실행을 가능하게 합니다. 그런 다음, 최적화된 순수 이벤트 기반 데이터플로우와 스파이크 기반 셀프 어텐션 (spike-driven self-attention)을 위한 추가적인 어텐션 코어 (Attention Core)를 지원하는 ExSpike라는 이름의 하드웨어 효율적인 풀-이벤트 아키텍처를 설계합니다. 컴퓨팅 효율을 더욱 향상시키기 위해, 우리는 공간적으로 인접한 스파이크 시퀀스 전반의 중복된 누적 (redundant accumulations)을 줄이는 인접 위치 이벤트 압축 (adjacent-position event compression)을 도입합니다. ExSpike는 AMD Xilinx Virtex-7 FPGA 상에 구현되었으며, 분류 (classification) 및 세그멘테이션 (segmentation) 워크로드 모두에서 평가되었습니다. 실험 결과, ExSpike는 경쟁력 있는 정확도를 유지하면서 다양한 SNN 모델에 대해 높은 정규화된 에너지 효율을 달성하였으며, 최대 479.15 GOPS, 281.85 GOPS/W, 그리고 0.80 GOPS/W/PE를 제공합니다. 특히, ExSpike는 SOTA FPGA 기반 SNN 가속기 (FireFly-T)보다 최대 10$ imes$ 더 높은 PE 정규화 에너지 효율을 달성합니다. ExSpike의 코드는 \url{https://github.com/xiaoyuehai/ExSpike}에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기