본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 10:56

E-ReCON: 기존 CNN 및 SNN 에지 추론을 위한 에너지 및 자원 효율적인 정밀도 설정 가능 희소 nvCIM 매크로

요약

E-ReCON은 에지 AI 추론을 위해 설계된 에너지 및 자원 효율적인 16 Kb 디지털 컴퓨트 인 메모리(DCIM) 매크로입니다. 3T1R ReRAM 비트셀과 새로운 인터리브형 가산기 트리를 통해 CNN과 SNN 워크로드 모두에서 높은 에너지 효율과 낮은 지연 시간을 달성합니다. 특히 프루닝 적용 시에도 높은 정확도를 유지하며, 기존 ADC 기반 설계 대비 성능이 크게 개선되었습니다.

핵심 포인트

  • 3T1R ReRAM 비트셀 기반의 컴팩트한 16 Kb nvCIM 매크로 설계
  • 인터리브형 가산기 트리를 도입하여 트랜지스터 수 37%, 전력 소비 28% 절감
  • 최대 419 TOPS/W의 에너지 효율과 0.48 ns의 낮은 지연 시간 달성
  • CNN 및 SNN 워크로드 모두 지원하며, 프루닝 적용 시에도 높은 정확도 보존
  • PVT 및 ReRAM 변동성 환경에서도 견고한 동작을 유지하는 높은 신뢰성

본 연구는 에지 AI (edge-AI) 추론을 위해 컴팩트한 3T1R ReRAM 비트셀 (bitcell)을 기반으로 하는 16 Kb 에너지 및 자원 효율적인 디지털 컴퓨트 인 메모리 (DCIM) 매크로인 E-ReCON을 제시합니다. 제안된 비트셀은 단 0.85 $\mu\text{m}^2$의 면적을 차지하며, 기존의 합성곱 신경망 (CNN) 및 스파이킹 신경망 (SNN) 워크로드 모두에 대해 신뢰할 수 있는 AND 기반 인 메모리 곱셈을 지원합니다. 누적 오버헤드 (accumulation overhead)를 줄이기 위해 새로운 인터리브형 (interleaved) 10T/28T 가산기 트리 (adder tree)가 도입되었으며, 이는 기존의 28T RCA 기반 설계와 비교하여 트랜지스터 수를 37%, 전력 소비를 28% 각각 감소시킵니다. 1.2 V의 65 nm CMOS 공정으로 구현된 제안된 매크로는 최소 0.48 ns의 지연 시간 (latency), 2.31-3.1 TOPS의 처리량 (throughput), 그리고 최대 419 TOPS/W의 에너지 효율을 달성합니다. LeNet-5, AlexNet, CNN-8 모델을 통해 평가했을 때, 이 매크로는 MNIST/A-Z, CIFAR10, SVHN 데이터셋에서 각각 97.81%, 93.23%, 96.51%의 정확도를 달성합니다. 또한, 40% 프루닝 (pruning)을 적용했을 때 MAC 연산과 계산 사이클을 줄이면서도 원래 정확도의 거의 99.8%를 보존합니다. SNN 지향적 워크로드의 경우, 제안된 AND 타입 비트셀은 낮은 스위칭 활동 (switching activity)으로 스파이크-가중치 곱셈 (spike-weight multiplication)을 효율적으로 지원하며, 2A2W 구성은 CIFAR-10, CIFAR-100, ImageNet-1K 데이터셋의 VGG-8, VGG-16, ResNet-18 네트워크에서 FP32 베이스라인에 근접한 정확도를 달성합니다. 기존의 ADC 기반 ReRAM-CIM 설계와 비교하여, 제안된 아키텍처는 완전한 PVT 및 ReRAM 변동성 (variability) 하에서도 견고한 동작을 유지하면서 지연 시간과 에너지 효율을 거의 30-40% 개선합니다. 종합적으로, E-ReCON은 차세대 에지 AI, IoT, 생체 의학 센싱 및 뉴로모픽 (neuromorphic) 애플리케이션을 위한 확장 가능하고 저지연이며 에너지 효율적인 nvCIM 플랫폼을 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0