SRAM 기반 Compute-in-Memory를 위한 정확도 설정 가능 부동 소수점 곱셈기 설계
요약
SRAM 기반 Compute-in-Memory(DCiM)를 위한 정확도 설정 가능 부동 소수점 곱셈기 설계를 제안합니다. 가수부 분할 기반의 근사 곱셈기를 통해 하드웨어 면적과 전력을 획기적으로 절감하면서도 높은 수치적 충실도를 유지합니다.
핵심 포인트
- SRAM 기반 DCiM을 위한 근사 부동 소수점 곱셈기 제안
- 정확한 설계 대비 로직 면적 최대 69% 감소
- 정확한 설계 대비 전력 소모 최대 72% 절감
- ResNet-18 추론 시 무시할 만한 수준의 정확도 저하 입증
- OpenACM 프레임워크를 통한 컴파일러 통합 지원
디지털 Compute-in-Memory (DCiM)는 데이터 이동을 줄여주며 에너지 효율적인 에지 AI (edge AI)를 위한 유망한 솔루션이 되었습니다. 그러나 기존의 대부분의 DCiM 프레임워크는 여전히 주로 정수 (integer) 또는 고정 소수점 (fixed-point) 산술을 대상으로 하며, 컴파일러 통합형 및 정확도 설정 가능한 부동 소수점 (floating-point) 연산에 대한 지원은 제한적입니다. 하지만 기존의 IEEE 754 부동 소수점 유닛을 밀집된 SRAM 기반 DCiM 어레이에 직접 통합하는 것은 높은 면적 및 전력 오버헤드를 초래합니다. 이러한 과제를 해결하기 위해, 본 연구는 SRAM 기반 DCiM을 위한 OpenACM 프레임워크에 통합된 정확도 설정 가능한 부동 소수점 곱셈기를 제시합니다. 먼저 기준점 (baseline)으로서 정확한 IEEE 754 준수 곱셈기를 구현하였으며, 이후 수치적 충실도 (numerical fidelity)를 유지하면서 하드웨어 비용을 줄이기 위해 가수부 분할 (mantissa-segmentation) 기반의 근사 곱셈기 (approximate multiplier)를 제안합니다. 레이아웃 후 (Post-layout) 결과에 따르면, 지연 오버헤드 없이 정확한 부동 소수점 설계 대비 최대 69%의 로직 면적 감소와 72%의 전력 절감을 보여주었습니다. 이미지 처리 작업 및 ResNet-18 추론에 대한 평가를 통해 정확도 저하가 무시할 만한 수준임을 추가로 입증하였습니다. 이러한 결과는 컴파일러 통합형 근사 부동 소수점 곱셈이 SRAM 기반 DCiM 시스템에서 효율적이고 설정 가능한 부동 소수점 지원을 가능하게 하는 실용적인 접근 방식임을 나타냅니다. 부동 소수점 곱셈기는 https://github.com/ShenShan123/OpenACM 에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기