DxPTA: 광학 데이터플로우 (Optical Dataflow) 가이드 전략을 통한 광학 트랜스포머 가속기 (Photonic
요약
Transformer 모델의 효율적인 가속을 위해 광학 트랜스포머 가속기(PTA)의 하드웨어/소프트웨어 공동 설계를 지원하는 DxPTA 방법론을 제안합니다. DxPTA는 제약 조건을 고려한 설계 공간 탐색을 통해 기존 방식보다 15.2배 빠른 탐색 속도와 최적화된 아키텍처를 제공합니다.
핵심 포인트
- 광학 데이터플로우 기반의 PTA 아키텍처 설계 방법론 제안
- 면적, 전력, 에너지, 지연 시간 등 애플리케이션 제약 조건 반영
- 전수 조사 방식 대비 15.2배 빠른 설계 공간 탐색 속도 달성
- DeiT 및 BERT 모델에 대해 최적화된 하드웨어 파라미터 식별
Transformer 기반 네트워크는 최첨단 성능을 갖춘 저명한 AI 모델로 부상하였으며, 이는 잠재적으로 인공 일반 지능 (AGI)을 향한 길을 열어주고 있습니다. 그러나 이러한 모델들의 거대한 크기는 여전히 효율적인 구현을 방해하고 있으며, 따라서 에너지 효율적인 가속을 가능하게 할 대안적인 솔루션의 필요성을 강조하고 있습니다. 최근의 최첨단 연구들은 기존의 전자식 가속기 (electronic accelerators) 대비 상당한 속도 향상과 에너지 효율 개선을 제공하는 광학 트랜스포머 가속기 (Photonic Transformer Accelerators, PTAs)를 제안하고 있습니다. 하지만, 이들의 PTA 아키텍처는 애플리케이션 제약 조건 (예: 면적, 전력, 에너지 및 지연 시간)을 고려하지 않고 개발되었습니다. 더욱이, 수동 설계 방식은 대상 애플리케이션에 적합한 아키텍처를 결정하기 위해 막대한 설계 시간을 요구하므로, 이 방식은 확장 가능하지 않습니다. 이러한 한계를 해결하기 위해, 우리는 모든 제약 조건을 충족하는 적절한 PTA 아키텍처의 효율적인 하드웨어/소프트웨어 공동 설계 (hardware/software co-design)를 가능하게 하는 새로운 설계 공간 탐색 (design space exploration) 방법론인 DxPTA를 제안합니다. 이는 (1) 가간섭성 광학 데이터플로우 (coherent optical dataflow)를 기반으로 PTA 아키텍처 파라미터를 식별하고, (2) 파라미터의 영향/중요성을 분석하며, (3) 이 분석을 활용하여 제약 조건 인식 아키텍처 탐색 알고리즘을 고안함으로써 달성됩니다. 실험 결과에 따르면, 우리의 DxPTA는 다양한 Transformer 기반 모델 (즉, DeiT-T/S/B 및 BERT-B/L)에 대해 적절한 PTA 아키텍처를 찾아낼 수 있음을 보여줍니다. 50mm^2 면적, 5W 전력, 50mJ 에너지, 10ms 지연 시간이라는 제약 조건 하에서, DxPTA는 최대 26mm^2 면적, 4.8W 전력, 39mJ 에너지, 6ms 지연 시간을 달성하였으며, 전수 조사 (exhaustive approach) 방식보다 15.2배 빠른 탐색 시간을 기록했습니다. 이러한 결과는 다양한 AGI 기반 애플리케이션을 위한 효율적인 PTA 설계를 가능하게 하는 DxPTA 방법론의 잠재력을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기