AUTOGATE: 토글링 인지(Toggling-Aware) LLM 기반 RTL 재작성을 통한 자동 클록 게이팅 (Clock Gating)
요약
AUTOGATE는 LLM과 ML을 결합하여 RTL 설계의 동적 전력을 최적화하는 에이전트 기반 프레임워크입니다. 파형 분석과 계층적 멀티 에이전트 아키텍처를 통해 대규모 코드베이스에서도 효율적인 클록 게이팅을 수행합니다.
핵심 포인트
- ML 기반 클러스터링으로 파형 데이터를 구조화하여 LLM의 분석 효율성 증대
- 계층적 멀티 에이전트 구조를 통한 대규모 설계의 확장성 확보
- 산업 규모 설계(NVDLA 등)에서 유의미한 동적 전력 감소 달성
- 토글링 인지형 RTL 재작성을 통한 자동 클록 게이팅 구현
미세 입도 클록 게이팅 (Fine-grain clock gating, FGCG)은 동적 전력 (dynamic power)을 줄이는 가장 효과적인 기술 중 하나이지만, 현재의 FGCG 최적화 흐름은 여전히 상당 부분 수동으로 이루어집니다. 최근의 LLM 기반 RTL 최적화 접근 방식은 두 가지 주요 단점으로 인해 제한적입니다: (1) 수백만 사이클에 걸친 긴 파형 트레이스 (waveform traces)를 처리할 수 없다는 점, (2) 정확성을 유지하면서 대규모 계층적 코드베이스로 최적화를 확장하기 어렵다는 점입니다. 본 연구에서는 산업 등급의 RTL 전력 최적화를 위한 최초의 에이전트 기반 프레임워크인 AUTOGATE를 제시하며, 이는 대규모 계층적 코드베이스 전반에 걸쳐 워크로드 인지형 (workload-aware) 클록 게이팅 최적화를 가능하게 합니다. AUTOGATE는 파형 수준의 분석과 RTL 재작성 (RTL rewriting)을 연결하는 머신러닝 (Machine Learning, ML)-LLM 공동 설계 (co-design)를 도입합니다. 구체적으로, 우리는 원시 토글링 트레이스 (toggling traces)를 LLM 기반 RTL 재작성을 가이드할 수 있는 조밀하고 구조화된 표현으로 추출하는 ML 기반 클러스터링 알고리즘을 설계했습니다. 이를 통해 LLM이 원시 파형 데이터를 직접 처리할 필요 없이 클록 게이팅 기회를 정확하게 식별하고 적용할 수 있습니다. 확장성을 높이기 위해, AUTOGATE는 대규모 설계를 독립적으로 최적화 가능한 모듈로 분해하는 계층적 멀티 에이전트 아키텍처 (hierarchical multi-agent architecture)를 채택하여, 깊은 설계 계층 구조 전반에 걸친 조정된 최적화를 가능하게 합니다. 우리는 소규모 RTL 설계부터 대규모 산업 등급 코드베이스에 이르는 다양한 설계 세트에서 AUTOGATE를 평가했습니다. 실험 결과, AUTOGATE는 베이스라인 대비 동적 전력을 일관되게 감소시켰습니다. 소규모 설계 제품군 전반에서 AUTOGATE는 평균 49.31%의 동적 전력을 감소시켰습니다. 산업 규모 설계에서는 NVDLA에서 19.34%, BlackParrot에서 7.96%의 동적 전력 감소를 달성했으며, 고도로 최적화된 독점 생산 설계에서는 최대 6.86%의 감소를 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기