arXiv논문2026. 06. 02. 10:18

elasticAI.explorer: 하드웨어 인지 신경망 구조 탐색 (Hardware-Aware NAS)을 위한 통합 엔드-투-엔드

요약

elasticAI.explorer는 하드웨어 제약 조건을 고려한 신경망 구조 탐색(NAS)을 위한 통합 Python 프레임워크입니다. YAML 기반 명세와 Docker 기반 툴체인을 통해 모델 설계부터 온디바이스 벤치마킹까지의 전 과정을 자동화합니다.

핵심 포인트

Optuna 기반의 확장 가능한 하드웨어 인지 NAS 프레임워크
YAML 기반의 동적 신경망 모델 변환 및 탐색 공간 지원
하드웨어 특정적 코드 생성 및 Docker 기반 교차 컴파일 통합
온디바이스 벤치마킹을 통한 하드웨어 인 루프 워크플로우 제공

신경망 구조 탐색 (Neural Architecture Search, NAS)은 작업 특정적(task-specific) 및 하드웨어 특정적(hardware-specific) 제약 조건 하에서 신경망을 자동으로 설계하기 위한 중요한 접근 방식이 되었습니다. 그러나 기존의 많은 NAS 프레임워크는 탐색 공간 (search space) 정의, 모델 구현, 그리고 배포 파이프라인 (deployment pipelines)이 밀접하게 결합되어 있어, 새로운 하드웨어 플랫폼이나 커스텀 연산자 (custom operators)로 확장하기가 어렵습니다. 본 논문에서는 Optuna를 기반으로 구축된 하드웨어 인지 NAS를 위한 확장 가능한 Python 프레임워크인 elasticAI.explorer를 제시합니다. 이 프레임워크는 샘플링 (sampling) 과정 동안 실행 가능한 신경망 모델로 동적으로 변환되는 YAML 기반의 탐색 공간 명세 (search space specification)를 도입합니다. 이 접근 방식은 최적화 및 배포를 위한 통합 인터페이스를 유지하면서 레이어 단위 (layer-wise), 셀 기반 (cell-based), 그리고 계층적 (hierarchical) 탐색 공간을 지원합니다. 아키텍처 생성을 넘어, 이 프레임워크는 하드웨어 특정적 코드 생성, Docker 기반의 교차 컴파일 (cross-compilation) 툴체인, 그리고 온디바이스 벤치마킹 바이너리 (on-device benchmarking binaries)의 자동 생성을 통합하여 하드웨어 인 더 루프 (hardware-in-the-loop) NAS 워크플로우를 가능하게 합니다. 또한, 시스템은 FLOPs, 파라미터 수 (parameter count), 그리고 지연 시간 (latency) 추정을 위한 확장 가능한 평가기 (evaluators)를 제공합니다. elasticAI.explorer는 임베디드 AI 배포의 엔지니어링 오버헤드를 줄이고, 이기종 가속기 플랫폼 (heterogeneous accelerator platforms)을 위한 하드웨어 인지 NAS 연구를 가속화하는 것을 목표로 합니다.

AI 자동 생성 콘텐츠

원문 바로가기

elasticAI.explorer: 하드웨어 인지 신경망 구조 탐색 (Hardware-Aware NAS)을 위한 통합 엔드-투-엔드

요약

핵심 포인트

댓글