배치 정렬형 저정밀도 신경망 구조 탐색을 위한 우주 탑재 엣지 AI
요약
본 논문은 엣지 AI 환경에서 발생하는 구조-정밀도 불일치 문제를 해결하기 위한 새로운 접근 방식을 제시합니다. 기존의 하드웨어 인식 신경망 구조 탐색(NAS) 방법들은 정밀도를 전제로 최적화한 후 저정밀도를 나중에 적용하여, 실제 배치 실행 시 정확도가 크게 떨어지는 문제가 있었습니다. 연구진은 이 한계를 극복하고자 '배치 정렬형 저정밀도 학습'을 NAS 파이프라인에 직접 통합했습니다. 제안된 프레임워크는 후보 구조를 탐색하는 과정(미세 조정 및 평가)에서부터 FP16과 같은 낮은 정밀도의 수치적 제약을 노출시켜, 구조적 효율성과 저정밀도 하에서의 견고성을 동시에 최적화합니다. 우주 탑재 해상 모니터링 태스크에 적용한 결과, 기존 방식 대비 정확도 손실을 크게 줄여 모델 복잡도를 증가시키지 않으면서 높은 성능을 유지할 수 있음을 입증했습니다.
핵심 포인트
- 하드웨어 인식 NAS는 엣지 AI 최적화의 핵심이지만, 정밀도 불일치 문제가 존재한다.
- 기존 NAS 방법은 구조를 먼저 찾고 나중에 저정밀도를 적용하여 정확도 손실이 크다.
- 제안된 '배치 정렬형 저정밀도 학습'을 통해 탐색 과정부터 낮은 정밀도의 제약을 통합하여 최적화한다.
- Intel Movidius Myriad X VPU를 대상으로 실험한 결과, 배치 정렬형 접근법은 기존 방식 대비 정확도 손실을 크게 줄여 높은 성능을 유지했다.
엣지 가속기에서 엄격한 지연 시간과 정확도 제약을 충족하는 심층 네트워크 설계는 장치 수준의 지표를 기반으로 한 신경망 구조 탐색 (NAS) 을 포함한 하드웨어 인식 최적화에 점점 더 의존하고 있습니다. 그러나 대부분의 하드웨어 인식 NAS 파이프라인은 여전히 정밀도를 전제로 하여 구조를 최적화한 후, 탐색 이후에만 저정밀도 적응을 적용하여 최적화 시점의 동작과 저정밀도 하드웨어에서의 배치 실행 간 불일치를 초래할 수 있으며 이는 정확도를 현저히 저하시킬 수 있습니다. 우리는 이 한계를 해결하기 위해 배치 정렬형 저정밀도 학습을 하드웨어 인식 NAS 에 직접 통합합니다. 후보 구조들은 미세 조정 및 평가 단계에서 FP16 수치 제약을 노출받아, 검색 공간이나 진화 전략을 수정하지 않고도 구조적 효율성과 수치적 견고성을 공동으로 최적화할 수 있습니다. 제안된 프레임워크는 우주 탑재 해상 모니터링을 위한 선박 분할 작업에 대해 Intel Movidius Myriad X 비주얼 프로세싱 유닛 (VPU) 을 대상으로 평가했습니다. 배치 후 정밀도 변환은 장치 내 성능을 0.85 에서 0.78 mIoU 로 감소시키는 반면, 배치 정렬형 저정밀도 학습은 동일한 구조 (95,791 개 파라미터) 에 대해 장치 내에서 0.826 mIoU 의 성능을 달성하여 모델 복잡도를 증가시키지 않으면서 배치로 인한 정확도 격자의 약 3 분의 2 를 회복했습니다. 이러한 결과는 자원 제약이 있는 엣지 인공지능 (AI) 에서 최적화와 배치 간 견고성 및 정렬성을 크게 향상시키기 위해 하드웨어 인식 NAS 에 배치 일관된 수치 제약을 통합하는 것이 효과적임을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기