
Coral NPU란──Google이 NPU 설계도 자체를 Apache 2.0으로 공개한 RISC-V 오픈소스 기반
요약
Google과 DeepMind가 설계한 Coral NPU의 RTL 설계도가 Apache 2.0 라이선스로 공개되었습니다. RISC-V 기반의 오픈소스 NPU IP로, 초저전력 환경에서 온디바이스 AI 추론을 지원하며 상업적 이용이 자유롭습니다.
핵심 포인트
- 업계 최초의 완전 오픈소스 NPU IP 공개
- Apache 2.0 라이선스로 라이선스료 없는 상업적 이용 가능
- RISC-V 기반 스칼라, 벡터, 매트릭스 실행 유닛 구조
- 초저전력(10mW) 환경의 온디바이스 AI 최적화 설계
「Google에 지불하는 라이선스료는 전혀 없으며, 상업적 이용도 무제한」── 공식 FAQ에 그렇게 적혀 있는 칩 IP가 있다. Coral NPU는 Google과 DeepMind가 공동 설계한, AI 추론에 특화된 소형 칩의 회로 설계도 그 자체를 Apache 2.0 라이선스로 GitHub에 올린, 업계 최초의 완전 오픈소스 NPU IP다. 10밀리와트(mW)의 전력 범위 내에서 512 GOPS──코인 배터리로 수일~수주 동안 작동하는 스마트워치나 보청기의 전력 범위에서, 소형 온디바이스 AI (On-device AI)를 돌릴 수 있는 수준에 해당한다. 첫 양산 칩인 「Synaptics Astra SL2610」(미국 Synaptics가 2026년 2분기에 출하할 AI 처리용 임베디드 SoC)에 탑재될 예정이다. Web/SaaS의 백엔드 엔지니어에게도 자사 프로덕트의 음성·영상 처리 기능을 클라우드 API 과금 방식에서 단말 측으로 내릴 수 있을지 판단할 수 있는 자료가 되는 화제다.
이후에 반복해서 등장할 세 가지 약어를 먼저 정리한다.
NPU (Neural Processing Unit): AI 추론 전용 소형 칩. CPU에 병설되어 행렬 계산이나 벡터 연산을 대신 수행함
IP (Intellectual Property): 칩 전체가 아니라 「설계가 완료된 회로 블록」을 의미함. Arm Cortex처럼 SoC 벤더가 라이선스를 받아 자사 칩에 포함시키는 형태가 일반적임
RTL (Register Transfer Level): 회로의 동작을 코드(주로 SystemVerilog)로 작성한 것. 「칩의 설계도」라고 부를 때의 실체는 이 RTL임
Coral NPU의 「설계도가 오픈되었다」는 것은, 이 RTL과 후술할 MLIR/IREE 컴파일러 세트가 Apache 2.0 라이선스로 GitHub에 올라와 있음을 의미한다.
Coral NPU의 공식 리포지토리 google-coral/coralnpu를 살펴보면, GitHub 언어 비중이 SystemVerilog 26% · C++ 6.7%──Python 라이브러리 계열의 OSS(Open Source Software)와는 확실히 결이 다르다. 지금까지 에지(Edge)향 NPU IP는 Arm Ethos, Cadence Tensilica 등의 비공개(Proprietary) 설계도를 SoC(여러 회로를 하나의 칩에 집적한 부품) 벤더가 NDA(비밀 유지 계약) 하에 라이선스하는 것이 상식이었다. Google은 연간 라이선스료와 독자적인 툴체인(Toolchain)에서 벗어날 수 있는 경로를 「설계도 자체를 공개하는」 방식으로 제시했다. OSS의 대상이 Python 라이브러리에서 모델 가중치(Weight)로, 그리고 마침내 RTL까지 확장되었다고 기록할 수 있는 전환점이다.
핵심은 하나의 RISC-V 파이프라인에 3개의 실행 유닛을 겹친 설계로, 스칼라(Scalar)가 제어를 담당하고, 거기서 호출된 벡터/매트릭스가 연산을 담당하는 주종 관계로 되어 있다.
스칼라 코어는 명령 흐름을 관리하는 사령탑. RV32IMF(32비트 정수 + 승제산 + 단정밀도 부동소수점 명령어 세트)를 준수하여 동작하며, 명령을 「가져오기→해석하기→계산하기→쓰기」의 4단계로 나누어 흘려보내는 고전적인 4단 파이프라인을 채택함
벡터 실행 유닛은 데이터 병렬성을 담당하는 계산기. SIMD(동일한 계산을 여러 데이터에 한 번에 적용하는 전용 회로)를 주 CPU의 보조로서 동작시키며, 256비트 폭의 레지스터를 32개 보유하여 정수를 병렬 처리함──뉴럴 네트워크(Neural Network) 추론에서 반복적으로 나타나는 동일 유형의 계산을, 1개의 명령으로 묶어서 처리하는 토대가 됨
매트릭스 실행 유닛은 행렬 계산을 맡는 전용 엔진. 1사이클에 256회의 MAC(Multiply-Accumulate, 곱하고 더하기를 한 세트로 한 계산)을 수행함──뉴럴 네트워크 추론의 대부분을 차지하는 행렬 곱셈에서 효과를 발휘함. 단, 2026년 5월 시점에서 공식적으로 「개발 중」이라고 명기되어 있으며, 본 작업 채용 시에는 벡터 실행 유닛이 주역이 될 예정임
경쟁 NPU IP는 DSP(Digital Signal Processor, 신호 처리용 전용 회로) 스타일의 독자적인 명령어를 겹쳐 성능을 내왔지만, Coral은 표준적인 RISC-V만으로 구성하는 선택을 했다. 범용 오픈 컴파일러 기반 3종 세트──프로그램 변환을 담당하는 LLVM, 그 위의 AI용 중간 표현(Intermediate Representation)인 MLIR, 이를 에지 추론 실행으로 구현하는 IREE──를 그대로 사용할 수 있다는 보상이 있다. Arm Ethos-U85가 Arm 마이크로컨트롤러용 CPU인 「Cortex-M」과 밀결합되어 있고, Cadence가 Cadence 자사 CPU인 「Xtensa」의 독자적인 ISA(Instruction Set Architecture, 명령어 세트)로 동작하는 것과는 다른 방향의 판단이라고 할 수 있다.
공식 베이스 구성은 512 GOPS(GOPS=1초당 10억 회 연산, 1 TOPS = 1000 GOPS) · 10mW급 · 800MHz 구동이다. 512 GOPS는 매트릭스(Matrix) 미완성을 고려한 벡터(Vector) 중심 구성에서의 값으로 해석하는 것이 타당하다. 단위를 통일하면 Coral 0.5 TOPS / Arm Ethos-U85 최대 4 TOPS (Arm의 마이크로컨트롤러용 NPU IP) / Hailo-8 26 TOPS (Hailo사의 산업용 비전용 완성형 칩) / Cadence Neo 최대 80 TOPS (Cadence의 하이엔드용 NPU IP)로, Coral은 명확하게 로우엔드(Low-end)에 위치한다.
하지만 Coral NPU는 의도적으로 로우엔드 쪽을 지향하고 있다. 스마트워치나 보청기는 코인 배터리로 수일에서 수주 동안 작동해야 하므로, NPU에 할당할 수 있는 전력은 수 mW에서 십수 mW 수준이다. 전력 범위를 벗어나면 1 TOPS라 할지라도 하루를 버티지 못한다. 즉, "전력 범위 내에서 의미 있는 추론을 할 수 있는 최대치"를 512 GOPS로 설정했다고 보는 것이 솔직한 해석이다. 2026년 중의 다음 마일스톤(Milestone)에서는 소형 LLM인 "Gemma 3 270M"(2억 7천만 파라미터급)을 구동할 계획도 공표되어 있다.
첫 양산 칩인 Synaptics Astra SL2610(미국 Synaptics, 임베디드 프로세서 대기업, 주식 티커 SYNA)이 2026년 2분기에 출하될 예정이다. 범용 처리를 담당하는 Arm Cortex 계열 CPU에, 이미지 처리용 Mali GPU(선택적 탑재), Coral NPU, 그리고 Synaptics 자사의 보조 NPU인 "Torq T1"을 탑재한 구성으로, NPU 합계 성능은 1 TOPS이다. 샘플링 시작은 2025년 10월이다.
채택 고객 중 구체성이 가장 높은 곳은 Moonshine AI(미국, 온디바이스 음성 인식 전문 스타트업)다. 이 회사는 경량 음성 인식 모델인 "Moonshine"을 SL2610 위에서 상시 동작시킨다. 클라우드로 대화를 보내지 않고, 디바이스 내부에서 음성을 텍스트로 변환하는 설계다. CEO인 Pete Warden(전 Google Brain에서 TensorFlow Lite Micro를 이끌었던 인물)은 "리소스 제약이 심한 IoT 디바이스에서 Moonshine을 구동하기 위한 이상적인 토대"라고 평가한다. 회의실이나 의료 기기처럼 대화의 외부 전송을 피하고 싶은 현장에서 효과적이다.
Synaptics를 통해 Sonos(미국 홈 오디오 대기업, 티커 SONO)와 Cisco(미국 회의 단말·네트워크 장비 대기업, 티커 CSCO)도 SL2610 채택 예정 고객 명단에 이름을 올리고 있으나, 구체적인 임베디드 위치는 미공표 상태다. 스피커 제품과 회의 단말의 음성 처리가 Coral NPU로 내려가는 방향성이 시사된다는 정도로만 읽고 싶다.
매트릭스 실행 유닛은 개발 중: 행렬 연산의 본격적인 활용은 2026년 중의 마일스톤을 기다려야 함. 512 GOPS 역시 벡터 중심의 수치로 파악해야 한다는 전제가 필요함
절대 성능은 경쟁사에 1~2단계 뒤처짐: 구동 가능한 LLM은 Gemma 3 270M 클래스가 현실적인 상한선
본격 양산은 Astra SL2610이 사실상 유일: 다른 IP 벤더인 VeriSilicon도 상용 실리콘 통합에 대응하지만, 상용 칩의 출하 타이밍은 미공표
Coral NPU는 "더 빠른 NPU"를 목표로 한 프로젝트가 아니라, 설계도 자체를 공유함으로써 에지 AI(Edge AI) 실리콘의 선택지를 늘리는 쪽에 건 도전이다. 독점 IP와 연간 라이선스 비용에 묶여 있던 세계에, 자체적으로 수정 가능한 RTL이 놓였다. 10mW급 상시 가동 AI 제품을 지금부터 만든다고 가정할 때, 그 심장은 독점 IP에 묶이는 쪽인가, 아니면 자체적으로 수정할 수 있는 쪽인가.
-
Google Research - Coral NPU: A full-stack platform for Edge AI https://research.google/blog/coral-npu-a-full-stack-platform-for-edge-ai/
-
Google Developers Blog - Introducing Coral NPU https://developers.googleblog.com/en/introducing-coral-npu-a-full-stack-platform-for-edge-ai/
-
Coral NPU 공식 GitHub 리포지토리 https://github.com/google-coral/coralnpu
-
Google for Developers - Coral NPU 소개 https://developers.google.com/coral/guides/intro
-
Google for Developers - Coral NPU 아키텍처 개요 https://developers.google.com/coral/guides/architecture
-
Google for Developers - Coral NPU 데이터시트 https://developers.google.com/coral/guides/hardware/datasheet
-
Google for Developers - Coral NPU 로드맵 https://developers.google.com/coral/guides/roadmap
-
Google for Developers - Coral NPU FAQ https://developers.google.com/coral/guides/faq
-
Google for Developers - 성능 및 전력 소비 https://developers.google.com/coral/guides/power
-
Synaptics 공식 PR - Astra SL2610 출시 https://www.synaptics.com/company/news/synaptics-launches-next-generation-astra-multimodal-genai-processors-to-power-future-intelligent-iot-edge
-
Synaptics 공식 PR - Coral Dev Board(2026년 3월 10일) https://www.synaptics.com/company/news/google-research-and-synaptics-launch-next-generation-coral-dev-board-for-developers-to-bring-multimodal-edge-ai-applications-to-life
-
Synaptics SL2610 제품 페이지 https://www.synaptics.com/products/embedded-processors/sl2610-product-line
-
Synaptics 블로그 - Torq와 Coral NPU https://www.synaptics.com/company/blog/synaptics-torq-and-coral-npu-unlocking-future-edge-ai
-
VeriSilicon - Google-VeriSilicon Coral NPU IP 포트폴리오 https://www.verisilicon.com/en/IPPortfolio/Google-VeriSiliconCoralNPU
-
EE Times - Google이 오픈소스화한 NPU IP, Synaptics가 구현하다 https://www.eetimes.com/google-open-sources-npu-ip-synaptics-implements-it/
-
CNX Software - Coral NPU가 Synaptics SL2610 SoC에 통합되다 https://www.cnx-software.com/2025/10/17/google-open-source-coral-npu-synaptics-sl2610-edge-ai-socs/
-
Edge AI and Vision Alliance - Synaptics Astra SL2610 출시 보도: 지능형 IoT 엣지 미래를 구동할 차세대 Astra 멀티모달 GenAI 프로세서 https://www.edge-ai-vision.com/2025/10/synaptics-launches-the-next-generation-of-astra-multimodal-genai-processors-to-power-the-future-of-the-intelligent-iot-edge/
-
InfoQ - Google Research가 Coral NPU 플랫폼을 오픈소스로 공개하다 https://www.infoq.com/news/2025/10/google-coral-npu-platform/
-
Jon Peddie Research - Synaptics에서 사용된 Google Coral NPU https://www.jonpeddie.com/news/google-coral-npu-used-by-synaptics/
-
Electronics Weekly - 새로운 Synaptics 개발 보드에 탑재된 Coral NPU 기능 https://www.electronicsweekly.com/news/embedded-synaptics-google-unveil-dev-board-featuring-coral-npu-2026-03/
-
Arm 공식 - Ethos-U85 고급 NPU 제품 페이지 https://www.arm.com/products/silicon-ip-cpu/ethos/ethos-u85
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기