
Nvidia, 스스로 메인보드에 GPU를 장착하는 법을 배운 AI 로봇 공개 — 고정밀 작업을 스스로 수행하는 로봇 영상 공개
요약
Nvidia가 물리적 세계에서 스스로 학습하고 정교한 작업을 수행하는 에이전트형 로봇 기술인 ENPIRE를 공개했습니다. 이 기술은 코딩 에이전트가 로봇 군단을 제어하며 시각적 단서 탐색, 논문 학습, 하드웨어 직접 시도 등을 통해 스스로 정책을 개선하는 것이 특징입니다.
핵심 포인트
- ENPIRE 프레임워크를 통한 로봇의 자율적 정책 개선 및 물리적 피드백 루틴 구현
- GPU 장착, 케이블 타이 조작 등 고정밀 숙련 작업 수행 가능
- 코딩 에이전트가 환경, 정책 개선, 롤아웃, 진화의 4가지 모듈을 통해 학습
- 로봇 군단의 규모를 확장할수록 작업 해결 속도가 현저히 향상됨
Nvidia는 현실 세계에서 고정밀 및 숙련된 작업을 스스로 학습할 수 있는 에이전트형 로봇(agentic robots)을 선보였습니다. 이 ENPIRE 기술의 데모 영상의 일부로, 우리는 로봇들이 가득 찬 방에서 그래픽 카드를 집어 메인보드에 끼우거나, 컨테이너 안의 금속 핀을 분류하고, 케이블 타이(zipties)를 조작하고 정확하게 자르는 등의 작업을 수행하는 것을 볼 수 있습니다. Nvidia의 AI 디렉터이자 저명한 과학자인 Jim Fan은 이번 데모가 연구자들이 "물리적 세계에서 처음으로 자동 연구(AutoResearch)를 가능하게 할 수 있음"을 보여준다고 말했습니다.
Fan은 ENPIRE 프로젝트가 8개의 Codex 에이전트에게 로봇 군단, GPU 할당량, 그리고 넉넉한 토큰 예산을 제공했다고 설명합니다. 그 후 에이전트들에게 실수 없이 가능한 한 빨리 해결해야 할 과제가 주어졌습니다. 스탠퍼드에 기반을 둔 이 과학자는 "지시가 내려지면 로봇 군단이 살아 움직이기 시작합니다. 이들은 시각적 단서를 찾고, 장면을 리셋하며, 새로운 기술을 연습하고, 제어 스택(control stack)을 만지작거리고, 온라인에서 논문을 읽고, 토론하고, 성찰하고, 막히면 하드웨어에서 직접 다시 시도하는 법을 배웁니다"라고 설명합니다. "우리가 한 일은 Codex에 원자의 세계로 향하는 API를 제공한 것뿐이며, 나머지는 창발(emergence)의 결과입니다."
"ENPIRE는 코딩 에이전트를 위한 하네스 프레임워크(harness framework)로, 다음과 같은 네 가지 핵심 모듈을 통해 물리적 피드백 루틴을 구현합니다: 자동 리셋 및 검증을 위한 환경(Environment, EN) 모듈, 정책 정교화를 시작하는 정책 개선(Policy Improvement, PI) 모듈, 단일 또는 다수의 물리적 로봇을 병렬로 작동시켜 정책을 평가하는 롤아웃(Rollout, R) 모듈, 그리고 코딩 에이전트가 로그를 분석하고, 문헌을 참고하며, 실패 모드를 해결하기 위해 훈련 인프라와 알고리즘 코드를 개선하는 진화(Evolution, E) 모듈입니다."
우리가 가장 흥미롭게 지켜본 부분은 로봇이 "스스로 GPU를 장착하는" 모습이었습니다. 이 특정 PC DIY 작업의 짧은 녹화 영상에서, 하나의 로봇 팔이 그래픽 카드를 선택하여 앞에 놓인 메인보드 쪽의 다른 로봇 팔로 전달하는 것을 볼 수 있습니다. 두 번째 팔은 카드의 PCIe 슬롯을 메인보드 슬롯에 맞추기 위해 조심스럽게 위치를 잡은 뒤, 부드럽게 내려가 제자리에 밀어 넣습니다. 삽입 과정에서 약간의 흔들림(seesaw)이 있었지만, 결과적으로는 괜찮았을 것으로 추측됩니다. AutoResearch의 다른 프로젝트로 설정된 로봇 작업에는 미세한 핀(fine pins) 정리, 그리고 케이블 타이(zipties)를 묶고 자르는 작업 등이 포함되었습니다.
관련 연구 논문인 "ENPIRE: Agentic Robot Policy Self-Improvement in the Real World"를 통해 이 데모 뒤에 숨겨진 기술에 대해 더 자세히 배울 수 있습니다. 또한 GPT-5.5를 탑재한 Codex, Opus 4.7을 탑재한 Claude Code, Kimi K2.6을 탑재한 Kimi Code 등 서로 다른 코딩 에이전트(coding agents)를 사용했을 때의 비교 테스트 결과도 확인할 수 있습니다. 연구진은 또한 로봇 군단(robot fleet)의 규모를 확장하는 테스트도 진행했으며, "8대의 로봇이 병렬로 탐색하는 것이 더 적은 수의 로봇보다 작업을 현저히 빠르게 해결한다"는 결론을 내렸습니다. Fan은 로봇을 충분히 훈련시킨 다음 모두가 휴가를 떠나도 "Jensen(젠슨 황)은 눈치채지도 못할 것"이라며 농담을 던졌습니다.

최신 뉴스, 분석 및 리뷰를 피드에서 받아보려면 Google 뉴스에서 Tom's Hardware를 팔로우하거나, 우리를 선호 소스로 추가하세요.
Tom's Hardware의 최고의 뉴스 및 심층 리뷰를 받은 편지함으로 직접 받아보세요.
Mark Tyson은 Tom's Hardware의 뉴스 에디터입니다. 그는 비즈니스와 반도체 설계부터 이성의 한계에 다다른 제품에 이르기까지 PC 기술의 전 분야를 다루는 것을 즐깁니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Tom's Hardware의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기