함께 오픈 에이전트 생태계를 구축합니다: OpenEnv 소개

요약

본 기사는 자율적인 AI 에이전트 개발을 위한 표준화된 '에이전트 환경(Agent Environment)' 개념과 이를 구현한 OpenEnv 생태계를 소개합니다. OpenEnv는 에이전트가 작업을 수행하는 데 필요한 도구, API, 실행 컨텍스트 등을 안전하고 의미론적으로 명확하게 정의하는 샌드박스 역할을 합니다. Meta와 Hugging Face의 파트너십을 통해 구축된 이 환경 허브는 학습과 배포 전 과정에서 일관성을 제공하며, 개발자들이 쉽게 환경을 공유하고 재현할 수 있도록 지원합니다.

핵심 포인트

OpenEnv는 에이전트가 작업을 수행하는 데 필요한 도구와 API를 안전하게 캡슐화한 표준화된 '에이전트 환경'입니다.
Meta-PyTorch와 Hugging Face의 협력을 통해 OpenEnv Hub가 구축되어, 개발자들이 다양한 환경을 공유하고 탐색할 수 있게 되었습니다.
OpenEnv는 에이전트 행동에 명확성, 안전성(샌드박스 제어), 그리고 인증된 도구 접근성을 보장하여 대규모 자율 작업을 가능하게 합니다.
개발자들은 OpenEnv 규격에 맞춰 환경을 구축하고 허브에 업로드함으로써, RL 훈련부터 추론까지의 전체 파이프라인에서 일관성과 재현성을 확보할 수 있습니다.

에이전트 환경은 에이전트가 작업을 수행하기 위해 필요한 모든 것을 정의합니다: 도구, API, 자격 증명, 실행 컨텍스트 등. 에이전트 행동에 명확성, 안전성, 샌드박스 제어를 제공합니다.

이러한 환경은 학습과 배포 모두에 사용되며, 확장 가능한 에이전트 개발의 기초가 됩니다.

현대 AI 에이전트는 수천 개의 작업을 자율적으로 수행할 수 있습니다. 그러나 대형 언어 모델만으로는 해당 작업을 실제로 실행하는 데 충분하지 않습니다 — 올바른 도구에 대한 접근이 필요합니다. 수백만 개의 도구를 모델에 직접 노출하는 것은 합리적이지도 (또는 안전하지도) 않습니다. 대신, 우리는 에이전트 환경을 필요로 합니다: 작업에 정확히 필요한 것만 정의하고 그 이상을 포함하지 않는 안전한, 의미론적으로 명확한 샌드박스입니다. 이러한 환경은 중요한 세부 사항을 처리합니다:

작업이 무엇을 필요로 하는지에 대한 명확한 의미론적 정의
샌드박스 실행 및 안전성 보장
인증된 도구 및 API에 대한 원활한 접근

다음 파의 에이전트 개발을 가속화하기 위해 Meta-PyTorch 와 Hugging Face 는 환경 허브를 출시하기 위한 파트너십을 맺었습니다: 학습과 배포 모두에서 OpenEnv 호환 환경을 구축, 공유, 탐색할 수 있는 공유 공간입니다. 아래 그림은 Meta 가 개발 중인 새로운 포스트 훈련 스택에서 OpenEnv 가 어떻게 위치하는지를 보여줍니다. 다른 라이브러리인 TRL, SkyRL, Unsloth 와의 통합이 진행 중입니다:

다음 주부터 개발자는 다음을 할 수 있습니다:

Hugging Face 의 새로운 Environment Hub 방문 — 초기 환경 일부 시드 제공
인간 에이전트로 직접 환경과 상호작용
모델에 환경 내에서 작업을 해결하도록 의뢰
환경이 노출하는 도구 및 관찰을 정의하는 방법을 확인
OpenEnv 규격에 부합하여 허브로 업로드된 모든 환경은 자동으로 이 기능을 얻습니다 — 전체 RL 훈련 실행 전에 검증 및 반복을 빠르고 쉽게 수행할 수 있습니다.

또한, 커뮤니티 피드백 수집 및 표준 형성에 도움을 주기 위해 OpenEnv 0.1 Spec (RFC) 을 출시합니다.

현재 저장소 상태에서는 환경 생성자가 step(), reset(), close() API 를 사용하여 환경을 만들 수 있습니다 (아래 RFC 의 일부). 이러한 환경을 만드는 몇 가지 예는 여기에서 볼 수 있습니다. 환경 사용자는 저장소에 이미 있는 모든 환경에 대해 로컬 Docker 기반 환경을 사용할 수 있습니다. 다음 RFC 는 검토 중입니다:

RFC 001: 핵심 구성 요소인 Environment, Agent, Task 등 간의 관계 구조를 확립
RFC 002: 기본 env 인터페이스, 패키징, 격리 및 환경과의 통신 제안
RFC 003: 환경 추상화와 격리 경계를 통해 MCP 도구의 캡슐화 제안
RL 포스트 훈련: 컬렉션 간 환경을 가져와 TRL, TorchForge+Monarch, VeRL 등으로 RL 에이전트 훈련 사용
환경 생성: 환경을 구축하고 생태계의 인기 있는 RL 도구와 호환성을 보장하며 동료들과 공유 등
SOTA 방법의 재현: 에이전트 코딩 및 소프트웨어 공학을 위한 환경을 통합하여 FAIR 의 Code World Model 와 같은 방법을 쉽게 복제
배포: 사용자가 환경을 만들고, 동일한 환경에서 훈련한 후 추론에도 동일하게 사용할 수 있습니다 (전체 파이프라인)

이것은 시작에 불과합니다. 우리는 OpenEnv Hub 를 Meta 의 새로운 TorchForge RL 라이브러리 와 통합하고, verl, TRL, SkyRL 등 다른 오픈소스 RL 프로젝트와 협력하여 호환성을 확장하고 있습니다.

10 월 23 일 PyTorch Conference 에서 스페크의 라이브 데모 및 워크투루를 진행하며 함께 참여하세요. 그리고 환경, RL 포스트 트레이닝, 에이전트 개발에 대한 향후 커뮤니티 미팅을 계속 지켜봐 주세요.

👉 Hugging Face 의 OpenEnv Hub 를 확인하고 다음 세대의 에이전트를 구동할 환경을 구축해 보세요.

👉 0.1 스페크를 확인하세요. 이는 OpenEnv 프로젝트에서 구현되어 있으며 → 더 나은 것을 만들기 위해 아이디어와 기여를 환영합니다!

👉 Discord 에서 참여하고 RL, 환경 및 에이전트 개발에 대해 커뮤니티와 대화하세요.

👉 직접 사용해 보세요 - 우리는 종합적인 노트북을 만들어端到端 예제를 안내하며 물론 PyPI 를 통해 패키지를 쉽게 pip 설치할 수 있습니다. 이 노트북은 우리가 구축한 추상화에 대한 워크투루를 진행하며, 기존 통합 사용법과 추가 방법을 보여줍니다 - Google Colab 에서 시도해 보세요!

👉 지원 플랫폼 확인 - Unsloth, TRL, Lightning.AI

각 환경 하나씩, 다음 세대의 오픈 에이전트를 함께 만들어 나가요 🔥!

AI 자동 생성 콘텐츠

원문 바로가기

함께 오픈 에이전트 생태계를 구축합니다: OpenEnv 소개

요약

핵심 포인트

댓글