
Warp의 GPT-5.5를 활용한 오픈 소스 구축을 위한 거대한 베팅
요약
Warp가 OpenAI의 GPT-5.5를 활용하여 '오픈 에이전틱 개발(Open Agentic Development)' 모델을 도입합니다. 에이전트가 코드를 작성하고 테스트하며 PR을 생성하는 워크플로우를 통해 개발 효율성을 극대화하고 있습니다.
핵심 포인트
- GPT-5.5 도입으로 작업당 토큰 사용량 30% 감소 및 효율성 개선
- Warp 내부 엔지니어링 팀 PR의 약 90%를 에이전트가 공동 생성
- 인간은 목표 정의와 검증을 담당하고 에이전트는 실행을 담당하는 협업 모델
- 터미널을 에이전트와 개발자가 상호작용하는 핵심 환경으로 구축

30%
GPT-5.5를 통한 작업당 토큰 (tokens) 사용량 감소
90%
에이전트 (agents)를 통해 생성된 내부 풀 리퀘스트 (pull requests)
Warp(새 창에서 열기)는 현대적인 터미널로 시작하여 속도, 협업 기능, 명령 워크플로우(command workflows), 그리고 AI 네이티브 인터페이스를 통해 개발자들로부터 초기 사랑을 받았습니다. 코딩 에이전트 (coding agents)가 실험 단계에서 일상적인 엔지니어링 워크플로우 (engineering workflows)로 이동함에 따라, Warp는 터미널이 개발자들이 에이전트와 함께 작업하기에 자연스러운 장소가 되고 있음을 확인했습니다. 즉, 명령, 컨텍스트 (context), 협업, 그리고 리뷰가 이미 만나는 곳입니다.
올해 Warp가 OpenAI를 리포지토리 (repo)의 창립 후원사로 하여 터미널 클라이언트를 오픈 소스 (open-sourced)(새 창에서 열기)로 공개했을 때, 회사는 또한 '오픈 에이전틱 개발 (Open Agentic Development)'을 소개했습니다. 이는 공개된 환경에서 소프트웨어를 구축하기 위한 모델입니다. 인간은 목표를 정의하고 결과를 감독하며, 에이전트 (agents)는 작업을 계획하고, 코드를 작성하며, 변경 사항을 테스트하고, 풀 리퀘스트 (pull requests)를 생성합니다.
최근 프런티어 AI 모델 (frontier AI models)의 발전은 이러한 종류의 에이전트 오케스트레이션 (agent orchestration)을 대규모로 실용화하는 데 도움을 주었습니다. Warp의 오픈 소스 워크플로우 (open-source workflows)를 위해, GPT-5.5는 에이전트가 더 넓은 문제 공간 (problem spaces)에 대해 추론하고 인간의 리뷰를 위해 작업을 준비할 수 있도록 돕습니다. 내부 벤치마크 (benchmarks)에서 GPT-5.5는 에이전틱 코딩 작업 (agentic coding task)당 GPT-5.4보다 30% 적은 토큰 (tokens)을 사용하여, Warp가 장기 실행 에이전트 워크플로우 (long-running agent workflows)를 확장함에 따라 효율성을 개선하는 데 기여했습니다.
오늘날 Warp는 거의 100만 명의 개발자를 보유하고 있으며, Fortune 500대 기업의 56% 이상이 사용하고 있습니다. Warp의 자체 엔지니어링 조직 내에서, 이제 에이전트들이 회사 풀 리퀘스트 (pull requests)의 약 90%를 공동 생성하고 있으며, 이를 통해 팀은 장기 실행 에이전트 워크플로우 (long-running agent workflows)가 확장을 위해 필요로 하는 것들, 즉 관찰 가능성 (observability), 조정 (coordination), 메모리 (memory), 그리고 인간의 리뷰 (human review)에 대한 직접적인 통찰을 얻고 있습니다.
"우리는 에이전트 함대 (fleet of agents)를 감독하기 위해 커뮤니티와 협력함으로써 더 나은 Warp를 더 빠르게 출시할 수 있다고 생각합니다. OpenAI 모델은 이러한 시스템이 요구하는 장기적인 코딩 작업 (long-horizon coding work)을 지속 가능하게 만드는 데 도움을 줍니다."
Open Agentic Development (개방형 에이전트 개발)은 소프트웨어 개발이 나아갈 방향에 대한 Warp의 베팅입니다. 에이전트가 코드를 작성하면, 개발자는 의도(intent)를 명시하고, 출력물을 검증하며, 최종적으로 무엇을 출시할지 결정하게 됩니다. 이러한 선택들은 미래의 에이전트를 위한 재사용 가능한 컨텍스트 (context)가 되어, 시스템이 시간이 지남에 따라 개선될 수 있도록 합니다.
오케스트레이션 (orchestration)이 충분히 훌륭하다면, Warp는 에이전트가 느슨하게 협력하는 인간 그룹보다 더 일관된 코드를 생성할 수 있다고 믿습니다. 그렇게 되면 오픈 소스는 인간이 구현 작업 (implementation work)에 직접 기여하는 것보다, 인간만이 제공할 수 있는 제품 판단력 (product judgment)과 공유된 비전을 기여하는 것에 더 가까워집니다.

지속적이고 병렬화된 에이전트에는 공유 메모리 (shared memory), 재현 가능한 환경 (reproducible environments), 평가 시스템 (evaluation systems), 권한 (permissions), 그리고 작업을 조정하는 방법과 같은 구성 요소가 필요합니다. Warp는 로컬 및 클라우드 환경 전반에서 에이전트를 관리하기 위해 클라우드 오케스트레이션 플랫폼인 Oz를 구축했습니다.
회사에 따르면, Warp는 Open Agentic Development 워크플로우를 위해 오픈 소스 기여를 관리하는 데 도움을 주는 에이전트에 GPT-5.5를 사용합니다. OpenAI 모델은 추론 (reasoning), 계획 (planning), 코드 생성 (code generation), 그리고 코드 리뷰 (code review)를 포함하는 장기적인 엔지니어링 작업에 대한 Warp의 내부 평가에서도 강력한 성능을 보여주었습니다.
Oz(새 창에서 열기)는 로컬 및 클라우드 환경 전반에서 에이전트를 배포하고 조정하는 컨트롤 플레인 (control plane) 역할을 합니다. 개발자는 웹 인터페이스를 통해 에이전트를 실행하고, 사전 정의된 기술 (skills)과 환경을 선택하며, 모델 및 호스팅 구성을 선택하고, 실행 중인 장기 워크플로우를 중앙에서 모니터링할 수 있습니다.



에이전트가 실행되면 개발자가 라이브 세션을 점검하고, 실행 상태를 모니터링하며, 생성된 아티팩트 (artifacts)를 검토하는 동안에도 에이전트는 원격에서 계속 실행될 수 있으며, 컨텍스트를 잃지 않고 클라우드와 로컬 환경 사이에서 워크플로우를 주고받을 수 있습니다. Oz는 또한 반복적인 워크플로우를 지원하여 에이전트가 예약된 크론 잡 (cron jobs)처럼 작동할 수 있도록 합니다.
에이전트가 시간이 지남에 따라 더 많은 상태 (state)를 축적함에 따라, 집중력을 유지하고 중요한 결정을 보존하는 것이 점점 더 어려워집니다. Oz는 컨텍스트 압축 (context compaction), 지속성 메모리 (persistent memory), 그리고 코드 검색 및 파일 분석과 같은 작업을 위한 전용 서브에이전트 (subagents)와 같은 기술을 사용하여 에이전트가 확장된 워크플로우 전반에 걸쳐 신뢰성을 유지할 수 있도록 돕습니다.
OpenAI 모델은 Oz 내부에서 여러 역할을 수행합니다. Warp 에이전트의 경우, 작업은 유형과 난이도에 따라 분류되며, 더 복잡한 코딩 및 추론 작업은 더 강력한 모델 구성으로 라우팅됩니다. GPT-5.5는 Warp가 까다로운 에이전트 기반 코딩 워크플로우 (agentic coding workflows)를 위해 사용하는 OpenAI 모델 믹스의 일부입니다. 또한 Warp는 평가 파이프라인 (evaluation pipelines) 내부에서 LLM-as-a-judge 시스템으로 OpenAI 모델을 사용합니다.
“우리는 OpenAI 모델이 동일한 작업을 완료하는 데 더 적은 토큰 (tokens)과 턴 (turns)을 사용하면서도 정기적으로 프런티어 수준 (frontier-level)의 지능을 제공한다는 것을 발견했습니다. 이 모델들은 넓은 문제 공간 (problem spaces)에 걸친 추론이 필요한 코딩 작업에 특히 강력합니다.”
Warp에게 있어, 오픈 에이전틱 개발 (Open Agentic Development)과 Oz 오케스트레이션 (orchestration) 플랫폼은 궁극적으로 동일한 장기적 베팅의 일부입니다. 즉, 소프트웨어 개발이 코딩 어시스턴트와의 개별적인 상호작용에서, 시간이 지남에 따라 수많은 지속성 에이전트 (persistent agents)를 조정하는 시스템으로 진화하고 있다는 베팅입니다.
지금까지 그 베팅은 성과를 거두고 있는 것으로 보입니다. Warp의 연간 반복 매출 (ARR)은 작년에 35배 성장했으며, 기업 매출은 2025년 4분기 이후 500% 이상 증가했습니다. 회사는 이러한 성장의 상당 부분이 에이전트 워크플로우를 확장할 수 있는 더 유연한 방법을 찾는 조직들로부터 나오고 있다고 말합니다.
에이전틱 개발 (agentic development)을 둘러싼 근본적인 워크플로우는 여전히 초기 단계이며 매우 실험적입니다. Warp는 터미널 클라이언트를 오픈 소스로 공개하고 오픈 에이전틱 개발 워크플로우를 통해 공개적으로 구축함으로써, 에이전트가 시간이 지남에 따라 더 자율적으로 변함에 따라 오케스트레이션 (orchestration), 감독 (supervision), 그리고 검증 (verification) 시스템이 어떻게 진화할지 개발자들이 형성하는 데 도움을 줄 수 있기를 희망합니다.
“에이전틱 개발의 미래가 정확히 어떤 모습일지는 아무도 모릅니다.”라고 Lloyd는 말합니다. “우리는 커뮤니티가 그 미래를 형성하는 데 참여할 수 있어야 한다고 생각합니다.”
AI 자동 생성 콘텐츠
본 콘텐츠는 OpenAI News의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기