
GPT-5.5 소개
요약
OpenAI가 최신 모델 GPT-5.5를 공개하며, 단순한 텍스트 생성을 넘어 복잡하고 다단계적인 '에이전트적 작업(Agentic Work)' 수행 능력을 대폭 강화했습니다. GPT-5.5는 코딩 디버깅, 데이터 분석, 소프트웨어 운영 등 지식 노동 전반에서 이전 모델 대비 월등한 추론 능력과 자율성을 보여줍니다. 특히 Terminal-Bench 2.0에서 82.7%의 최고 정확도를 기록하며 에이전트 코딩 분야의 새로운 기준을 제시했습니다. 또한, 더 적은 토큰 사용으로도 높은 성능을 유지하여 효율성까지 확보했습니다.
핵심 포인트
- GPT-5.5는 복잡하고 다단계적인 작업을 계획하고 도구를 활용하며 스스로 검증하는 '에이전트적 작업' 수행 능력이 핵심입니다.
- 코딩 분야에서 Terminal-Bench 2.0 테스트를 통해 82.7%의 최고 정확도를 달성했으며, GPT-5.4 대비 성능 향상과 함께 토큰 효율성을 높였습니다.
- GPT-5.5는 단순히 지능만 높아진 것이 아니라, 더 적은 토큰(fewer tokens)으로도 높은 품질의 결과물을 도출하여 비용 및 효율성 측면에서 우위를 점합니다.
- 모델이 시스템 전체 구조를 이해하고 문제 발생 원인과 수정 범위를 예측하는 등 '개념적 명확성(conceptual clarity)'을 보여주며, 실제 엔지니어링 작업에 근접한 자율성을 입증했습니다.
GPT-5.5 소개
저희는 가장 똑똑하고 직관적으로 사용하기 쉬운 모델인 GPT-5.5를 출시하며, 컴퓨터에서 업무를 처리하는 새로운 방식으로 나아가는 다음 단계에 도달했습니다.
GPT-5.5는 사용자가 무엇을 하려고 하는지 더 빠르게 이해하며 스스로 더 많은 작업을 수행할 수 있습니다. 코드를 작성하고 디버깅(debugging)하는 것, 온라인으로 리서치(researching)하는 것, 데이터를 분석하는 것, 문서를 만들고 스프레드시트(spreadsheet)를 만드는 것, 소프트웨어를 작동시키는 것, 그리고 작업이 완료될 때까지 도구들을 넘나드는 데 탁월합니다. 모든 단계를 세심하게 관리하는 대신, GPT-5.5에게 복잡하고 여러 부분이 얽힌 작업을 맡기고 계획을 세우고, 도구를 사용하며, 자신의 결과물을 확인하고, 모호함을 헤쳐나가며 계속 진행하도록 신뢰할 수 있습니다.
이러한 발전은 특히 에이전트적 코딩(agentic coding), 컴퓨터 활용, 지식 노동(knowledge work), 그리고 초기 과학 연구 분야에서 두드러집니다. 이 영역들은 맥락을 가로지르는 추론과 시간에 따른 행동 수행에 따라 진척도가 결정되기 때문입니다. GPT-5.5는 속도를 저해하지 않으면서 이러한 인텔리전스(intelligence)의 향상을 제공합니다. 일반적으로 크고 성능이 뛰어난 모델일수록 서비스 속도가 느린 경향이 있지만, GPT-5.5는 실제 환경에서의 서빙(serving)에서 GPT-5.4와 동일한 토큰당 지연 시간(per-token latency)을 유지하는 동시에 훨씬 높은 수준의 인텔리전스를 보여줍니다. 또한 동일한 Codex 작업을 완료하는 데 필요한 토큰 수가 현저히 적어, 성능과 효율성 면에서 모두 우수합니다.
저희는 오늘날까지 가장 강력한 안전장치(safeguards) 세트를 적용하여 GPT-5.5를 출시하며, 이는 오용을 줄이는 동시에 유익한 작업에 대한 접근성을 유지하도록 설계되었습니다. 저희는 이 모델을 전체 안전 및 대비 프레임워크(safety and preparedness frameworks)로 평가했으며, 내부 및 외부 레드팀(redteamers)과 협력했고, 고급 사이버 보안(cybersecurity) 및 생물학 역량에 대한 목표 테스트를 추가했으며, 출시 전에 거의 200개의 신뢰할 수 있는 초기 접근 파트너들로부터 실제 사용 사례에 대한 피드백을 수집했습니다.
오늘부로 GPT-5.5는 ChatGPT와 Codex의 Plus, Pro, Business, Enterprise 사용자에게 순차적으로 제공되며, GPT-5.5 Pro는 ChatGPT의 Pro, Business, Enterprise 사용자에게 순차적으로 제공됩니다. API 배포에는 다른 안전장치가 필요하며, 저희는 대규모(at scale)로 서비스하기 위한 안전 및 보안 요구 사항에 대해 파트너 및 고객들과 긴밀히 협력하고 있습니다. GPT-5.5와 GPT-5.5 Pro는 곧 API를 통해 제공될 예정입니다.
| Model | Terminal-Bench 2.0 | Expert-SWE (Internal) | GDPval (wins or ties) | OSWorld-Verified | Toolathlon | BrowseComp | FrontierMath Tier 1–3 |
|---|---|---|---|---|---|---|---|
| GPT-5.5 | 82.7% | 73.1% | 84.9% | 78.7% | 55.6% | 84.4% | 51.7% |
| GPT-5.4 | 75.1% | 68.5% | 83.0% | 75.0% | 54.6% | 82.7% | 47.6% |
| GPT-5.5 Pro | - | - | 82.3% | - | - | 90.1% | 52.4% |
| GPT-5.4 Pro | - | - | 82.0% |
AI 자동 생성 콘텐츠
본 콘텐츠는 OpenAI Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기