본문으로 건너뛰기

© 2026 Molayo

OpenAI속보헤드라인2026. 04. 24. 20:36

GPT-5.3-Codex 소개

요약

새롭게 출시된 GPT-5.3-Codex는 기존의 코딩 성능(GPT-5.2-Codex)과 추론 및 전문 지식 능력(GPT-5.2)을 결합한 최강의 에이전트형 코딩 모델입니다. 이 모델은 단순 코드 작성을 넘어, 연구, 도구 사용, 복잡한 실행까지 수행할 수 있어 개발자나 전문가가 컴퓨터에서 할 수 있는 거의 모든 작업을 처리합니다. 특히 SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 성능을 기록하며, 웹사이트 제작 및 장기적인 에이전트 작업에서도 뛰어난 능력을 보여줍니다.

핵심 포인트

  • GPT-5.3-Codex는 기존 GPT-5.2-Codex의 코딩 능력과 GPT-5.2의 추론/전문 지식 능력을 통합했으며, 속도 또한 25% 향상되었습니다.
  • SWE-Bench Pro와 Terminal-Bench 2.0에서 최고 수준의 성능을 달성하며 실제 소프트웨어 엔지니어링 및 터미널 활용 능력을 입증했습니다.
  • 단순한 코드 생성을 넘어, 웹사이트 제작(예: 할인 가격 표시 개선)이나 복잡한 데이터 분석 등 개발 전 과정에 걸친 에이전트 역할을 수행합니다.
  • OSWorld와 GDPval 같은 벤치마크에서 높은 점수를 기록하며, 시각적 컴퓨터 작업 및 전문 지식 기반 업무 처리 능력을 입증했습니다.

우리는 코덱스(Codex)가 할 수 있는 것의 영역을 더욱 확장하는 새로운 모델, 즉 현존하는 가장 강력한 에이전트형 코딩 모델인 GPT-5.3-Codex를 소개합니다. 이 모델은 GPT-5.2-Codex의 최첨단 코딩 성능과 GPT-5.2의 추론 및 전문 지식 능력을 하나의 모델에 결합했으며, 속도 또한 25% 빠릅니다. 이를 통해 연구, 도구 사용(tool use), 복잡한 실행이 필요한 장시간 작업(long-running tasks)을 수행할 수 있게 되었습니다. 마치 동료처럼 GPT-5.3-Codex가 작업하는 동안에도 컨텍스트를 잃지 않고 방향을 제시하고 상호작용할 수 있습니다. GPT-5.3-Codex는 스스로를 만드는 데 결정적인 역할을 한 최초의 모델입니다. 코덱스 팀은 초기 버전을 사용하여 자체 학습(training) 디버깅, 배포 관리(deployment management), 테스트 결과 및 평가 진단에 활용했으며, 코덱스가 얼마나 빠르게 자체 개발을 가속화할 수 있었는지에 저희 팀은 깊은 인상을 받았습니다.

GPT-5.3-Codex를 통해 코덱스는 단순히 코드를 작성하고 검토하는 에이전트에서 개발자와 전문가가 컴퓨터로 할 수 있는 거의 모든 것을 수행할 수 있는 에이전트로 진화했습니다.

GPT-5.3-Codex는 SWE-Bench Pro와 Terminal-Bench에서 새로운 업계 최고 기록을 세웠으며, 코딩(coding), 에이전트형(agentic) 및 실제 세계 능력(real-world capabilities)을 측정하는 네 가지 벤치마크인 OSWorld와 GDPval에서도 강력한 성능을 보여줍니다. GPT-5.3-Codex는 실제 소프트웨어 엔지니어링에 대한 엄격한 평가인 SWE-Bench Pro에서 최고 수준의 성능을 달성했습니다. SWE-bench Verified가 파이썬(Python)만 테스트하는 반면, SWE-Bench Pro는 네 가지 언어를 아우르며 오염 방지(contamination-resistant), 도전적이며 다양하고 산업 관련성이 높습니다. 또한, 코덱스와 같은 코딩 에이전트에게 필요한 터미널 기술을 측정하는 Terminal-Bench 2.0의 이전 최고 성능 기록도 훨씬 뛰어넘었습니다. 특히 GPT-5.3-Codex는 이전 모델보다 더 적은 토큰(tokens)으로 이러한 성과를 달성하여 사용자가 더 많은 것을 구축할 수 있게 합니다.

최첨단 코딩 능력, 미학적 개선(improvements in aesthetics), 그리고 압축(compaction)을 결합하여 놀라운 작업을 수행할 수 있는 모델이 탄생했습니다. 이 모델은 며칠에 걸쳐 처음부터 매우 기능적인 복잡한 게임과 앱을 구축할 수 있습니다. 모델의 웹 개발 및 장시간 에이전트형 능력을 테스트하기 위해, GPT-5.3-Codex에게 두 가지 게임(코덱스 앱 출시 당시의 레이싱 게임 버전 2와 다이빙 게임)을 만들어 달라고 요청했습니다. '버그 수정(fix the bug)' 또는 '게임 개선(improve the game)'과 같은 미리 선택된 일반적인 후속 프롬프트(generic follow-up prompts)와 웹 게임 개발 기술(develop web game skill)을 사용하여, GPT-5.3-Codex는 수백만 개의 토큰에 걸쳐 게임을 자율적으로 반복 개선했습니다. 트레일러를 시청하고 직접 게임을 플레이하여 코덱스가 무엇을 할 수 있는지 확인해 보십시오.

GPT-5.3-Codex는 또한 더 잘 이해합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 OpenAI Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
17

댓글

0