GPT-5.6 Sol 미리보기: 차세대 모델

우리는 GPT-5.6 시리즈의 제한적 미리보기(limited preview)를 시작합니다: 우리의 플래그십 모델인 Sol, 일상적인 업무를 위한 균형 잡힌 모델인 Terra, 그리고 빠르고 저렴한 모델인 Luna입니다. Terra는 GPT-5.5와 경쟁력 있는 성능을 갖추면서도 비용은 2배 더 저렴하며, Luna는 가장 낮은 비용으로 강력한 역량을 제공합니다.

GPT-5.6 Sol은 현재까지 당사의 가장 강력한 안전 스택(safety stack)과 함께 출시됩니다. 우리는 고위험 활동, 민감한 사이버 요청, 그리고 반복적인 오용에 대한 보호 기능을 강화했으며, 수 주 동안 취약점을 찾고 시스템을 압박 테스트(pressure-testing)하며 실제 공격에 대비해 시스템을 강화(hardening)하는 데 시간을 보냈습니다.

우리는 폭넓은 접근성을 믿으며, 앞으로 몇 주 안에 GPT-5.6 Sol, Terra, Luna를 일반적으로 사용할 수 있도록(generally available) 할 계획입니다. 미국 정부와의 지속적인 협력의 일환으로, 우리는 오늘 출시 전에 우리의 계획과 모델의 역량을 미리 공유했습니다. 정부의 요청에 따라, 우리는 더 광범위하게 출시하기 전, 정부와 참여 사실을 공유한 소수의 신뢰할 수 있는 파트너 그룹을 대상으로 제한적 미리보기를 시작합니다. 이 미리보기 기간 동안, 우리는 더 넓은 가용성을 향해 나아가면서 파트너들과 긴밀히 협력하고 테스트를 계속할 것입니다. 우리는 이러한 방식의 정부 접근 프로세스가 장기적인 기본 설정(default)이 되어서는 안 된다고 믿습니다. 이는 도구가 필요한 사용자, 개발자, 기업, 사이버 방어자 및 글로벌 파트너들로부터 최상의 도구를 격리시키기 때문입니다. 우리는 사이버 행정 명령(cyber Executive Order) 프레임워크와 향후 모델 출시를 위한 반복 가능한 프로세스를 개발하기 위해 정부와 협력하는 동안, 이것이 향후 몇 주 내에 더 넓은 가용성을 확보하기 위한 가장 강력한 경로라고 믿기에 이러한 단기적인 단계를 밟고 있습니다.

GPT‑5.6 Sol은 우리의 가장 강력한 모델입니다. 모델 성능의 미리보기를 제공하기 위해, 우리는 코딩 (coding), 생물학 (biology), 사이버 보안 (cybersecurity) 분야에서 향상된 에이전트 능력 (agentic capabilities)을 강조하는 일련의 평가 결과를 공유하며, 추가적인 안전성 및 대비 평가 결과는 우리의 시스템 카드 (system card)(새 창에서 열기)에서 확인할 수 있습니다. 모델을 광범위하게 공개할 때 확장된 평가 결과 세트를 공유할 예정입니다.

GPT‑5.6에서는 Sol이 깊이 있게 추론할 수 있도록 가장 많은 시간을 부여하는 새로운 max 추론 노력 (reasoning effort)을 도입합니다. 또한, 서브 에이전트 (subagents)를 활용하여 복잡한 작업을 가속화함으로써 단일 에이전트의 능력을 넘어서는 새로운 ultra 모드를 도입합니다.

코딩 워크플로 (coding workflows)의 경우, GPT‑5.6 Sol은 계획, 반복, 도구 조정 (tool coordination)이 필요한 명령줄 워크플로 (command-line workflows)를 테스트하는 Terminal‑Bench 2.1에서 새로운 SOTA (state of the art)를 기록했습니다.

GPT‑5.6 Sol은 생물학 워크플로 (biology workflows)에서도 폭넓은 개선을 보여줍니다. 장기적인 유전체학 (genomics) 및 정량 생물학 (quantitative-biology) 분석을 평가하는 GeneBench v1에서, GPT-5.5보다 더 적은 토큰 (tokens)을 사용하면서도 더 강력한 결과를 달성했습니다.

GPT‑5.6 Sol은 사이버 보안 (cybersecurity) 분야에서 우리의 가장 유능한 모델입니다. 이는 취약점 연구 (vulnerability research) 및 익스플로잇 (exploitation)을 포함한 장기적인 보안 작업에 대한 성능-효율성 프런티어 (performance-efficiency frontier)를 이동시킵니다. ExploitBench²에서 GPT‑5.6 Sol은 출력 토큰 (output tokens)을 약 1/3만 사용하면서도 Mythos Preview와 경쟁할 만한 성능을 보여줍니다. OpenAI 및 기타 프런티어 연구소 (frontier labs)와의 협업을 통해 UC Berkeley 연구진이 만든 벤치마크인 ExploitGym(새 창에서 열기) 3에서, GPT‑5.6 Sol, Terra, 그리고 Luna 모델은 모두 추론 (reasoning)을 높임에 따라 사이버 능력 (cyber capabilities)에서 강력한 개선을 입증합니다.

우리는 각 모델의 역량에 맞춘 설정을 적용하여, 지금까지 중 가장 강력한 안전 장치 (safeguards)와 함께 GPT-5.6 Sol, Terra, Luna를 개발했습니다. 모델의 역량이 향상됨에 따라, 우리는 코드 리뷰 (code review), 취약점 연구 (vulnerability research), 패치 개발 (patch development), 디버깅 (debugging), 보안 교육 (security education), 방어 테스트 (defensive testing)와 같은 정당한 작업에 대한 접근성을 유지하면서도, 실제 세계의 적대적 압력 (adversarial pressure)을 점점 더 잘 견뎌낼 수 있도록 안전 장치를 설계합니다. 우리의 목표는 유익한 용도들을 불필요하게 제한하지 않으면서, 금지된 공격적 활동 (offensive activity)을 더 어렵고, 불확실하며, 탐지 가능하게 만드는 것입니다. 모델과 안전 장치에 대한 우리의 평가를 바탕으로, 우리는 금지된 공격적 사용을 의미 있게 제한하는 동시에 정당한 방어적 작업에는 상당한 이익을 줄 것으로 기대합니다.

GPT-5.6 Sol은 엔드 투 엔드 공격 (end-to-end attacks)을 안정적으로 수행하는 것보다 사람들이 취약점을 찾고 수정하는 것을 돕는 데 더 뛰어납니다. 이러한 역량이 계속 발전함에 따라, 우리의 우선순위는 이러한 도구들을 사용하여 약점을 찾고, 패치를 개발하며, 시스템을 보다 광범위하게 강화할 수 있는 방어자 (defenders)들에게 이 기술이 도달하여 혜택을 주는 것입니다.

GPT-5.6 Sol은 우리의 __준비성 프레임워크 (Preparedness Framework)__에 따른 사이버 임계값 (Cyber Critical threshold)을 넘지 않습니다. Chromium 및 Firefox를 포함하는 평가에서, 모델은 버그와 익스플로잇의 구성 요소인 익스플로잇 프리미티브 (exploitation primitives)를 식별했지만, 테스트된 조건 하에서 자율적으로 기능적인 풀 체인 익스플로잇 (full-chain exploit)을 생성하지는 않았습니다. 그럼에도 불구하고, 벤치마크 임계값은 모델이 사용되거나 다른 도구와 결합될 수 있는 모든 방식을 포착할 수는 없습니다. 그러한 불확실성과 모델의 전반적인 역량의 단계적 변화 (step change) 때문에, 우리는 모델의 향상된 역량을 더 강력한 안전 장치 및 단계적 출시 (phased release)와 결합하고 있습니다. 안전 장치에 대한 더 자세한 내용은 GPT-5.6 프리뷰 시스템 카드 (GPT-5.6 Preview system card)(새 창에서 열기)에서 확인할 수 있습니다.

단일한 안전장치만으로는 단호하거나 적응적인 오용(misuse)에 대응하기에 충분하지 않습니다. GPT-5.6 프리뷰 전반에 걸쳐, 우리는 모델마다 정확한 구성이 달라지는 계층화된 안전장치(layered safeguards)를 사용하며, 실제 공격에 대해 이를 압력 테스트(pressure-test)합니다. 여기에는 모델에 학습된 보호 조치, 생성 중 실시간 점검, 계정 수준의 신호, 차등화된 접근(differentiated access), 모니터링, 집행(enforcement) 및 지속적인 테스트가 포함됩니다.

GPT-5.6은 사용자가 의도를 숨기거나 모델을 탈옥(jailbreak)하려고 시도하는 경우를 포함하여, 금지된 사이버 지원을 거부하도록 학습되었습니다. 이러한 모델 수준의 안전장치는 모델이 도와주어야 할 것과 도와주어서는 안 될 것에 대한 첫 번째 경계를 설정합니다.

실시간 사이버 및 생물학적 오용 분류기(Real-time cyber and biology misuse classifiers)는 출력이 생성되는 동안 이를 평가함으로써 또 다른 계층을 제공합니다. 위험도가 더 높은 사례의 경우, 잠재적인 위반이 감지되면 더 큰 추론 모델(reasoning model)이 대화와 그 문맥을 검토하는 동안 생성이 일시 중지될 수 있습니다. 출력이 허용되지 않는 것으로 평가되면 사용자에게 도달하기 전에 차단됩니다.

플래그가 지정된 활동(Flagged activity)은 콘텐츠 보존 및 검토에 관한 당사의 약관 및 정책에 따라 관련 대화 및 위험 신호 전반에 걸친 계정 수준의 검토를 트리거할 수도 있습니다. 단일 대화를 넘어 살펴보는 것은 우리 시스템이 지속적인 악의적 행동과, 유사한 기술적 개념이 매우 다른 문맥에서 나타날 수 있는 정당한 이중 용도(dual-use) 보안 작업 사이를 구분하는 데 도움이 됩니다.

이러한 계층들이 결합되어 전체적인 접근 방식을 단일 안전장치보다 더 강력하게 만듭니다. 모델 행동은 유해한 응답의 가능성을 줄이고, 실시간 시스템은 생성 중에 개입할 수 있으며, 계정 수준의 검토는 더 넓은 패턴을 식별할 수 있고, 차등화된 접근은 가장 민감한 기능을 기본적으로 광범위하게 공개하지 않으면서도 중요한 방어 작업을 보존합니다.

특히 프리뷰 (preview) 기간 동안에는 사용자가 일부 요청을 차단하거나 거부하는 안전 장치 (safeguards)를 경험할 수 있습니다. 다른 요청의 경우, 추가 검토를 위해 생성이 일시 중단되기 때문에 시간이 더 오래 걸릴 수도 있습니다. 안전 장치는 때때로 정당한 작업에 개입할 수 있으며, 특히 방어적 활동과 공격적 활동이 초기에는 유사해 보일 수 있는 이중 용도 (dual-use) 분야에서 그러할 수 있습니다.

이는 프리뷰가 테스트하도록 설계된 부분 중 하나입니다. 우리는 안전 장치가 오용을 제한하는지뿐만 아니라, 정당한 사용자가 여전히 정상적인 작업을 신뢰할 수 있고 효율적으로 완료할 수 있는지도 이해하고자 합니다. 프리뷰 기간 동안의 피드백은 불필요한 차단과 지연을 줄이고, 안전 장치가 문맥 (context)을 해석하는 방식을 개선하며, 더 넓은 출시 전에 더 매끄러운 경험을 만드는 데 도움이 될 것입니다.

또한 우리는 기업 고객의 프라이버시 요구 사항을 지원하면서 안전성을 높이기 위해—프라이버시 보존형 탐지 (privacy-preserving detection), 고객 운영 안전 제어 (customer-operated safety controls), 그리고 고객, 사용자 또는 워크로드의 위험도에 맞춰 조정된 액세스 (access calibrated to the risk)를 포함하여—장기적인 접근 방식에 대해 기업 고객들과 협력하고 있습니다.

공격자가 전술을 변경하더라도 안전 장치는 효과를 유지해야 합니다. 알려진 고정된 공격 세트에 대해서만 작동하는 보호 조치는 프런티어 모델 (frontier model)에 충분히 강력하지 않습니다.

이것이 바로 우리가 안전을 위해 그 어느 때보다 더 많은 지능과 컴퓨팅 자원을 투입하고 있는 이유이며, 자체 모델을 사용하여 약점을 찾고 안전 장치를 더 빠르게 개선하고 있습니다. 우리는 단일한 좁은 설정이 아니라 많은 프롬프트나 문맥 전반에 걸쳐 작동할 수 있는 공격인 유니버설 탈옥 (universal jailbreaks)을 찾는 것을 목표로 하는 자동화된 레드팀 (automated red teaming)에 700,000 A100 상당의 GPU 시간 이상을 투입했습니다. 이러한 더 어렵고 일반적인 공격에 집중함으로써, 우리는 알려진 실패의 고정된 세트를 넘어 안전 장치를 테스트할 수 있습니다. 또한 이는 인간의 테스트만으로는 커버할 수 있는 것보다 훨씬 더 많은 공격 패턴을 탐색하고, 실패 패턴을 더 일찍 식별하며, 약점을 발견한 시점부터 이를 해결하기까지의 경로를 단축할 수 있게 해줍니다.

자동화된 레드팀 테스트 (red-teaming) 외에도, 당사는 제3자 테스터들과 협력하여 광범위한 인간 전문가 레드팀 테스트를 수행했으며, 이는 프리뷰 기간 동안 계속될 예정입니다. 인간 레드팀 테스트는 우리 시스템이 예상하지 못할 방식으로 모델을 오용하려는 창의적인 전문가들에 맞서 안전 장치 (safeguards)를 테스트함으로써 자동화된 작업을 보완합니다.

그 어떤 평가도 모든 제품 구성, 다단계 공격, 또는 실제 워크플로 (workflow)를 대변할 수는 없습니다. 따라서 당사는 새롭게 발견된 탈옥 (jailbreaks) 사례를 재현, 평가, 우선순위 지정 및 해결하기 위한 신속 대응 프로세스를 유지하며, 이를 지속적인 평가 항목에 추가하여 향후 유사한 실패에 대비해 테스트할 수 있도록 합니다.

프리뷰 기간 동안 GPT-5.6 모델은 우선 API 및 Codex를 통해 선정된 신뢰할 수 있는 파트너 및 조직에 제공될 예정입니다. 당사는 곧 ChatGPT, Codex 및 API를 사용하는 사람들에게 더 폭넓게 제공할 계획입니다.

GPT-5.6과 함께 도입된 이 새로운 명명 체계에서, 숫자는 모델의 세대 (generation)를 식별하며, Sol, Terra, Luna는 자체적인 속도에 따라 발전할 수 있는 지속 가능한 능력 계층 (capability tiers)을 식별합니다. 이 제품군은 지능, 속도, 비용 측면에서 사용자 및 개발자에게 더 명확한 선택지를 제공합니다.

GPT-5.6은 세 가지 모델 크기에 대해 100만 (1M) 토큰당 가격이 책정됩니다: Sol은 입력 $5 / 출력 $30, Terra는 입력 $2.50 / 출력 $15, Luna는 입력 $1 / 출력 $6입니다. 또한 GPT-5.6은 명시적인 캐시 중단점 (cache breakpoints) 지원과 최소 30분의 캐시 수명을 포함하여 더욱 예측 가능한 프롬프트 캐싱 (prompt caching)을 도입합니다. GPT-5.6 및 이후 모델의 경우, 캐시 쓰기 (cache writes)는 모델의 캐시되지 않은 입력 요율의 1.25배로 청구되는 반면, 캐시 읽기 (cache reads)는 계속해서 90%의 캐시된 입력 할인 혜택을 받습니다.

또한 당사는 7월에 Cerebras에서 초당 최대 750 토큰의 속도로 GPT-5.6 Sol을 출시하여, 전례 없는 속도로 고객에게 최첨단 지능 (frontier intelligence)을 제공할 예정입니다. 용량을 확장함에 따라 액세스는 초기에는 선정된 고객으로 제한될 것입니다.

저희는 이 프리뷰 (preview) 기간 동안 계속해서 학습하고, 곧 GPT-5.6 Sol, Terra 및 Luna를 더 많은 사람들에게 선보일 수 있게 되어 매우 기쁩니다.

저희는 모델의 프로덕션 (production) 동작을 관찰하고 오프라인에서 시뮬레이션함으로써 지연 시간 (latency)과 API 비용을 추정합니다. 이 추정치에는 도구 호출 (tool call) 세부 정보, 샘플링된 토큰 (sampled tokens), 그리고 입력 토큰 (input tokens)이 포함됩니다. 실제 결과는 상당히 다를 수 있으며, 저희의 시뮬레이션에 포착되지 않은 많은 요인에 따라 달라질 수 있습니다. 저희는 빠른 API 속도에서 지연 시간을 시뮬레이션하며, 일반적인 API 가격을 기준으로 비용을 시뮬레이션합니다.
모든 모델은 5개의 시드 (seeds)와 추론 연속성 (reasoning continuity)을 사용하여 ExploitBench API 하네스 (harness)를 통해 평가됩니다.
저희는 공개 API보다 응답이 더 빠른 알파 (alpha) API에서 ExploitGym을 실행한 다음, 공개 API에 맞게 크기를 재조정 (rescale)했습니다. 지연 시간을 공개 API에서 예상되는 속도로 재조정할 때, 평가 실행 시에는 규정을 올바르게 준수했음에도 불구하고 일부 추정 지연 시간이 2시간 및 6시간 시간 제한을 초과하게 됩니다. 시간에 민감한 작업을 위해 더 빠른 속도를 원하신다면, API의 우선순위 처리 (priority processing)와 Codex의 패스트 모드 (fast mode)를 제공합니다.
보고된 출력 토큰 (output tokens), 지연 시간 또는 비용이 없는 모델은 수평 점선으로 표시됩니다.

GPT-5.6 Sol 미리보기: 차세대 모델

요약

핵심 포인트

댓글