OpenAI Daybreak란 무엇인가: 3계층의 '권한 부여된 AI'로 취약점을 사냥하는 메커니즘

AI가 코드를 작성하는 속도가 빨라질수록, 간과되는 결함도 같은 속도로 늘어난다. 조사 기관은 AI가 생성한 소프트웨어의 결함이 2028년까지 크게 불어날 것이라고 경고한다. 그렇다면 결함을 찾는 쪽도 AI로 만들면 된다——OpenAI가 2026년 5월에 공개한 「OpenAI Daybreak」는 그 발상을 형상화한 AI 사이버 보안(AI Cybersecurity) 프로젝트다. 이것은 'AI를 보호하는' 이야기가 아니라 'AI에게 취약점을 찾게 만드는' 측면의 AI 보안이라고 먼저 짚고 넘어가야 한다. 그리고 정말로 새로운 점은 검출 정밀도가 아니라, 하나의 모델을 지능이 아닌 '부여된 허가(Permission)'로 3계층으로 나눈 설계에 있다.

먼저 등장하는 이름 3가지만 정리해 두자. 중첩 구조인지 병렬 구조인지에 따라 처음에 혼동하기 쉽기 때문이다.

Daybreak=우산. 취약점을 AI가 탐색하고, 검증하며, 수정안까지 제시하게 하는 프로젝트 전체의 총칭.
Codex Security=실행역. 리포지토리(Repository)를 읽어 취약점을 실제로 찾는 '에이전트 실행 기반(AI에게 일련의 작업 절차를 맡기는 토대)'. 2026년 3월부터 공개되었으며, Daybreak보다 먼저 작동하고 있었다.
GPT-5.5의 3계층=두뇌. 취약성을 판단하는 모델로, 후술할 내용과 같이 '허가'에 따라 3개의 층으로 나뉜다.

즉, Daybreak라는 우산 아래에 기존의 실행역(Codex Security)과 두뇌(GPT-5.5 계열)가 포함되어 있다. 'Codex Security가 중심이다'라는 말과 '3계층이 새롭다'는 말은 모순되지 않는다. 전자는 '작동하는 메커니즘'에 대한 이야기이고, 후자는 '무엇이 신규인가'에 대한 이야기로, 가리키는 대상이 다르기 때문이다. 우산 안에서 정말로 새로운 것은 두뇌를 3계층으로 나눈 권한 설계(Permission Design) 쪽이다.

실행역인 Codex Security는 3단계로 작동한다. 먼저 Discovery(발견) 단계에서 대상 리포지토리를 읽어 들여, 해당 코드 고유의 문맥(Context)에 비추어 취약점을 찾아낸다. 일반적인 패턴을 대조하는 것이 아니라, 리포지토리 고유의 문맥으로 살피는 것이 특징이다. 다음 Validation(검증) 단계에서는 신뢰도가 높은 문제만을 격리 환경(본 운영 환경과 분리된 검증 전용 환경)에서 실제로 재현하여, 진짜인지 확인한 후에 공개한다. 마지막 Remediation(수정) 단계는 GitHub 상에서 리뷰할 수 있는 수정안을 제시하는 것에 그친다. AI가 마음대로 운영 코드를 고치는 것이 아니라, 근거가 포함된 초안 패치(Draft Patch)를 내놓을 뿐이라는 설계다.

이것이 탁상공론이 아님은 숫자가 보여준다. OpenAI의 발표에 따르면, 베타 기간 동안 약 120만 개의 커밋(Commit)을 정밀 조사하여 치명적 결함 792건, 높음 단계 10,561건을 검출했으며, 그중 14건은 CVE(Common Vulnerabilities and Exposures, 공통 취약점 식별자)로 등록되었다. 노이즈를 약 84%, 오탐률(False Positive Rate)을 50% 이상 낮췄다고 한다. 여기서 핵심은 단 하나다——중대한 결함을 사람의 리뷰를 전제로 대량으로 걸러낼 수 있었다는 점이다. 다만 이 수치들은 모두 자사 발표 값이며, 제3자 검증은 앞으로 이루어질 것이라는 전제하에 읽어야 한다.

Daybreak의 최대 혁신은 동일한 GPT-5.5를 능력에 따라 나누지 않고, '무엇을 해도 되는가(허가)'에 따라 3계층으로 분리했다는 점이다. 차이점은 표로 보면 빠르다.

계층	명칭	대상	할 수 있는 일
Tier 1	GPT-5.5 (표준)	전원	특별한 권한이 없는 일반 이용
...

모든 계층에 공통적으로 인증 정보 탈취, 흔적 은닉, 허가 없는 공격은 금지되어 있다. Tier 2를 여는 열쇠가 「Trusted Access for Cyber」이며, 이것이 신원 확인 제도의 명칭에 해당한다.

흥미로운 점은 Tier 3의 정체다. 이름만 들으면 '공격에 강한 특별 모델'을 상상하기 쉽지만, OpenAI의 설명에 따르면 GPT-5.5-Cyber는 능력 그 자체를 크게 끌어올린 것이 아니다. 목표는 보안 작업에 대해 보다 허용적으로 행동하게 만드는 것——즉, '똑똑하게 만든 것'이 아니라 '허가의 범위를 넓힌' 모델이다. AI에 대한 관심이 '얼마나 똑똑한가'에서 '무엇을 하게 하고, 무엇을 하지 못하게 할 것인가'로 옮겨가고 있음을 보여주는 사례라고 할 수 있다.

실력은 외부에서도 검증되고 있다. 상징적인 숫자 하나를 들자면, 단발적인 취약점 과제에서 인간 전문가라면 약 12시간이 걸릴 작업을 GPT-5.5는 약 10분 22초, 1.73달러로 해결한 사례가 보고되었다.

기반은 영국 AI Safety Institute(UK AISI)의 평가다. 95개의 평가 항목 중 전문가급 태스크에서 GPT-5.5는 71.4%(±8.0%)를 기록했으며, AISI는 "지금까지 시도한 것 중 가장 강력한 모델일지도 모른다"고 결론지었다. 다만 만능은 아니다. 32단계에 이르는 기업 네트워크 침투 모의 시험에서는 10회 중 2회밖에 완수하지 못했으며, 산업 제어 시스템 관련 과제는 모든 모델이 달성하지 못했다. 단발적인 과제에서는 인간을 크게 앞지르지만, 다단계 실전 태스크에서는 아직 놓치는 부분이 있다. 즉, 강력한 수치와 약한 수치를 나란히 놓고 읽는 것이 정확하다.

이 "권한 부여된 AI"는 추상론이 아니라 파일로 명시할 수 있다. 3계층 모델 본체의 권한 제어는 OpenAI의 관리하에 있어 비공개이지만, 그 하층에 해당하는 Codex CLI/Enterprise의 관리 정책은 공식 문서로 공개되어 있다. 발췌본을 통해 분위기를 살펴보자.

# Codex CLI / Codex Enterprise 관리 정책 (발췌·개념용)
# 핵심 개념: AI 에이전트에게 "무엇을·어디까지 허용할 것인가"를 파일로 선언함
# 승인 정책: 위험한 조작 전에 인간의 승인을 거칠 것인가 (untrusted / on-request / never)
...

확인할 수 있는 점은 "권한 부여된 AI"가 승인 방식(approval_policy), 쓰기 범위(sandbox_mode), 사용 가능한 기능의 온/오프([features]), 통신 대상 허가 목록(experimental_network)과 같은 구체적인 설정 항목에 대응하고 있다는 것이다. 참고로 이 TOML은 Codex CLI/Enterprise 측의 설정이며, 3계층 모델 자체의 권한 정의는 아니다 (정확한 키 이름은 공식 설정 문서를 참조할 것). 이 역할은 "'권한을 입도(granularity)별로 나눈다'는 동일한 사고방식이 하층 설정에도 일관되게 나타나 있다는 증거"로 이해하면 된다.

이 부분은 Daybreak를 사용할 수 없는 사람들에게도 유효한 시사점이다. 자신이 구축할 AI 에이전트나 CI(지속적 통합)에서 어떤 명령을 허용할지, 어디에서 인간의 승인을 거칠지, 어떤 도메인으로의 통신을 차단할지——"권한의 경계를 어디에 그을 것인가"라는 질문은 한정 프리뷰 신청 가능 여부와 관계없이 내일의 설계와 직결된다.

현장에서 가장 두터운 실례는 에지 CDN 대기업인 Cloudflare다. 이 회사는 자사의 방화벽에 모이는 통신 데이터(telemetry)를 Daybreak의 스코어링에 공급하여, "어떤 취약점이 악용되기 쉬운가"에 대한 추정을 강화하고 있다. 방어의 최전선에서 수집한 로우 데이터(raw data)를 AI의 판단 재료로 흘려넣는 방식이다. 해당 회사의 CTO인 Dane Knecht는 추론과 에이전트 실행의 조합이 산업의 중요한 진전이라고 언급했다.

그 외에도 Akamai, Cisco, CrowdStrike, Palo Alto Networks 등이 공식 파트너로 이름을 올리고 있으나, 이는 현재로서는 사명이 언급된 단계다. 놓쳐서는 안 될 것은 동일한 문제를 역방향으로 푸는 진영인 Anthropic의 Project Glasswing(글래스윙)이다. 강력한 모델인 "Claude Mythos"를 제한적으로만 공개하는 방향으로 취약점 발견에 임하고 있어, 신청제로 권한을 여는 Daybreak와는 대조적이다. 다만 위기감은 동일하여, Anthropic은 "이러한 종류의 모델 악용을 완전히 방지할 수 있는 안전책을 자사를 포함해 어떤 기업도 아직 확립하지 못했다"고 명언했다. 게다가 Cisco, CrowdStrike, Palo Alto Networks는 두 진영 모두에 이름을 올리고 있어, 업계 전체가 이 영역에 집중하고 있음을 알 수 있다.

Daybreak의 핵심은 새로운 모델 그 자체보다 "동일한 모델을 허가 레벨에 따라 3계층으로 나눈다"는 설계에 있다. 취약점을 사냥한다는 화려한 응용 이면에서 일어나고 있는 것은, AI에 대한 질문이 "얼마나 똑똑한가"에서 "무엇을 하게 하고, 무엇을 하지 않게 할 것인가"로 옮겨가는 변화다. 다음에 중요해질 AI 보안의 핵심은 똑똑함의 비교보다는 "어디에 권한의 경계를 그을 것인가"가 될 것이다. 당신의 시스템에서 AI에게 넘겨주어도 좋은 '허가'는 어디까지인가?

OpenAI Codex Security 공식 문서 - Codex Security
OpenAI 공식 'Daybreak' 페이지 - Daybreak | OpenAI for cybersecurity
OpenAI 공식 발표 'GPT-5.5 with Trusted Access for Cyber' - GPT-5.5 및 GPT-5.5-Cyber를 이용한 사이버 분야 신뢰 접근성 확장
OpenAI Codex Security 리서치 프리뷰 발표 - Codex Security, 이제 리서치 프리뷰에 진입
OpenAI Codex 설정 문서(고급 구성) - Codex Advanced Configuration
OpenAI Codex Enterprise 설정 - Codex Enterprise Setup
MarkTechPost - OpenAI가 Daybreak를 소개하다
The Hacker News (Codex Security 베타 실적) - OpenAI Codex Security, 120만 개 커밋 스캔
The Hacker News (Daybreak 출시) - AI 기반 취약점 탐지를 위해 OpenAI가 Daybreak를 출시하다
UK AI Safety Institute 공식 평가 - OpenAI의 GPT-5.5 사이버 역량에 대한 우리의 평가
Help Net Security - OpenAI, 더 허용적인 보안 워크플로우를 위해 GPT-5.5-Cyber를 조정하다
Kingy AI - OpenAI Daybreak 설명
NeuralTrust - OpenAI Daybreak 분석
MindFort - 사이버 보안을 위한 GPT-5.5는 얼마나 좋을까
testingcatalog - OpenAI가 Codex Security 주변의 Daybreak 이니셔티브 발표
Anthropic - Project Glasswing
Anthropic - Project Glasswing: 초기 업데이트
Netwoven - AI 사이버 보안: Mythos와 Daybreak
CIO Dive - OpenAI Daybreak와 사이버 위협
Infosecurity Magazine - OpenAI Daybreak, 설계 단계부터 안전하게

OpenAI Daybreak란 무엇인가: 3계층의 '권한 부여된 AI'로 취약점을 사냥하는 메커니즘

요약

핵심 포인트

댓글