속보: OpenAI의 새로운 GPT-5.5-Cyber, CyberGym에서 Mythos 5를 능가하는 점수 기록
요약
OpenAI의 새로운 모델인 GPT-5.5-Cyber가 소프트웨어 취약점 재현 능력을 평가하는 CyberGym 벤치마크에서 Mythos 5를 능가하는 성적을 거두었습니다.
핵심 포인트
- GPT-5.5-Cyber 모델의 새로운 성능 공개
- CyberGym 벤치마크에서 Mythos 5보다 높은 점수 기록
- AI 에이전트의 소프트웨어 취약점 재현 능력 입증
속보🚨
OpenAI의 새로운 GPT-5.5-Cyber가 AI 에이전트가 실제 소프트웨어 취약점 (software vulnerabilities)을 재현할 수 있는지 테스트하는 벤치마크인 CyberGym에서 Mythos 5보다 높은 점수를 기록했습니다.🔎
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Benchmark의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기