본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 15. 14:18

Anthropic이 첫 Mythos급 모델 「Claude Fable 5」를 일반 공개 — “역대 최강”, 단 사이버 능력은 봉인

요약

Anthropic이 역대 최강 성능을 가진 Mythos급 모델 'Claude Fable 5'를 일반 공개했습니다. 강력한 성능에도 불구하고 사이버 보안 관련 작업은 가드레일을 통해 엄격히 봉인된 것이 특징입니다.

핵심 포인트

  • Anthropic의 첫 Mythos급 모델 Claude Fable 5 일반 공개
  • 사이버 보안 관련 작업 수행을 차단하는 강력한 가드레일 적용
  • 안전성을 위한 과도한 제한이 연구 용도까지 방해한다는 비판 존재
  • Opus 4.8 대비 높은 API 요금 책정

본 기사는 필자가 운영하는 AI Quotidia (ai.quotidia.jp)의 해외 뉴스 해설 기사입니다.

Anthropic은 2026년 6월 9일, 첫 Mythos급 AI 모델 「Claude Fable 5」를 일반 공개했습니다——동사가 "지금까지 널리 제공한 것 중 가장 강력하다"라고 하는 한편, 사이버 보안 (Cybersecurity) 작업은 실행할 수 없도록 봉인되어 있습니다 (출처: The Verge / Bloomberg, 2026-06-09). 게다가 이 공개는 동사 스스로가 "AI는 너무 위험해지고 있다"라고 경고한 지 불과 며칠 뒤의 일이었습니다 (출처: TechCrunch, 2026-06-09). 본 기사는 2026년 6월 시점의 보도에 기반하여, 이 "최강"과 "봉인"의 공존을 함께 풀어서 설명해 보겠습니다.

  • Anthropic이 2026년 6월 9일, 신규 AI 모델 「Claude Fable 5」를 일반 공개했다 (출처: The Verge, 2026-06-09)
  • 동사가 "지금까지 널리 제공한 것 중 가장 강력하다"라고 규정하는, 일반이 사용할 수 있는 첫 Mythos급 모델 (출처: The Verge / TechCrunch, 2026-06-09)
  • 사이버 보안 (Cybersecurity) 작업은 실행할 수 없도록 차단되어 있다 (출처: Bloomberg, 2026-06-09)
  • 공개 며칠 전, 동사는 "AI는 너무 위험해지고 있다"라고 경고했었다 (출처: TechCrunch, 2026-06-09)
  • Bloomberg, TechCrunch, The Verge 등 미국의 주요 3개 매체가 같은 날 일제히 보도

Mythos란, Anthropic이 소프트웨어의 취약점 발견 등의 고도화된 태스크 (Task)에 투입해 온 동사의 최상위급 AI 모델 계통이다. Quotidia의 기존 보도와 같이, Mythos는 제로데이 취약점 (Zero-day vulnerability, 수정 패치가 존재하지 않는 미지의 결함)을 수천 건 발견하였으며, 단계적 전개 프로그램인 「Project Glasswing」에서는 초기 1개월 만에 1만 건 이상의 취약점을 찾아냈다고 보도되었습니다. 즉, 사이버 영역에서 실제로 결과를 내어온 계통입니다.

그리고 가드레일 (Guardrail)이란, AI 모델이 위험하거나 부적절한 출력 또는 조작을 하지 않도록 설계 단계에서 내장되는 이용 제한을 말한다. 이번 Claude Fable 5는 이 가드레일을 강력하게 적용한 상태로 일반에 개방되었다는 구도가 됩니다.

이번 공개의 최대 특징은 성능의 높음 그 자체가 아니라, 가장 강력한 능력의 일부를 미리 봉인한 상태로 "널리 배포하기로" 결정했다는 점에 있습니다.

Mythos (기존)Claude Fable 5 (이번)
제공 범위일반에 개방되지 않음
......

TechCrunch (2026-06-09)는 이 공개가 "AI는 너무 위험해지고 있다"라는 동사 자신의 경고가 나온 지 며칠 지나지 않았음을 지적하고 있습니다. 위험성을 가장 잘 아는 개발원이 능력의 덮개 설계 또한 스스로 수행했다——그런 구도입니다.

다만, 덮개를 닫는 방식에 대해서는 벌써 이견이 나오고 있습니다.

TechCrunch (2026-06-10)에 따르면, 보안 연구자들은 "Fable의 가드레일은 방어 목적의 연구조차 사용할 수 없을 정도로 엄격하다"라며 불만을 표명하고 있습니다. 나아가 The Verge (2026-06-10)는 Claude Fable 5가 기본적인 생물학 질문에조차 답하지 않는 사례를 보도했습니다. 안전을 위한 제한이 정당한 용도까지 휘말리게 하고 있는 것이 아닌가——라는 논점입니다.

TechCrunch (2026-06-09)에 따르면, API 요금은 100만 입력 토큰 (Token)당 10달러, 100만 출력 토큰당 50달러 (Opus 4.8의 2배)이며, API와 종량제 Enterprise 버전은 당일 제공, 구독형(Subscription) 대상은 단계적 전개를 통해 2026년 6월 22일까지 추가 비용 없이 제공된다고 합니다. 한편, 일본어 대응 및 일본향 제공 조건은 본고 시점의 보도에서는 확인되지 않았습니다. 따라서 "일본에서도 즉시 최강 모델을 사용할 수 있다"라고 단정할 수는 없습니다.

그럼에도 불구하고, 일본의 이용자 및 기업에게 중요한 것은 "무엇을 할 수 있는가"뿐만 아니라 "무엇이 의도적으로 제한되어 있는가"가 모델 선택의 사양 항목이 되었다는 변화입니다. 생성형 AI의 업무 도입이 진행 중인 일본에서도 보안 조사나 연구 개발과 같은 정당한 용도가 제한에 걸리는 상황이 향후 늘어날 가능성이 있으며, 도입 검증 시에 "제한 사양"을 확인하는 습관이 이전보다 더욱 의미를 갖게 될 것입니다.

Q. Claude Fable 5는 누구나 사용할 수 있나요?

A. Anthropic이 「널리 제공되는 (widely available)」 첫 Mythos급 모델을 출시했다고 보도되었습니다 (출처: The Verge, 2026-06-09). API와 종량제 Enterprise 버전은 즉시 제공되며, 구독형(Subscription) 모델은 단계적으로 배포될 예정입니다 (출처: TechCrunch, 2026-06-09). 일본어 지원 및 일본 대상 제공 조건은 보도 시점 기준으로 확인되지 않았습니다.

Q. Mythos와 Claude Fable 5의 차이점은 무엇인가요?

A. Fable 5는 Mythos급의 능력을 갖추고 있으면서도, 사이버 보안 (Cybersecurity) 작업을 수행할 수 없도록 차단된 일반 공개 버전입니다 (출처: Bloomberg, 2026-06-09).

Q. 왜 사이버 능력을 봉인했나요?

A. 해당 기업은 공개 며칠 전 "AI가 너무 위험해지고 있다"라고 경고했으며 (출처: TechCrunch, 2026-06-09), Anthropic은 고객들이 빠르게 혜택을 누릴 수 있도록 의도적으로 방어적인 측면에 치우친 설계를 채택했다고 설명하며, 오탐지 (False Positive) 감소를 위해 노력하고 있다고 밝혔습니다 (출처: The Verge, 2026-06-10).

Q. 가드레일 (Guardrails)에 문제는 없나요?

A. 보안 연구자들로부터 "연구용으로조차 사용할 수 없을 만큼 엄격하다"라는 불만이 나오고 있으며 (출처: TechCrunch, 2026-06-10), 기본적인 생물학 질문에 답변하지 않는 사례도 보도되었습니다 (출처: The Verge, 2026-06-10).

이 기사는 AI Quotidia에서 전재하였습니다.

문호 모드 (정경 묘사와 비유로 읽기) · 속보 모드 (30초 만에 읽기)도 사이트에서 읽을 수 있습니다.

👉 https://ai.quotidia.jp?utm_source=qiita&utm_medium=referral

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0