Claude Fable이 돌아왔습니다!
요약
Anthropic이 미국 정부의 결정에 따라 Claude Fable 5와 Mythos 5에 대한 사용 제한을 해제했습니다. 사이버 보안 연구 과정에서 발견된 안전 장치 우회 문제를 해결하기 위해 새로운 안전 분류기를 도입했습니다.
핵심 포인트
- Claude Fable 5 및 Mythos 5의 사용 제한 해제
- 사이버 보안 우회 방지를 위한 새로운 안전 분류기 추가
- 7월 7일 이후 API를 통한 접근 가능 예정
- AI 탈옥 평가를 위한 공통 표준 준비 중
Claude Fable이 돌아왔습니다!
Anthropic은 미국 정부의 결정에 따라 Claude Fable 5와 Mythos 5에 대한 제한을 해제했습니다.
Fable은 오늘부터 Claude 사용자들에게 다시 제공될 예정입니다.
7월 7일까지 이 모델은 주간 제한(weekly limits)에 포함됩니다. 그 이후에는 API를 통해 접근할 수 있게 됩니다.
이번 제한은 Amazon의 보고서 이후 시작되었습니다. 연구원들이 사이버 보안 작업에서 Fable의 안전 장치(safeguards)를 우회하는 방법을 발견했기 때문입니다.
Anthropic은 이러한 우회가 Mythos 수준의 능력을 해제하지는 않았다고 밝혔습니다. 회사는 이미 이러한 방식을 99% 이상의 사례에서 차단하는 새로운 안전 분류기(safety classifier)를 추가했습니다.
Anthropic은 또한 AI 탈옥(jailbreaks)을 평가하기 위한 공통 표준을 준비하고 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기