Claude Fable 5가 내일부터 전 세계적으로 다시 제공됩니다.
요약
Claude Fable 5가 사이버 보안 차단을 위한 새로운 분류기 적용과 함께 전 세계에 재배포됩니다. 코딩 및 디버깅 작업은 일시적으로 Opus 4.8로 전환되며, 향후 오탐을 줄이기 위한 지속적인 개선이 이루어질 예정입니다.
핵심 포인트
- Claude Fable 5의 전 세계 재배포 및 새로운 보안 분류기 적용
- 코딩 및 디버깅 작업은 단기적으로 Opus 4.8로 전환
- AI 탈옥 대응을 위한 업계 파트너사와의 합의 프레임워크 마련
- 미국 정부와 모델 안전장치 및 테스트 관련 협력 확대
Claude Fable 5가 내일부터 전 세계적으로 다시 제공될 예정입니다.
미국 정부와 일련의 생산적인 대화를 거친 후, 우리는 더 많은 사이버 보안 (cybersecurity) 작업을 타겟팅하고 차단하기 위한 새로운 분류기 (classifiers) 세트를 적용하여 모델을 재배포하고 있습니다. 단기적으로는 코딩 (coding) 및 디버깅 (debugging)과 같은 일부 일상적인 작업은 Opus 4.8로 전환됩니다. 우리는 향후 몇 주 동안 이러한 분류기를 지속적으로 개선하여 오탐 (false positives)을 줄이고, 실제 오용과 정당한 요청을 더 잘 구별할 수 있도록 할 것입니다.
또한 우리는 AI 탈옥 (jailbreaks)의 심각성을 평가하고 AI 개발자가 이에 어떻게 대응해야 하는지에 대한 합의 프레임워크 (consensus framework)를 마련하기 시작했습니다. 이 작업은 Amazon, Microsoft, Google 및 기타 Glasswing 파트너들과 함께 진행됩니다. 우리는 다른 업계 파트너와 모델 제공업체들이 이 노력에 동참하기를 권장합니다.
마지막으로, 우리는 모델 테스트 및 안전장치 (safeguards)와 관련하여 미국 정부와의 협력을 확대하고 있습니다. 여기에는 평가를 위한 모델 및 안전장치에 대한 출시 전 접근 권한, 탈옥 및 오용에 대한 정보 공유, 공동 연구를 위한 전용 리소스가 포함됩니다.
기다려 주신 사용자 여러분과 Fable 5를 다시 사용할 수 있도록 우리와 함께 노력해 주신 정부, 산업계 및 연구 커뮤니티 전반의 파트너분들께 감사드립니다.
전체 블로그 읽기: https://t.co/VHyum831ri
AI 자동 생성 콘텐츠
본 콘텐츠는 X @AnthropicAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기