Anthropic, AI/ML을 위한 무언의 성능 저하(Silent Nerfing) 정책 철회 및 사용자 통지 예정
요약
Anthropic이 AI 모델 성능을 의도적으로 낮추는 'Silent Nerfing' 정책에 대해 사과하며, 향후 안전장치 작동 시 사용자에게 이를 투명하게 통지하겠다고 밝혔습니다.
핵심 포인트
- Anthropic, AI 성능 저하 정책에 대한 사과 및 방향 수정 발표
- 안전장치(Safeguards) 작동 시 사용자에게 재라우팅 사실 통지 예정
- AI 개발을 위한 모델 성능 트레이드오프 문제 해결 시도
Wired 발췌:
“우리는 프론티어 LLM (Frontier LLM) 개발을 위한 Fable 5의 안전장치(Safeguards)를 가시화하도록 변경하고 있습니다.”라고 Anthropic은 WIRED에 보낸 성명에서 밝혔습니다. “우리는 잘못된 트레이드오프 (Tradeoff)를 했으며, 균형을 제대로 맞추지 못한 점에 대해 사과드립니다.”
Anthropic은 이제 방향을 수정하고 있으며, AI 개발을 위한 Claude Fable 5의 안전장치(Safeguards)를 사용자에게 공개할 것이라고 밝혔습니다. 만약 회사가 사용자가 매우 유능한 AI를 구축하기 위해 Claude를 사용하려 한다고 의심할 경우, 요청을 거부하거나 사용자를 성능이 낮은 모델로 재라우팅 (Rerouting)하고 있음을 사용자에게 알릴 것입니다.
전체 기사: https://www.wired.com/story/anthropic-responds-to-backlash-on-claudes-secret-sabotage-on-ai-research/
/u/goldcakes 에 의해 r/MachineLearning 에 제출됨
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기