Anthropic이 2025년 10월에 공개한 정렬 평가 도구 Petri를 Meridian Labs에 양도
요약
Anthropic이 개발한 정렬 평가 도구인 'Petri'가 Meridian Labs로 양도되었습니다. 이 도구는 LLM의 기만, 종속 행동, 악용 시나리오 등을 테스트하여 모델의 안전성과 신뢰성을 검증하는 데 사용됩니다. Anthropic에서 독립됨으로써 결과의 중립성과 객관성이 더욱 확보될 것으로 기대됩니다.
핵심 포인트
- Anthropic이 개발한 정렬 평가 도구 'Petri'가 Meridian Labs로 공식 양도되었다.
- Petri는 LLM의 기만(deception), 종속 행동, 악용 등의 안전성 문제를 테스트하는 데 특화되어 있다.
- 도구가 독립적인 연구소(Meridian Labs)로 이전함으로써 평가 결과의 중립성과 신뢰성이 강화된다.
Anthropic이 2025년 10월에 공개한 정렬 평가 도구 Petri를 Meridian Labs에 양도
Petri는 LLM의 기만이나 종속 행동, 악용에 대한 협력 등의 우려 사항을 테스트할 수 있는 도구입니다. MCP의 양도와 마찬가지로, AI 연구소로부터 독립시킴으로써 결과의 중립성과 신뢰성을 보장합니다.
譲渡先の Meridian Labs による Petri 3.0 の解説記事
https://
meridianlabs.ai/blog/posts/int
roducing-petri-3/
…
AI 자동 생성 콘텐츠
본 콘텐츠는 X Claude/Anthropic의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기