Fable 5가 다시 탈옥되었습니다

연구원 Vitto Rivabella는 Fable 5의 방어 체계를 테스트했으며 우회(bypass) 방법을 찾아내는 데 성공했습니다.

그에 따르면, 대부분의 시도는 실패했습니다. 보호 체계는 다층적(multi-layered)입니다. 모델은 프롬프트(prompt), 대화 기록(conversation history), 시스템 컨텍스트(system context), 그리고 모델 자신의 응답을 검사합니다.

일부 필터는 생성(generation) 중에 실행되며 답변을 중간에 중단시킬 수 있습니다.

이 검사들은 키워드(keywords)를 기반으로 하지 않습니다. 시스템은 의미(meaning), 의도(intent), 언어(language), 어구(wording), 그리고 의심스러운 요청 체인(suspicious chains of requests)을 살펴봅니다.

우회(bypass)에는 약 20시간이 소요되었습니다. 희귀 언어, 학술적 프레임워크(academic framing), 긴 빌드업(long build-ups), 유니코드(Unicode), 작업을 부분으로 나누기, 그리고 사고의 사슬(chain of thought)을 활용하는 과정이 필요했습니다.

저자는 긴 작업에 대해 안정적인 우회(bypass)를 얻지는 못했습니다. 그의 말에 따르면, 일반적인 검색이 더 빠르고 저렴합니다.

Insights

Fable 5가 다시 탈옥되었습니다

요약

핵심 포인트

댓글

사모펀드가 프랜차이즈에 수십억 달러를 쏟아붓고 있다. 많은 이들이 값비싼 사각지대를 발견하고 있다.

트럼프 관세 공포로 인해 소매업체들의 재고 확보 경쟁이 치열해지며 중국발 연말 연휴 물동량 조기 급증: 보고서

칩메이커 약세와 미국 물가 압력 완화로 인한 혼조세 양상의 주식 시장

FedEx, 공급망 부문을 CMA CGM에 14억 달러에 매각

트럼프 관세 공포로 인해 소매업체들의 재고 확보 경쟁이 치열해지며 중국발 연말 연휴 물동량 조기 급증: 보고서

칩메이커 약세와 미국 물가 압력 완화로 인한 혼조세 양상의 주식 시장

FedEx, 공급망 부문을 CMA CGM에 14억 달러에 매각