생각보다 더 놀라운 결과: Fable-5가 Remote Labor Index에서 16.10%를 기록했습니다

생각보다 더 놀라운 결과입니다: Fable-5가 이제 Remote Labor Index (RLI)에서 16.10%의 점수를 기록했습니다.

RLI란 무엇일까요? Remote Labor Index (RLI)는 전문 프리랜서들의 실제 원격 근무 프로젝트 240개를 사용하며, 23개의 도메인과 140,000달러 이상의 인적 노동을 포괄합니다. 각 작업에는 실제 브리프 (brief), 파일, 그리고 승인된 인간의 결과물이 포함됩니다.

그 후 검토자들은 AI의 출력물을 인간의 참조 모델과 비교하여, 합리적인 클라이언트가 이를 수용할지 여부를 판단합니다.

이것이 점수가 여전히 낮은 이유입니다. 전체 프로젝트에는 계획 수립, 파일 처리, 품질 관리 (quality control), 시각적 일관성 (visual consistency), 도메인 판단, 그리고 최종 패키징이 필요합니다.

Fable-5는 현재 16.10%로 공개 리더보드 (public leaderboard) 1위를 달리고 있습니다.

그리고 이는 엄청난 도약입니다. 우리는 여전히 기하급수적인 발전 단계의 깊은 곳에 있으며, 이제 가장 까다로운 벤치마크 (benchmarks)들조차 해결되고 있습니다.
[IMG:1]

Insights

생각보다 더 놀라운 결과: Fable-5가 Remote Labor Index에서 16.10%를 기록했습니다

요약

핵심 포인트

댓글

일본이 이민 대신 로봇을 택했다 — 1000만 대 국가 전략 공식화

같은 GPU를 두고 메타는 +10%, CoreWeave와 Nebius는 -15%가 났다. 이 갈림이 AI 인프라판의 다음 챕터다.

유타 사막에서 소형 원자로가 엔비디아 블랙웰에 직접 전기를 꽂았다. 소형로가 데이터센터를 돌린 건 이번이 처음이다.

네이버가 제 손으로 검색창을 지우기 시작했다 — AI 쇼핑 에이전트 정식 전환

일본이 이민 대신 로봇을 택했다 — 1000만 대 국가 전략 공식화

같은 GPU를 두고 메타는 +10%, CoreWeave와 Nebius는 -15%가 났다. 이 갈림이 AI 인프라판의 다음 챕터다.

유타 사막에서 소형 원자로가 엔비디아 블랙웰에 직접 전기를 꽂았다. 소형로가 데이터센터를 돌린 건 이번이 처음이다.

네이버가 제 손으로 검색창을 지우기 시작했다 — AI 쇼핑 에이전트 정식 전환