AI가 16.1%에 도달하다: Remote Labor Index는 Claude Fable 5가 이제 실제 원격 업무를 수행할 수 있음을 보여준다
요약
Center for AI Safety와 Scale AI Labs가 발표한 Remote Labor Index(RLI)에 따르면, Claude Fable 5가 실제 원격 업무의 16.1%를 완전 자동화하며 역대 최고치를 기록했습니다. 이는 AI가 단순 보조를 넘어 지식 노동의 상당 부분을 직접 대체할 수 있는 단계에 진입했음을 시사합니다.
핵심 포인트
- Claude Fable 5가 RLI에서 16.1%의 완전 자동화율을 기록하며 1위를 차지함
- RLI는 객관식 테스트가 아닌 실제 프리랜서 프로젝트의 완결성을 측정하는 지표임
- 단 한 세대 만에 자동화율이 두 배로 증가하며 기술 발전 속도가 가속화됨
- SQL 작성, 슬라이드 제작, 계약서 초안 작성 등 전문 지식 노동의 자동화 가능성 확인
어제, Center for AI Safety (CAIS)와 Scale AI Labs는 업데이트된 **Remote Labor Index (RLI)**를 발표했습니다. 이는 우리가 지난 몇 달간 목격한 AI 자동화 벤치마크 중 가장 중요한 지표입니다.
처음으로 프런티어 모델 (Frontier Model)이 실제 유료 원격 업무 프로젝트에서 **16%의 완전 자동화 (Full Automation)**를 돌파했습니다. 여러분이 알아야 할 내용은 다음과 같습니다.
Remote Labor Index란 무엇인가?
RLI는 또 다른 객관식 테스트나 코딩 경진대회 리더보드가 아닙니다. 이는 AI 에이전트가 실제 프리랜서 프로젝트를 전문적인 수준에서 — 처음부터 끝까지(end to end) — 완료할 수 있는지를 측정합니다. 우리는 Upwork 스타일의 실제 작업들, 즉 데이터 입력, 그래픽 디자인, 카피라이팅 (Copywriting), Excel 모델링, 고객 지원 티켓, 그리고 소프트웨어 개발에 대해 이야기하고 있습니다.
최신 라운드에서는 23개의 서로 다른 업무 영역에 걸쳐 240개의 프로젝트를 평가했으며, 전문 인간 검토자들이 각 결과물이 비용을 지불할 만큼 충분히 좋은지를 점수 매겼습니다.
중요한 수치들
| 모델 | 완전 자동화율 |
|---|---|
| Claude Fable 5 | 16.1% 🏆 |
| ... |
테스트된 모든 모델이 이전에 평가된 모든 모델보다 높은 점수를 기록했습니다. 추세가 빠르게 가속화되고 있습니다. 하지만 Fable 5의 결과는 독보적입니다. 이는 차점자인 공개 모델보다 약 두 배에 달하는 수치입니다.
이것이 실제로 의미하는 바
16%라는 수치가 엄청나게 크게 들리지 않을 수도 있지만, 맥락이 중요합니다. 이전 RLI 선두 모델은 10% 미만이었습니다. 단 한 세대 만에 두 배로 증가한 것은 진정한 도약입니다. 이 속도를 추정해 보면, 프런티어 모델들은 1218개월 이내에 3050%의 완전 자동화에 도달할 수 있음을 시사합니다.
개발자와 기업들에게 주는 시사점은 명확합니다: AI는 이제 원격 지식 노동의 무시할 수 없는 부분을 대체할 수 있습니다. 보조하는 것이 아니라 — 완전히 — 대체하는 것입니다.
다음과 같은 작업들이:
- 자연어 설명을 기반으로 프로덕션급 SQL 쿼리 작성하기
- 투자자 미팅을 위한 슬라이드 덱 제작하기
- 불렛 포인트(Bullet points)로부터 법률 계약서 초안 작성하기
- 단일 프롬프트로부터 간단한 웹 앱 구축하기
...이제 실제 세계 프로젝트의 상당 부분에서 "AI가 이를 완전히 수행할 수 있음" 범주에 들어와 있습니다.
더 큰 그림
이것은 단지 Claude의 이정표가 아닙니다. RLI는 **모델 불가지론적 벤치마크 (model-agnostic benchmark)**이며, 이는 전체 프런티어 (frontier)가 이동하고 있음을 우리에게 말해주고 있습니다. Opus 4.8과 GPT-5.5 또한 이전에는 어떤 모델도 도달하지 못했던 임계값 (thresholds)을 넘어섰습니다. 경쟁이 모든 연구소 (labs)를 상향 평준화시키고 있습니다.
이제 질문은 AI가 지식 노동 (knowledge work)을 자동화할 것인가 _아닌가_가 아니라, 얼마나 빨리 할 것인가입니다.
원시 데이터 (raw data)를 자세히 살펴보고 싶으신가요? CAIS 블로그 포스트와 RLI 리더보드 (leaderboard)를 확인해 보세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기