세상에, Anthropic이 재귀적 자기 개선 (Recursive Self-improvement)에 매우 진지하게 임하고 있습니다!

요약

Anthropic가 AI의 재귀적 자기 개선(Recursive Self-improvement)을 통한 급격한 성능 가속화에 집중하고 있습니다. AI가 스스로 코드를 작성하고 모델을 설계하는 능력이 비약적으로 발전하며, 인간의 작업 속도를 수십 배 상회하는 성과를 보이고 있습니다.

핵심 포인트

AI가 Anthropic 코드베이스의 80% 이상을 직접 작성함
작업 처리 가능 시간(Task length)이 약 4개월마다 두 배로 증가
Mythos Preview 모델은 코드 속도 면에서 인간보다 52배 빠름
인간의 강점은 여전히 연구적 취향과 판단력에 있음

한 단어로 요약하자면: 가속 (acceleration).

말도 안 되는 블로그 게시글입니다.

요약 (Tl;dr):

• 우리는 스스로의 후속 모델을 완전히 자율적으로 설계하고 구축할 수 있는 AI에 가까워지고 있습니다.

• 그들은 이것이 아직 도래하지 않았으며 필연적인 것도 아니지만, 대부분의 기관이 준비될 수 있는 시점보다 더 빨리 도착할 수 있다고 강조합니다.

• Anthropic 엔지니어들은 이제 2021~2025년 당시보다 분기당 평균 8배 더 많은 코드를 배포합니다.

• AI가 안정적으로 완료할 수 있는 작업 길이 (Task length)는 약 4개월마다 두 배로 늘어나고 있습니다 (기존 7개월마다).

• Opus 3 (2024년 3월)는 약 4분 길이의 작업을 처리했습니다; Sonnet 3.7 (1년 후)은 약 90분 길이의 작업을; Opus 4.6 (그 후 1년 뒤)은 12시간 길이의 작업을 처리합니다.

• SWE-bench는 2년 만에 한 자릿수 초반에서 포화 상태로 넘어갔으며; CORE-bench (연구 재현)는 15개월 만에 약 20%에서 포화 상태로 넘어갔습니다.

• METR는 Claude Mythos Preview가 현재 측정 가능한 최상단 수준인 "최소" 16시간 동안 작동할 수 있음을 발견했습니다.

• 2026년 5월 기준으로, Claude는 Anthropic의 코드베이스에 병합된 코드의 80% 이상을 작성했습니다 (2025년 2월 Claude Code 출시 전에는 한 자릿수 초반이었습니다).

• 2026년 3월 130명의 연구진을 대상으로 한 설문조사: 응답자 중앙값은 Mythos Preview를 통해 출력이 약 4배 증가할 것으로 추정했습니다.

• 2026년 4월의 한 사례: Claude는 특정 클래스의 API 오류를 1,000배 줄이는 800개 이상의 수정 사항을 배포했습니다. 이는 엔지니어가 사람이 직접 했을 경우 4년이 걸릴 것으로 추정한 작업량입니다.

• Claude가 작성한 코드 품질: 2025년 말에는 인간보다 못했으나, 현재는 거의 대등한 수준이며, 1년 이내에 확실히 더 나아질 것으로 예상됩니다.

• 가장 어려운 개방형 작업 (Open-ended tasks)에서 Claude의 성공률은 2026년 5월에 76%에 도달했으며, 이는 6개월 만에 50포인트 상승한 수치입니다.

• 코드 속도 향상 (Code-speedup) 테스트: Opus 4는 평균 약 3배의 속도 향상을 보였고 (2025년 5월), Mythos Preview는 약 52배를 기록했습니다 (2026년 4월). 숙련된 인간이 4배에 도달하려면 4~8시간이 필요합니다.

• 한 AI 안전 (AI-safety) 연구 프로젝트에서, Claude 에이전트들은 800 컴퓨팅 시간 (Compute-hours) 이상과 약 18,000달러를 투입하여 성능 격차의 97%를 회복했습니다 (두 명의 인간 연구자가 일주일 동안 수행했을 때의 약 23%와 비교됨).

• 연구 세션에서 더 나은 "다음 단계(next step)"를 선택하는 데 있어, 가장 뛰어난 모델은 인간의 선택을 51% 확률로 이겼습니다 (2025년 11월, Opus 4.5). 이 수치는 64%까지 상승했습니다 (2026년 4월, Mythos Preview).

• 현재 인간의 비교 우위: 연구적 취향(research taste)과 판단력, 즉 어떤 문제가 중요한지, 그리고 어떤 접근 방식이 막다른 길(dead end)인지를 선택하는 능력입니다.

세 가지 가능한 미래

• 추세가 정체됨 (S-curve): 하지만 오늘날의 역량은 여전히 널리 확산될 것입니다. 이들은 이 시나리오를 가장 가능성이 낮다고 생각합니다.

• 복리적인 효율성 이득 (Compounding efficiency gains): 인간이 여전히 방향을 설정하는 가운데, 100명 규모의 기업이 10,000명 이상의 업무를 수행하게 됩니다. 이들은 이것이 가장 가능성 있는 경로라고 생각합니다.

• 완전한 재귀적 자기 개선 (Full recursive self-improvement): AI가 자신의 후계자를 구축하며, 발전 속도는 컴퓨팅 자원(compute)에 의해 결정됩니다. 이 시나리오에서 정렬(alignment)의 결과는 이들이 가장 불확실하게 생각하는 부분입니다.
[IMG:1]
[IMG:2]
[IMG:3]
[IMG:4]

AI 자동 생성 콘텐츠

원문 바로가기

세상에, Anthropic이 재귀적 자기 개선 (Recursive Self-improvement)에 매우 진지하게 임하고 있습니다!

요약

핵심 포인트

댓글