
일본 AI 스타트업, Claude Fable 5 및 Mythos 성능 구현
요약
일본의 Sakana AI가 멀티 에이전트 오케스트레이션 모델인 Fugu와 Fugu Ultra를 출시했습니다. 이 모델은 여러 전문화된 모델을 지휘하여 단일 모델처럼 작동하며, 특정 벤치마크에서 Anthropic의 최신 모델들과 대등하거나 능가하는 성능을 보여줍니다.
핵심 포인트
- Sakana AI의 Fugu는 전문 모델들을 자동으로 오케스트레이션하는 멀티 에이전트 시스템임
- Fugu Ultra는 공학, 과학, 추론 벤치마크에서 Anthropic의 모델들과 대등한 성능 기록
- 단일 거대 모델 확장 방식 대신, 최적의 모델 풀을 선택하고 위임하는 방식 채택
- Fugu(일상용)와 Fugu Ultra(고난도 작업용) 두 가지 버전으로 제공
🚨일본 AI 스타트업이 Claude Fable 5 및 Mythos의 성능을 따라잡았습니다.
일본의 AI 연구소가 다른 모델들을 지휘하도록 훈련된 모델인 Fugu를 막 출시했습니다.
도쿄에 본사를 둔 AI 스타트업 Sakana AI는 오늘날 거의 모든 AI 모델의 기반이 되는 Transformer 논문의 저자 중 한 명을 포함한 연구원들에 의해 공동 설립되었습니다.
Sakana Fugu는 하나의 API 엔드포인트 뒤에서 전문화된 모델들을 자동으로 오케스트레이션(orchestrating)하여, 마치 단일 모델처럼 느껴지는 멀티 에이전트 (multi-agent) AI 시스템입니다.
Fugu Ultra는 가장 어려운 공학/과학/추론 벤치마크에서 Anthropic의 Fable 5 및 Mythos Preview와 대등한 성능을 보이며, AutoResearch, 기계 설계 및 금융 예측과 같은 작업에서는 Gemini 3.1 Pro, Opus 4.8 및 GPT-5.5를 능가한다고 주장합니다.
모두가 하나의 거대한 모델을 확장(scale)하기 위해 경쟁하고 있지만, Fugu는 이를 뒤집습니다. 세계 최고의 모델 풀(pool)을 오케스트레이션하는 LLM(대규모 언어 모델)으로서, 누가 무엇을 할지 선택하고, 위임하고, 검증하며, 이를 하나의 답변으로 병합하며, 심지어 자기 자신을 재귀적으로 호출하기도 합니다.
지휘자를 떠올려 보세요. 하나의 API로 요청을 보내면, Fugu가 어떻게 움직일지 결정합니다. 혼자서 답변하거나, 전문가 모델 팀을 구성하여 당신을 위해 전체 과정을 실행합니다.
Sakana AI는 두 가지 모델을 출시했습니다:
Fugu - 빠르고 지연 시간이 낮은 일상적인 코딩/채팅용
Fugu Ultra - 어렵고 다단계적인 문제(AI 연구, 논문 재현, 사이버 보안, 특허 검색)에 대한 최대 품질 제공
현재 프런티어 모델(frontier models)에 대한 수출 통제가 가해지고 있지만, Fugu의 에이전트 풀은 교체 가능하기 때문에, 특정 제공업체가 접근을 제한하더라도 이를 우회하여 경로를 설정합니다.
Fugu와 Fugu Ultra 모두 통합 API를 통해 접근할 수 있으며, 일반 사용자를 위한 구독 플랜과 대량 작업 및 기업 워크로드를 위해 설계된 종량제(pay-as-you-go) 가격 정책이 제공됩니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Claude/Anthropic의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기