
Opus 4.8 + Ultracode 앙!
요약
Anthropic의 새로운 Opus 4.8 모델과 Ultracode 기능이 출시되었습니다. Ultracode는 수백 개의 병렬 에이전트를 활용해 대규모 코드베이스 마이그레이션 등 복잡한 작업을 수행하며, 모델의 정직성(Truthfulness)이 대폭 개선되었습니다.
핵심 포인트
- Ultracode를 통해 수백 개의 서브 에이전트를 병렬로 실행하여 대규모 작업 수행 가능
- 모델의 거짓말(Hallucination)을 줄이는 정직성 성능이 4배 이상 향상
- 에이전틱 컴퓨터 활용 능력(Computer Use)에서 GPT 5.5 대비 우위 점함
- 엔터프라이즈, 팀, 맥스 플랜 사용자에게 우선 제공되는 고성능 기능
Video: Opus 4.8 + Ultracode 앙!
Channel: 코드팩토리
Duration: 8m 1s
Source: subtitle (auto, ko)
Transcript:
자, 드디어 오퍼스 4.8이 나왔습니다. 정말 재미있는 기능이 함께 나왔는데요. 오트라 코드라는 기능이 생겨 나왔어요. 역시 엔트로픽은 얼트라를 되게 좋아하는데 자, 지금 보이는 화면이 울트라 코드를 실제로 실행한 화면이요. 제가 지금 운영을 하고 있는 넥스트 프로젝트를 분석하고 디버깅 해 달라고 요청을 했는데 자, 이렇게 페이즈를 두 개로 나눴고요. 자, 그리고 11개의 서브에트가 병렬로 실행이 됐습니다. 자, 오른쪽으로 들어가게 되면요. 우리가 실제 서브에전트가 하고 있는 작업들을 우리가 전부 다 이렇게 볼 수도 있고요. 자,이 페이스에서 다음 페이스로 넘어가서 그 안에서도 우리가 각각 서브에트를 볼 수도 있어요. 지금 7분 동안 실행하면서 한 번에 120만 토큰을 써 버렸는데 지금까지 나온 엔트로픽에서 출시한 모든 기능 중에 가장 컴프레시티브하고 가장 강력한 기능이라고 얘기를 해요. 자, 이번 4.8 나오면서 업데이트된 기능들 우리 함께 알아보도록 하겠습니다. so easy. 자, 이거 오늘 나온 거고요.
클로 오퍼스 4.8이라고 하면서 이렇게 나왔죠. 쭉 내려가 보면은요. 자, 벤치마크 한번 봐 볼게요. 자, 4.8, 4.7, 5.5를 비교를 하고 있고요. 에이전틱 터미널 코딩은 굉장히 정직하게도 어, GPT 5.5보다 낮게 나온 거를 그대로 공개를 했어요. 자, 그리고 에이전트 컴퓨터 유즈 같은 경우는 83.4%가 나왔고 GPT 5.5 같은 경우에는 78.7%가 7%가 나왔으니까. 자, 여전히 컴퓨터 활용 쪽에서는 오퍼스가 더 강력하다라고 여러분이 생각을 해 주시면 될 거 같습니다. 자, 그리고 이번에 조금 재밌는 거는요. 오퍼스 4.8에서 앤트로픽이 가장 강조하고 싶은 것 중 하나는요. 진실됨입니다. 이거는 좀 웃긴 말인데. 자, 우리 모델들이 작업을 하다 보면은 다 하지 않았는데 다 했습니다. 완벽하게 다 끝났어요라고 거짓말을 하는 경우가 꽤나 있죠. 이거는 뭐 오퍼스가 됐든 코덱스가 됐든 모든 모델이 공통적으로 있는 문제인데 그 부분에서 네배 이상 좋아지는 퍼포먼스를 보여 준다라고 이야기를 하고 있어요.
자, 그래서 우리가 실수로라도 원래 해야 됐던 작업을 오퍼스가 거짓말해서 하지 않게 되는 경우는 훨씬 줄어들 수가 있겠죠. 자, 제가 저번에 미토스 소개에서도 보여 드렸던 것처럼 자, 미라인 비이비어가 거의 미토스 프리랑 같은 수준으로 내려온 거를 볼 수가 있고요.이 4.8 이외에도 자, 이렇게 세 가지 기능을 또 출시를 해 줬습니다. 아까 제가 보여 드렸던 한 번 더 보여 드릴게 어떻게 쓰는지 다이나믹 워플로라는게 추가가 됐고요. 자, 지금 리서치 프리뷰인데 지금까지 지원을 했던 것보다 훨씬 더 큰 작업들을 클로드 코드가 할 수 있도록 해 준다. 제가 클로드 앱도 써 봤는데 클로드 앱에는 아직 없는 거 같아요. 자,이 포인트는 뭐냐? 수백개의 병렬 에이전트를 우리가 하나의 세션에서 실행을 해서 하나의 엄청나게 큰 문제를 해결할 수 있도록 해 준다라는 겁니다. 자, 그래서 예를 들면은 오퍼스 4.8을 사용해서 이제는 코드베이스 스킬 마이그레이션. 그러니까 우리가 넥스트를 완전 위트로 마이그레이션 한다거나 넥스트를 우리가 완전히 리믹스로 마이그레이션 한다거나 이런 것들을 우리가 할 수 있게 된다라는 겁니다.
뭐 데이터베이스를 슈퍼베이스로부터 컨스로 바꿀 수도 있을 거고 슈퍼베이스로부터 파이어베이스로 바꿀 수도 있겠죠. 자, 참고해 주셔야 되는 거는 엔터프라이즈, 팀플랜, 그리고 맥스 플랜까지만 지원을 하기 때문에 여러분이 프로에선 쓸 수가 없다. 자, 그 이유는 아마 프로에서 써 봤자 아마 뭐 한 5분이면은 사용량이 다 차 버릴 겁니다. 자, 그리고 에포트 컨트롤이 생겼는데요. 자, 코워크에 가면은 이제는 우리가 조절할 수 있다라고 나옵니다. 자, 여기에 이거에 우리가 이렇게 바꿀 수 있는 거를 얘기를 하는 거예요. 놀랍게도 코워크에는 없었죠. 자, 그다음에 메시지 API의 시스템 엔트리를 이제 받는다. 자, 근데 이거는 우리 형님들은 별로 관심이 없겠죠? 자, 또 얘기를 하고 있는데 기본은 하이로 돼 있고요. 여러분이 추가로 조금 더 똑똑하게 작업을 해야 될 것 같다라고 생각이 들면은 X하이나 맥스를 써 달라고 이렇게 얘기를 하고 있고요. 기존보다도이 높은트 레벨들이 더 많은 토큰을 더 쓸 수 있도록 한돌을 늘려 놨다라고 얘기를 하고 있어요.
그래서 지금까지 사용을 했던 X하이가 만약에 부족했다. 맥스가 부족했다라고 하면은 이번에 또 써 보면은 여러분이 조금 다르게 느낄 수도 있습니다. 자, 왓넥스트. 여기에 또 프로젝트 클래싱 나오죠. 도대체 언제 나오는 건지 모르겠는데 지금 오버스 4.8이 굉장히 강력하게 나왔음에도 불구하고 훨씬 더 강력한 모델이 나올 거라고 얘기를 하고 있어요. 자, 가격 같은 경우에는 4.7과 똑같은 가격이고요. 뭐 여러분이 이미 알고 있다시피 스페이스 X의 크로서스 1을 엔트로기 통째로 임대를 해 버렸기 때문에 앞으로 유세지도 늘어가 늘어나고 앞으로 발전도 더 빠르고 앞으로 더 빠른 서비스를 제공할 수 있도록 변화하지 않을까라는 기대를 갖게 되네요. 자, 그럼 아까 전에 얘기하던 거를 저희가 마무리 한번 해 볼 건데. 자, 우리 슬래시하고서 오울트라 코드라고 하면은 안 되고요. 놀랍게도 슬래시트 안에 있습니다. 자, 슬래시오트를 넣게 되면은요. 우리가 이제는 자, 이렇게 맥스까지 조절하고 울트라 코드까지 우리가 들어갈 수가 있어요.
자,이 친구를 누르게 되면은 아주 킥 맞는 보라색으로 이렇게 올트라 코드라고 써지고요. 여기에서 만약에 우리가 넥스트 JS를 리믹스로 마이그레이션 해 줘라고 만약에 요청을 하게 되면은요. 그냥 일반적인 작업이 들어가는데 자 이렇게 슬래시하고서 워크플로스를 실행을 했을 때이 안에서 우리가 실제 우리 작업하고 있는 워크플로의 리스트를 확인을 해 볼 수 있고 어떤 작업이 실행되고 있는지 우리가 볼 수가 있습니다. 자, 저 같은 경우에는 동시에 24개의 에이전트를 사용을 하게 됐고요. 각각 어떤 목적을 갖고서 설계됐는지 이렇게 전부 다 정리가 되는 거를 볼 수가 있어요. 자, 몇게 툴를 썼는지, 얼마나 걸렸는지, 그리고 얼만큼 많은 토큰을 사용을 했는지까지 이렇게 전부 다 나오고 있고 제가 지금 하나도 안 쓰고서 오늘 지금 처음으로 작업을 했거든요. 자, 그런데 지금 벌써 7% 써 버렸어요. 10분 만에 7% 써 버렸다라는 걸 알 수가 있고. 자, 제가 시켰던 거는이 코드이스 전체를 분석하고서 디버깅 해야 될 거를 나한테 알려 달라고 했기 때문에 꽤나 간단한 작업이어서 이만큼만 썼던 거지.
만약에 여러분이 진짜로 어 대규모 코드베이스 마이그레이션 같은 거를 시켰다. 제가 봤을 때 이거 한 50%까지 쓸 수도 있습니다. 자, 근데 저는 이거 나쁘지 않다고 생각해요. 여러분이 맨날 뭐 토큰 막 소비가 뭐 어쩌거나 하는데 토큰 소비를 많이 더 빨리 할 수 있는 거는 특정 시간 안에 할 수 있는 시간을 훨씬 더 줄여 가지고 더 빨리 할 수 있다라는 거기 때문에 많이 쓰더라도 우리가 시간을 압축해서 작업을 할 수 있다라고 하면은 여러분이 절대적으로 사용해 주시는게 무조건 좋습니다. 어, 여러분도 인생도 좀 살고 해야죠. 그죠? 자, 그래서이 기능 꼭 한번 써 보시고요. 자, 비슷한 느낌으로다가 킴이 에이전트 수험이라는 기능이 있는데 그 기능과 좀 유사하다라고 생각을 해 보시면 될 거 같아요. 자, 그리고 동시에 엔트로픽에서이 다이나믹 워크플로에 대한 블로그 글을 이렇게 출시를 해 줬는데 자, 여기서 보이는 것처럼 이렇게 리스트 쫙 돼 있는 거 볼 수가 있죠. 자, 저 같은 경우 이제 단순한 작업을 요청을 했으니까 두 개의 페이스밖에 없었지만 자, 이렇게 복잡한 작업을 렉트부터 솔리드로 바꿔 버려라라는 이런 정신 나가 버린 요청을 하게 되면은 페이스까지 엄청나게 많이 늘어나게 되고요.
그 페이스를 걸쳐 가지고 우리가 굉장히 많은 서브웨전트를 동시에 활용할 수 있게 된다라는 걸 얘기를 하고 있으니까 가가 한번 꼭 읽어 보시면 좋습니다. 자, 그리고 작업할 때 제가 어제 올린 영상에서도 말씀을 드렸지만 롱러닝 테스크 같은 경우에는 우리가 정확히 뭘 원하는지 그리고 어떤 성공 조건이 있는지를 얘기를 해 줘야지만 여러분이 좋은 퍼포먼스를 얻을 수가 있어요. 그렇기 때문에 자,이 친구 같은 경우에도 메타프롬프팅을 통해서 여러분이 작업을 할 수가 있으면은 가장 효율적일 겁니다. 자, 그 방법이 궁금하다면 어제 코덱스 영상 한번 봐 보시면 될 거 같아요. 자, 그래서 5퍼스 4.8이 8이 나옴으로써 또 고민이 되는 시기가 되는데 고민이 된다면은 둘 다 그냥 맥스 200달러 모델을 쓰시면 됩니다. 자, 오늘 영상이 좋았다면 구독과 좋아요 알림 설정 그리고 댓글에 하이보이까지 해 주시면 제가 다음 영상을 제작하는데 큰 힘이 됩니다. 저는 그러면 다음에 또 뵙도록 할게요. 아, 감사합니다. 쏘지.
AI 자동 생성 콘텐츠
본 콘텐츠는 코드팩토리의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기