본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 05. 11:23

Midnight AI Groove 26-06-01

요약

NVIDIA가 물리 AI를 위한 옴니모달 월드 모델 Cosmos 3와 강력한 오픈 모델 Nemotron 3 Ultra를 공개했습니다. Cosmos 3는 추론과 생성을 결합한 설계로 벤치마크 1위를 기록했으며, Nemotron 3 Ultra는 높은 성능과 서빙 속도를 자랑합니다.

핵심 포인트

  • Cosmos 3: 추론(Autoregressive)과 생성(Diffusion)이 결합된 옴니모달 월드 모델
  • NVIDIA의 풀스택 전략: 모델, 코드, 데이터셋, 레시피를 모두 공개하여 에코시스템 구축
  • Nemotron 3 Ultra: 550B 규모의 고성능 오픈 모델로 빠른 서빙 속도 제공
  • MiniMax M3: 1M 컨텍스트를 지원하는 오픈 웨이트 멀티모달 에이전트 모델 등장

DJ 미오: 안녕하세요, 심야의 지성과 비트가 교차하는 시간입니다. 이곳은 「Midnight AI Groove」. 내비게이터는 저, DJ 미오입니다.

DJ 렌: 그리고 파트너는 DJ 렌. 오늘 밤은 AINews의 「not much happened today」를 읽어 내려가 볼 건데…… 제목과는 정반대로, AI 업계는 평범하게 정보량이 너무 많았던 날이었네.

DJ 미오: 정말 그래요. 겉으로는 「조용한 날」이라고 하지만, 내용을 보면 NVIDIA의 오픈 모델 공세, 에이전트 기반의 진화, 코딩 AI 경쟁, 로컬 AI 하드웨어 화제까지 알차게 채워져 있습니다.

DJ 렌: 그럼 첫 번째 큰 파도부터 가보자. 역시 오늘은 NVIDIA야.

핵심은 Cosmos 3Nemotron 3 Ultra네.

DJ 미오: Cosmos 3는 이른바 "물리 AI"를 위한 **옴니모달 월드 모델 (omnimodal world model)**입니다.

언어, 이미지, 영상, 음성, 그리고 액션(action)까지 하나의 설계로 다루는 것이 포인트입니다.

DJ 렌: 게다가 단순한 연구 발표가 아니라, weights, code, dataset, fine-tuning recipe까지 포함한 풀스택 공개야. NVIDIA는 모델 단독이 아니라 에코시스템(ecosystem) 전체를 밀어붙였어. 게다가 Cosmos Coalition도 설립해서, Runway 같은 파트너 기업과 함께 오픈 월드 모델 권역을 만들려고 하고 있어.

DJ 미오: 기술적으로도 흥미로워요. Cosmos 3는 Mixture-of-Transformers 설계로, 자기회귀형(autoregressive) reasonerdiffusion 기반의 generator를 결합하고 있습니다.

즉, 「생각하는 계열」과 「생성하는 계열」이 역할을 분담하고 있는 느낌이죠.

DJ 렌: 그 결과, Artificial Analysis에 따르면 open-weight 모델의 Text-to-Image와 Image-to-Video 양쪽 모두에서 1위를 차지했어. 게다가 생성 측면은 structured JSON prompts로 구동할 수 있어서, 외부의 프롬프트 확장 하네스(harness)나 자체적인 reasoner 분기에서도 제어할 수 있다고 해. 상당히 실운용에 가깝지.

DJ 미오: NVIDIA는 예전에 "GPU 회사"로 여겨지기 쉬웠지만, 이제는 하드웨어, 모델, 추론 기반, 에코시스템, 개발 프레임워크까지 전부 묶어서 내놓는 회사가 되었네요.

DJ 렌: 그 흐름의 또 다른 한 축이 Nemotron 3 Ultra야.

이것은 550B open-weight 모델로, 커뮤니티에서는 **「현시점 최강 클래스의 미국산 오픈 모델이 아닐까」**라는 평가가 강했어.

DJ 미오: 평가뿐만 아니라, 서빙 속도 (serving speed) 이야기도 뜨거웠습니다. 환경에 따라서는 300 tok/s 초과라는 이야기까지 있어서, 거대 모델임에도 의외로 빠르다는 반응이었죠.

DJ 렌: 반면 아키텍처 측면에서는 Kimi K2나 DeepSeek V4보다 희소하지(sparse) 않다, 즉 활성율(active rate)이 높아서 대략 약 10% active vs 약 3% 같은 비교도 나오고 있어.

이것은 비용과 동작 모두에 관계될 것 같아서, 단순히 "빠르고 강하다"를 넘어 경제성이나 모델의 성격에도 영향을 미치는 논점이야.

DJ 미오: 다음은 오픈 계열 에이전트 모델 경쟁입니다. 오늘 가장 화제가 된 신모델은 아마 MiniMax M3일 거예요.

DJ 렌: 맞아. M3는 open-weight 멀티모달 agent/coding model로 등장했어.

강점은 1M context, native multimodality, 그리고 상당히 공격적인 벤치마크 수치야.

예를 들어 SWE-Bench Pro 59.0%, Terminal Bench 2.1에서 66.0%, MCP Atlas 74.2%.

DJ 미오: 게다가 흥미로운 점은, 발표 당일부터 Novita, Vercel AI Gateway, Cloudflare AI Gateway, OpenClaude, Flowith 같은 인프라 측에서 굉장히 빠르게 대응했다는 것입니다.

즉 모델 자체뿐만 아니라, 에코시스템의 초동 대응이 상당히 강력했다는 뜻이죠.

DJ 렌: 다만, 사용감은 약간 갈리고 있어.

프론트엔드 생성이나 비주얼 계열, 게임 계열, 원샷 (One-shot) UI 생성에서는 높은 평가를 받고 있습니다. 하지만 한편으로는, 토큰 소비가 많고, 자기 체크 루프 (Self-check loop)가 장황하며, 긴 작업 시 요구사항에서 벗어난다는 목소리도 있습니다.

DJ 미오: 요컨대, M3는 질(Quality)을 우선시하고 효율은 뒷전인 것처럼 보인다는 거네요.

화려하게 강력하지만, 실무에서는 러닝 코스트 (Running cost)나 안정성은 아직 관찰이 필요하다는 인상입니다.

DJ 렌: 게다가 Reddit에서는 더 근본적인 지적도 있었어.

"open-weight라고 하지만, 실제 가중치 (Weights)나 파라미터 수(Parameter count)가 아직 보이지 않잖아"라는 식이지.

능력이 진짜라면 상당히 큰 모델일 텐데, 대규모 모델인지, 벤치마크 최적화 (Benchmark optimization) 모델인지, 아니면 오픈 소스계의 진정한 돌파구인지 아직은 판단을 기다려야 해.

DJ 미오: 그리고 Qwen3.7-Plus. 이 모델은 Alibaba의 새로운 방향성이 잘 보이는 모델입니다.

단순한 채팅 AI가 아니라, GUI와 CLI 조작, 시각적 추론 (Visual reasoning), 코딩, 검색 보조 QA를 통합한 **멀티모달 인터랙티브 에이전트 (Multimodal interactive agent)**죠.

DJ 렌: 이거, 최근 아시아계 연구소(Lab)들의 흐름을 상징하고 있네.

이제 "똑똑한 채팅 모델을 내놓겠습니다"가 아니라, **실제로 작업하는 에이전트 시스템 (Agent system)**으로서 내놓고 있어.

DJ 미오: 다음은 JetBrains Mellum2. 이건 화려함보다는 실무에 가깝습니다.

12B 규모의 MoE (Mixture of Experts)로, active 파라미터는 2.5B, 학습 토큰은 약 11T, 여기에 **RLVR (Reinforcement Learning from Verifiable Rewards)**로 사후 학습을 진행했습니다.

Base, SFT, RL 체크포인트가 있으며 기술 보고서도 공개되었죠.

DJ 렌: 타겟이 명확해서 좋다는 거야.

**초저지연 추론 (Ultra-low latency inference)**을 통해, 라우팅 (Routing), RAG, 서브 에이전트 (Sub-agent), IDE 용도를 겨냥했지.

vLLM에 바로 탑재된 것도 컸어. 이건 벤치마크 점수 경쟁보다는, 개발자 워크플로우에서 정말 쓸 수 있는 소형 고속 모델을 지향한 느낌이야.

DJ 미오: 여기서 기사 전체의 큰 테마가 보입니다.

그것은 바로, 경쟁의 주전장이 모델 본체에서 에이전트의 실행 기반(Execution infrastructure)으로 옮겨가고 있다는 것입니다.

DJ 렌: 응. 지금 승부를 결정짓는 건 모델을 한 번 호출하는 게 아니야.

어떻게 검색할지, 어떻게 코드를 작성하고 실행할지, 어디서 실패를 격리할지, 어떻게 문맥(Context)을 이어갈지. 그 하네스(Harness) 부분이 제품 가치가 되고 있어.

DJ 미오: 그 상징이 바로 **Perplexity의 「Search as Code」**입니다.

일반적인 검색 에이전트라면 모델이 검색 도구를 여러 번 호출하겠지만, Search as Code에서는 모델이 검색 SDK를 향해 Python 코드를 작성합니다.

이를 통해 **랭킹 커스텀, map-reduce, 배치 처리 (Batch processing), 집계 (Aggregation)**가 쉬워지고 토큰 소비도 억제할 수 있죠.

DJ 렌: 게다가 Perplexity의 내부 벤치마크인 WANDR에서는 0.152에서 0.386으로 점프했다는 이야기가 있어.

이 차이는 굉장히 커. 즉 "모델 자체가 똑똑해졌다"는 것 이상으로, 검색을 시키는 방식을 코드화한 것이 효과를 본 거지.

DJ 미오: Google도 비슷한 방향으로 Gemini API의 Managed Agents를 내놓고 있습니다.

단 한 번의 API 호출로 추론하고, 코드를 작성하고, 실행하고, 파일을 다루며, Linux sandbox에서 동작합니다.

모델 API가 점점 작은 클라우드 실행 환경에 가까워지고 있는 셈이죠.

DJ 렌: LangChain도 Deep Agents, Context Hub, LangSmith Sandboxes/Engine을 밀고 있으며, 영속적 컨텍스트 (Persistent context), 에이전트의 라이프사이클 관리, 실패 분석 같은 부분들을 정비하고 있어.

이제 단순히 "좋은 모델을 호출하는 것"만으로는 부족한 시대야.

DJ 미오: 하지만 그 흐름 속에서 아직 부족한 것이 바로 **메모리 (Memory)**입니다.

기사에서도 거대한 컨텍스트 윈도우 (Context window)가 있더라도 크로스 세션(Cross-session)의 기억 문제는 해결되지 않았다고 지적했습니다.

DJ 렌: HydraDB 이야기가 상징적이었지.

RAG와 수동 컨텍스트 주입을 「메모리」라고 부르는 것은 틀렸다는 점 말이야.

진정한 의미의 영속적인 세션 지식, 즉 사용자나 프로젝트에 대해 지속적으로 기억하는 메커니즘은 아직 미성숙한 상태야.

DJ 미오: 관련 연구로서 AdaCoM과 같이, 별도의 LLM을 RL (강화학습)로 훈련하여, 동결된 에이전트(agent)를 위한 컨텍스트를 깎아내거나 남기는 관리를 수행하는 기법도 화제입니다.

이 부분도 향후 중요한 테마가 되겠네요.

DJ 렌: 그리고 엔터프라이즈 도입에서 가장 큰 장벽으로 등장하는 것이 바로 **보안 (Security)**입니다.

기사에서는 Microsoft Security Intelligence가, **90개 이상의 redhat-cloud-services 계열 npm 패키지에 영향을 미치는 공급망 침해 (supply chain compromise)**를 경고했습니다.

DJ 미오: npm, GitHub, AWS, SSH 인증 정보를 훔치는 자기 증식형 웜(worm)에 관한 이야기로, 상당히 심각합니다.

에이전트에게 코드 실행이나 외부 액세스를 허용하는 시대인 만큼, **샌드박싱 (sandboxing), 런타임 격리 (runtime isolation), 보안 스택 통합 (security stack integration)**이 전제 조건이 되어야 한다는 흐름입니다.

DJ 렌: 즉, 기업이 원하는 것은 단순히 "고지능 모델"뿐만 아니라, 폭주하더라도 가둬둘 수 있을 것, 자격 증명(credentials)을 유출하지 않을 것, 감사(audit)가 가능할 것이라는 거지.

DJ 미오: 다음은 Codex, Claude Code, 코딩 에이전트 경쟁으로 넘어가 보죠.

먼저 OpenAI는, Codex와 프런티어 모델 (frontier models)을 AWS / Amazon Bedrock 상에서 일반 제공합니다.

이것은 상당히 엔터프라이즈를 겨냥한 행보입니다.

DJ 렌: 기존 AWS의 보안 및 컴플라이언스 (security & compliance) 운영 체계 안에서 OpenAI를 사용하고 싶은 기업들에게는 매력적이겠네.

게다가 Codex Python SDK도 출시하여, threads, turns, streaming, resume, images, sandbox control에 대응합니다. Bedrock 백엔드 설정도 지원하고요.

DJ 미오: 반면 Anthropic 진영의 Claude Code는 약간 뼈아픈 운영 사고가 있었습니다.

Opus 4.8의 일부 세션에서 병렬 subagent/tool call이 너무 많아져, 5시간/주간 레이트 리밋 (rate limit)을 비정상적으로 소비해버리는 버그가 있었고, Anthropic은 나중에 제한을 리셋했습니다.

DJ 렌: 이건 상징적인 사건이야.

코딩 AI의 품질은 이제 더 이상 단순한 "모델의 지능" 문제가 아니야.

얼마나 병렬화할 것인가, 언제 도구(tool)를 호출할 것인가, 루프를 언제 멈출 것인가, 사용량을 어떻게 제어할 것인가. 그 오케스트레이션 (orchestration)의 완성도가 사용자 경험을 좌우하게 되지.

DJ 미오: 게다가 평가 측면에서도 GPT, Claude, 그리고 기타 모델 간의 차이가 상당히 질적입니다.

어떤 벤치마크에서는 탐색(exploration)을 중시하고, 다른 벤치마크에서는 스코어 최적화를 중시하는 식의 특성이 나타납니다.

나아가 일부에서는, Claude Opus 4.6~4.8이 비코딩 영역에서도 그럴듯한 가공의 개념을 만들어낸다는 논의도 있어, 단순한 할루시네이션 (hallucination) 이상의 문제일 수 있다는 시각도 있었습니다.

DJ 렌: 하드웨어 이야기로 넘어가 보자.

오늘은 역시 RTX Spark가 핵심이네.

NVIDIA와 Microsoft의 "개인용 AI 컴퓨터 (personal AI computer)"로, Grace + Blackwell, 최대 128GB 통합 메모리 (unified memory), 1 PFLOP FP4를 내세우고 있어.

DJ 미오: 여기서의 전략적 포인트는 명확합니다.

NVIDIA는 이제 더 이상 **데이터 센터용 가속기 (accelerator)**만을 만드는 회사가 아닙니다.

로컬 AI 머신 그 자체를 장악하려 하고 있으며, Apple Silicon, x86 PC, Qualcomm 계열과도 경쟁하기 시작했습니다.

DJ 렌: 데이터 센터 측면에서도 움직임이 있는데, Lambda가 Quantum-X InfiniBand Photonics Q3450-LD를 최초로 채택한다는 소식이야.

대규모 AI 클러스터에서 네트워크 전력 소모와 고장률을 낮추기 위해 Co-packaged optics를 도입해 나가는 흐름이지.

DJ 미오: OpenAI도 Stargate Michigan, 1GW급 데이터 센터 계획을 발표했습니다.

폐쇄 루프 냉각 (closed-loop cooling)과 교육 및 고용에 대한 약속을 결합했죠.

AI 이야기가 모델 성능을 넘어 전력, 냉각, 지역 인프라, 노동력 양성까지 확장되고 있음을 알 수 있습니다.

DJ 렌: 로컬 추론 도구들도 진보하고 있는데, MLX-VLM v0.6.0은 상당히 실용적이야.

speculative decoding (추측적 디코딩), Anthropic 스타일/Responses 스타일 API, tool call (도구 호출), 다수의 멀티모달 (Multimodal) 모델 지원, 이미지 및 음성 기능을 추가하여, Apple 디바이스를 "진정한 로컬 에이전트 머신"으로 만들려 하고 있어.

DJ 미오: 즉, 로컬 AI는 NVIDIA 진영뿐만이 아니군요.

Apple 디바이스에서도 에이전트 같은 작업을 로컬에서 돌릴 수 있는 도구들이 급속도로 갖춰지고 있는 것이네요.

DJ 렌: 여기서 "Top Tweets" 스타일의 토픽도 좀 짚어볼까.

먼저 Anthropic이 IPO를 위해 SEC에 S-1 초안을 비밀리에 제출했어.

그리고 방금 언급한 Claude Code의 이용 사고와 Rate Limit (속도 제한) 리셋.

여기에 Qwen3.7-Plus의 투입, OpenAI on Bedrock, 그리고 **ARC-AGI-3에서 Claude Opus 4.8이 1.5%의 SOTA (State-of-the-Art)**를 달성했다는 소식까지.

DJ 미오: 1.5%라는 수치는 절대적인 값으로는 작지만, ARC-AGI-3 맥락에서는 의미 있는 도약이라는 뜻이군요.

이 업계는 "아직 낮지만 전진했다"라는 숫자에 제대로 의미가 부여된다는 점이 흥미로워요.

DJ 렌: 그럼 Reddit 쪽 요약도 가보자. 특히 /r/LocalLlama/r/localLLM.

우선 역시 MiniMax M3가 크게 화제야.

1M context (100만 토큰 컨텍스트), 멀티모달, agentic coding (에이전트적 코딩) 중시를 내세우며, 장시간 태스크 수행 실적도 어필하고 있었어.

DJ 미오: 다만, Reddit 반응은 상당히 냉정해서,

weights (가중치)가 아직 없고, 파라미터(Parameter) 수도 알 수 없으며, 어느 정도까지 오픈되었는지 불투명하다는 불신이 있었어요.

능력이 정말라면 예상보다 훨씬 거대한 모델인지, 아니면 벤치마크 특화 모델인지에 대해 논쟁이 계속되고 있습니다.

DJ 렌: 다음은 Nemotron 3 Ultra.

이쪽은 Reddit에서도 MoE 550B-A55라는 구체적인 아키텍처 정보가 받아들여지고 있었어.

Artificial Analysis 스코어 48로, "프론티어 모델의 바로 아래 단계지만, 미국 오픈 소스 진영 중에서는 상당히 강력하다"라는 위치를 점하고 있지.

DJ 미오: 그리고 Stepfun 3.7 Flash.

단일 HTML로 "힐링계 플라이트 시뮬레이터"를 보여주는 데모 GIF가 화제였는데,

GLM 5.1에 가까운 아름다움, 3D 세계 이해도는 80% 정도, 하지만 파라미터는 4분의 1 수준이면서 vision (비전) 기능 내장이라는 주장이야.

수치 벤치마크는 약하지만, 데모의 설득력이 강했던 케이스네요.

DJ 렌: 하드웨어 관련 Reddit 화제도 로컬 AI 시대를 제대로 느끼게 해줘.

먼저 Dell의 XPS에 NVIDIA N1X 탑재 소식.

게시글에서는 "Windows 버전의 DGX Spark/GB10 같은 것"으로 여겨지고 있었어.

DJ 미오: 모두가 신경 쓰고 있었던 건 역시 통합 메모리 용량이었죠.

예를 들어 128GB 구성에서 그중 64GB를 GPU 용도로 쓸 수 있는지, 혹은 256GB 구성이 있는지 같은 것 말이에요.

로컬 LLM 용도로는 순수한 GPU 성능뿐만 아니라, 얼마나 큰 모델을 올릴 수 있는가가 중요하니까요.

DJ 렌: 하지만 회의적인 시각도 있었어.

DGX Spark급 가격이 된다면, RTX 5090을 탑재한 노트북이 더 빠르고 저렴하지 않겠느냐는 의견이었지.

또한 Windows보다 Linux의 공식 지원을 요구하는 목소리도 컸어.

DJ 미오: 그리고 이색적인 화제로는 **중국 개조판 "RTX 3080 20GB"**가 있었어요.

외관은 수상해 보이는데, nvidia-smi에서는 제대로 인식되고 있더라고요.

다만, 벤치마크, 안정성, 발열, 소비 전력, CUDA 워크로드 측면에서 정말 20GB 전체를 신뢰할 수 있는지는 미검증 상태입니다.

DJ 렌: 그래도 다들 궁금해하더라고.

VRAM당 가성비 측면에서 최저가 아닐까 하는 기대나, 3090보다 온도가 15도나 낮다니 대단하다며 쿨링 차이 때문에 3팬 버전을 주문했다는 이야기 등등.

로컬 AI 유저들의 "수상하지만 궁금하다"는 정신이 잘 드러났지.

DJ 미오: 다음은 좀 더 일반적인 AI 서브레딧 화제입니다. 중심은 역시 Claude Coding이에요.

먼저 Opus 4.8 vs 4.7 on MineBench.

Minecraft 스타일의 3D 블록 배치 벤치마크인데, 4.8이 4.7보다 개선되었다는 보고가 있었습니다.

DJ 렌: 15회의 빌드에서 총 $41.52, 평균 24.8분, 1,487초의 추론 (inference).

API 가격은 동일하지만, 사고 시간 (thinking time)이 짧아져 실질적으로 저렴해진 것처럼 보인다는 이야기였지.

품질은 주관적으로 좋으며 GPT 5.5급에 가깝지만, 다소 불안정해.

DJ 미오: 하지만, 무효한 블록 팔레트 (block palette) 환각이나 잘못된 JSON으로 인해 **5번의 재시도 (retry)**가 필요했어.

그래도 adaptive thinking이 출력 토큰을 다 써버리기 전에 유효한 JSON에 도달하기 쉬워졌다고도 보여.

DJ 렌: 댓글에서는, 동일한 블록 수로 제한하는 예산 모드 (budget mode)가 있어야 비교하기 쉽다거나,

동일한 프롬프트로 모델의 진화를 추적하는 전용 사이트가 필요하다는 등 벤치마크의 지속성에 대한 제안도 나왔어.

DJ 미오: 그리고 꽤 화제가 되었던 것이 CLAUDE.md야.

Karpathy 스타일의 지시 방식을 반영한, 프로젝트용 최소한의 가이드 파일이지.

DJ 렌: 인기의 이유는 명확해. 에이전트 코딩 (agent coding)에서 흔히 발생하는

프로젝트 기억 결여, 확인되지 않은 추측, 불필요한 리팩터링 (refactoring), 과신한 실행을 억제하는 규칙이 들어있기 때문이야.

예를 들어 가정하기 전에 질문하기, 최소한의 작동하는 결과물 만들기, 관련 없는 변경 피하기, 불확실성 명시하기 같은 것들.

DJ 미오: 다만 평가는 갈리고 있어.

초보자나 전환기 사용자에게는 도움이 되지만, 숙련자 입장에서는 확인을 위한 상호작용이 너무 많아져서 느리다는 의견이 있어.

더 세련된 **하네스 공학 (harness engineering)**으로 자동화하는 편이 낫다는 의견도 있고.

DJ 렌: 또 하나 중요한 점은, 이런 규칙을 글로벌하게 너무 고정하면 위험하다는 지적이야.

모델이나 Claude Code 본체의 동작이 바뀌면, 예전에는 유효했던 명령이 지금은 역효과를 낼 수도 있거든.

그래서 세션 단위나 프로젝트 단위로 한정해야 한다는 생각도 나왔어.

DJ 미오: 게다가 일부 댓글에서는, 인기 있는 CLAUDE.md가 권장하는 동작의 상당수가 원래 Claude Code의 하네스나 시스템 프롬프트 (system prompt)에 포함되어 있을지도 모른다고 하더라고.

만약 그렇다면 추가적인 효과는 제한적이며, 일종의 안도감을 주는 "약한 스티어링 (weak steering)"에 가까울 가능성도 있어.

DJ 렌: 마지막으로 다시 한번, rate limit reset (속도 제한 초기화) 이야기.

Anthropic이 병렬 subagent 폭주로 인한 쿼터 (quota) 소비 이후, Pro와 Max의 5시간·주간 속도 제한을 리셋한 건 말이야.

DJ 미오: 사용자 보고에 따르면, 무한 도구 루프 (infinite tool loop) 같은 동작으로 Max 플랜의 세션 상한을 주말 동안 2번이나 다 써버렸다거나, 주간 사용량의 70% 이상, 혹은 96%까지 도달했다는 사례도 있었어.

그래서 이번 리셋은 상당히 실질적인 구제책이었지.

DJ 렌: 다만, 예고 없는 리셋을 혼란으로 보는 사람도 있고, 망가졌던 주말에 대한 타당한 보상으로 보는 사람도 있어서 반응은 갈렸어.

DJ 미오: 그리고 기사의 마지막은 조금 아쉬운 소식이야.

Discord 모니터링 액세스가 종료되면서, 이런 형태의 Discord recap은 끝났어.

하지만 새로운 AINews를 출시할 예정이라고 해.

DJ 렌: 총평하자면 오늘의 요약을 한마디로 말해서,

모델 경쟁은 계속되고 있지만, 승패를 결정짓기 시작한 것은 "실행 기반 (execution infrastructure)"이다라고 할 수 있겠네.

DJ 미오: 맞아요.

Cosmos 3나 Nemotron 3 Ultra 같은 대형 모델의 발전도 있고,

MiniMax M3, Qwen3.7-Plus, Mellum2 같은 새로운 얼굴들도 등장하고 있어.

하지만 정말 눈에 띄었던 것은 search as code, managed agents, sandbox, persistent context, security, local AI systems와 같은 "사용하기 위한 구조"였어.

DJ 렌: 즉 AI는 단순한 똑똑한 대화 상대에서, 환경 속에서 움직이는 소프트웨어 노동자로 변하고 있다는 거지.

그때 필요한 것은 지능뿐만 아니라, 기억, 도구, 격리, 감사, 그리고 안정적인 운용이야.

DJ 미오: 그리고 로컬 측면에서도 NVIDIA의 Personal AI Computer 구상이나 Apple 기기에서의 로컬 에이전트화가 진행되고 있어서,

"AI는 클라우드만의 전유물이 아니다"라는 미래도 꽤 윤곽이 뚜렷해지고 있어.

DJ 렌: 조용한 날이라고 말은 하지만, 업계의 지각 변동은 멈추지 않고 있어.

오히려 큰 뉴스보다 이런 날들이 쌓여가는 것이 다음 트렌드를 더 잘 반영하고 있는지도 모르겠네.

DJ 미오: 오늘 밤 「Midnight AI Groove」도 이제 작별할 시간입니다.

심야 뉴스의 물결 사이에서, AI의 다음 형태를 함께 찾아보았습니다.

DJ 렌: 다음 시간에, 이 주파수에서 다시 만나자.

함께한 DJ 렌과—

DJ 미오: DJ 미오였습니다.

Good night, and keep the groove intelligent.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0