NVIDIA의 AI 기술 청사진: 에이전트형 AI가 자율 통신 네트워크의 조정 격차를 해소하는 방법

원문은 twarx.com에서 처음 게시되었습니다 - 전체 대화형 버전은 그곳에서 읽어보세요.

최종 업데이트: 2026년 6월 23일

대부분의 AI 기술 워크플로우는 완전히 잘못된 문제를 해결하고 있습니다. 자율 네트워크(autonomous networks)의 병목 현상은 더 이상 모델의 품질이 아닙니다. 문제는 에이전트(agents)가 정책(policy) 하에 여러 도메인에 걸쳐 조정(coordinate)할 수 있는지 여부입니다. 병목 현상을 판매하고 있다고 사람들이 생각하는 바로 그 기업으로부터 나온 이러한 AI 기술의 단일한 재정의는, 이번 분기의 그 어떤 벤치마크(benchmark)보다 이 발표가 중요한 이유입니다.

2026년 6월 22일, NVIDIA는 Nemotron, NeMo Data Designer, NV-Tesseract, 그리고 Agent Toolkit을 기반으로 구축된 통합 에이전트 플랫폼을 사용하여 통신 운영을 TM Forum 레벨 2-3 자동화에서 레벨 4-5 자율성으로 이동시키기 위한 기술 청사진인 에이전트형 AI를 사용하여 통신사가 자율 네트워크를 구축하는 방법을 발표했습니다.

이 글을 읽으면 전체 통신 자율성 스택(telco autonomy stack), 에이전트가 거치는 세 가지 문제-해결 루프(problem-solution loops), 그리고 현대 AI 기술에서 연산(compute)이 아닌 조정(coordination)이 왜 실제 제약 사항인지 정확히 이해하게 될 것입니다.

NVIDIA telco autonomy platform diagram showing agentic AI across network operations domains

TM Forum 자율성 레벨에 따라 에이전트를 매핑한 NVIDIA의 자율 통신 네트워크 참조 아키텍처(reference architecture). 출처: NVIDIA Technical Blog

명명된 프레임워크

AI 조정 격차 (The AI Coordination Gap)

AI 조정 격차 (The AI Coordination Gap)는 유능한 개별 에이전트를 보유하는 것과, 공유된 정책 (shared policy) 하에 여러 도메인에 걸쳐 함께 감지(sense), 계획(plan), 행동(act)할 수 있는 에이전트를 보유하는 것 사이의 간극을 의미합니다. 이는 대부분의 기업이 강력한 모델을 보유하고 있음에도 불구하고 왜 부분적인 자동화 단계에서 정체되는지를 설명합니다. 즉, 제약 사항은 지능 (intelligence)이 아니라 오케스트레이션 (orchestration)인 것입니다.

개요: NVIDIA가 실제로 발표한 내용

Amogh Dendukuri가 작성한 NVIDIA의 2026년 6월 22일 기술 블로그는 대부분의 벤더 게시물과는 다른 행보를 보입니다. 바로 어려운 부분을 인정한다는 점입니다. 인용구: '제약 사항은 더 이상 모델의 품질이 아니라, 통신사들이 에이전트가 통신 도메인 모델 (telecom-domain models), 정책 제어 (policy controls), 도구 (tools), 그리고 디지털 트윈 (digital twins)의 공유 스택을 활용할 수 있는 자율성 플랫폼을 구축했는지 여부입니다.'

이 문장을 잠시 곱씹어 보십시오. 모든 이들이 병목 현상의 원인이라고 가정하는 GPU를 판매하는 기업인 NVIDIA가, 연산 (compute)과 모델 품질이 통신사의 발목을 잡고 있는 것이 아니라고 공개적으로 밝히고 있습니다. 바로 조정 (coordination)이 문제라는 것입니다. 이는 전체 발표 내용 중 가장 중대한 문장입니다.

이 게시물은 통신 사업자들이 대부분 TM Forum 자율 네트워크 (autonomous networks) 레벨 2-3 단계에 머물러 있다고 주장합니다. 이 단계에서의 자동화는 '선택된 네트워크 도메인 내에서 미리 정의된 솔루션의 실행을 효율화'하는 수준입니다. 레벨 4-5에 도달하려면 '운영자의 의도를 이해하고, 실시간으로 네트워크를 감지하며, 계획을 연구 및 개발하고, 트레이드오프 (trade-offs)를 검토하며, 도메인 전반에 걸쳐 통제된 행동을 조정할 수 있는' 에이전트가 필요합니다. 이는 단순히 더 빠른 스크립트를 실행하는 것과는 질적으로 다른 문제입니다. 동일한 아키텍처의 변화가 Ericsson 및 McKinsey의 통신 부문의 산업 분석에서도 기록되어 있습니다.

여기에 도달하기 위해, NVIDIA는 명명된 구체적인 빌딩 블록 (building blocks)으로 구성된 통합된 **통신 자율성 플랫폼 (telco autonomy platform)**을 소개합니다:

NeMo Data Designer 및 NeMo Safe Synthesizer — 합성 데이터 생성 (synthetic data generation) 및 민감한 기록의 익명화 (anonymization).
Nemotron — 통신 데이터셋으로 미세 조정 (fine-tuned)된 추론 모델 (reasoning models).
NV-Tesseract — 네트워크 감지를 위한 시계열 분석 (time-series analysis).
Agent Toolkit — 에이전트 오케스트레이션 (agent orchestration).
OpenShell — 보안 실행 런타임 (secure execution runtimes).
NemoClaw 및 AI-Q — 에이전트 거버넌스 (agent governance) 및 심층 연구 (deep research).

언급된 실제 응용 사례들은 구체적입니다: 심층 연구 및 장기 실행 에이전트 (long-running agents)를 사용하여 SR-MPLS 네트워크에서 자율적인 이상 탐지 (anomaly detection) 및 복구 (remediation)를 수행하는 것, 그리고 NVIDIA AI Telco Engineer를 통해 AI 기반 무선 네트워크 알고리즘을 발견하는 것입니다. 이것은 단순한 사고 실험에 관한 글이 아닙니다. 이것은 참조 아키텍처 (reference architecture)입니다.

NVIDIA는 모델의 품질이 더 이상 제약 사항이 아니라고 명시적으로 밝히고 있습니다. 시니어 엔지니어들에게 이는 모든 로드맵을 재설정하게 만듭니다: 모델의 벤치마킹을 멈추고, 여러분의 에이전트가 정책 (policy) 하에 여러 도메인에 걸쳐 루프를 닫을 (close loops) 수 있는지 측정하기 시작하십시오.

L2-3
오늘날 대부분의 통신 자동화가 TM Forum의 자율성 척도(autonomy scale) 상에 위치한 지점
[TM Forum, 2026](https://www.tmforum.org/oda/autonomous-networks/)
...

이것은 무엇인가: 자율 네트워크를 위한 에이전트형 AI (Agentic AI), 쉬운 설명

전문 용어를 걷어내 봅시다. 현대의 통신 네트워크는 라우터, 무선 장치, 광섬유, 고객 세션 등 매초 신호를 생성하는 수백만 개의 움직이는 부품들로 이루어져 있습니다. 전통적으로 네트워크 운영 센터 (Network Operations Center)의 사람들은 대시보드를 지켜보고, 런북 (runbooks)을 따르며, 문제를 해결합니다. 자동화가 도움을 주긴 했지만, 누군가가 이미 스크립트를 작성해 놓은 문제에 대해서만 가능했습니다. 그 외의 모든 것은 여전히 사람의 몫으로 남습니다.

에이전트형 AI (Agentic AI)는 작업의 단위를 '이 스크립트를 실행하라'에서 '이 의도를 달성하라'로 변화시킵니다. 운영자가 시스템에 단계별로 정확히 무엇을 할지 지시하는 대신, '에너지 비용을 절감하면서 지연 시간(latency)을 X 미만으로 유지하라'고 말하면, 일련의 AI 에이전트들이 네트워크를 감지하고, 옵션을 조사하며, 트레이드오프 (trade-offs)를 검토하고, 실행하며, 결과를 관찰함으로써 그 방법을 찾아냅니다. 이것은 챗봇 (chatbot)이 아닙니다. 그것은 운영 파트너 (operational peer)입니다.

NVIDIA는 세 가지 종류의 에이전트를 정의합니다:

온디맨드 에이전트 (On-demand agents) — 제한된 작업을 처리합니다: 구성 변경 적용, NOC 스크립트 실행, 고객 지원 질문 답변 등. 한 번의 실행으로 즉시 완료됩니다.
롱러닝 에이전트 (Long-running agents) — 시간에 따라 문제와 함께 머무르며, 지속적으로 네트워크를 감지하고, 시스템 전반에 걸쳐 작업을 검증 및 조정하며, 언제 에스컬레이션 (escalate), 롤백 (roll back), 또는 재최적화 (re-optimize)를 할지 결정합니다. 이들은 운영의 신뢰성을 유지해 주는 존재입니다.
딥 리서치 에이전트 (Deep research agents) — 단일 해결책을 반환하는 대신, 데이터, 도구, 디지털 트윈 (digital twins) 전반으로 범위를 넓혀 대안 계획을 제안, 검증 및 순위를 매김으로써 알려진 답변 너머를 탐색합니다.

AI 에이전트로 승리하는 기업은 가장 많은 GPU를 보유한 기업이 아니라, 조정 격차 (coordination gap)를 해소한 기업입니다.

이것은 지구상에서 가장 까다로운 생산 환경 중 하나에 적용된 에이전트형 AI (agentic AI)입니다. 이는 멀티 에이전트 시스템 (multi-agent systems)을 향한 광범위한 산업계의 변화와 명확하게 일치합니다. 차이점은 통신사들이 실제 인프라에서 환각 (hallucination)된 동작을 감수할 여유가 없기 때문에, 거버넌스 (governance)가 무언가 고장 난 후에 덧붙여지는 것이 아니라 처음부터 내장되어 있다는 점입니다. 기초적인 어휘가 생소하다면, 여기서 더 깊이 들어가기 전에 AI 에이전트의 실제 정체에 관한 입문서에서 기본 개념을 다루고 있습니다.

Three types of agents — on-demand, long-running, and deep research — collaborating in a telecom NOC

NVIDIA 프레임워크의 세 가지 에이전트 유형. 온디맨드 에이전트(On-demand agents)는 실행하고, 롱러닝 에이전트(Long-running agents)는 지속 및 관리하며, 딥 리서치 에이전트(Deep research agents)는 발견합니다. 이들이 함께 AI 조정 격차(AI Coordination Gap)를 해소합니다.

작동 원리: 문제-해결 루프와 플랫폼 아키텍처

NVIDIA의 사고 모델은 문제-해결 루프(Problem-solution loop)입니다. 모든 운영 문제는 세 가지 패턴 중 하나에 해당하며, 각 패턴은 서로 다른 에이전트 조합으로 라우팅(Routing)됩니다. 라우팅이 잘못되면 이미 알려진 해결책에 딥 리서치 역량을 낭비하거나, 더 심각하게는 해당 런북(Runbook)이 작성된 적 없는 문제에 대해 런북을 실행하려고 시도하게 됩니다.

세 가지 문제 패턴

발생한 문제, 알려진 해결책 (실행 경로 [execute path]): 고객 티켓이나 감지된 이상 징후와 같은 의도 또는 이벤트가 전문가의 절차 및 과거 사례에서 도출된 확립된 '추론 트레이스(Reasoning trace)'와 명확하게 매핑됩니다. 이 패턴은 스크립트나 런북과 매칭되어 온디맨드 에이전트에 의해 실행되거나, 해결책이 시간이 지남에 따라 적용 및 검증되어야 하는 경우 롱러닝 에이전트의 루프에 통합됩니다.
알려진 해결책, 미지의 최적화 (최적화 경로 [optimize path]): 도메인은 이해되어 있으나, 운영자가 에너지 효율, 지연 시간(Latency), 회복 탄력성(Resilience), 비용과 같은 측정 가능한 목표에 대해 더 나은 결과를 원하는 경우입니다. 에이전트는 딥 리서치 기술을 호출하여 순위가 매겨진 최적화 계획을 생성하며, 롱러닝 에이전트는 정책에 따라 선택된 계획을 적용하고, 시간에 따른 영향을 모니터링하며, 반복(Iteration)하거나 롤백(Rollback)함으로써 루프를 완성합니다.
발생하지 않은 문제 (발견 경로 [discovery path]): 일부 문제는 기존의 추론 트레이스와 일치하지 않습니다. 에이전트는 딥 리서치를 사용하여 무슨 일이 일어나고 있는지 특성화하고, 여러 도메인에 걸쳐 신호를 상관 분석하여 생소한 패턴을 명확하게 정의된 문제로 전환합니다. 이후 온디맨드 에이전트가 개별적인 조치를 취하는 동안, 롱러닝 에이전트는 더 긴 범위의 복구(Recovery)를 관리합니다.

우아한 부분은 다음과 같습니다. 발견 계획(discovery plans)이 새로운 기술(skills)로 코드화됨에 따라, "한때 연구가 필요했던 문제들이 관리 가능한 실행 경로(governed execution paths)가 될 수 있으며, 시간이 지남에 따라 운영자의 재사용 가능한 자율성 라이브러리(reusable autonomy library)를 확장합니다." 시스템은 실행될수록 운영 비용이 저렴해집니다. 이것이 바로 복리 효과입니다. 저는 이러한 경제적 논리를 어떤 CFO에게라도 제시할 것입니다.

통신 자율성 문제-해결 루프 (NVIDIA 참조 흐름)

  1

    **감지 (Sense) (NV-Tesseract)**

네트워크의 시계열 텔레메트리(Time-series telemetry)가 실시간으로 수집됩니다. 이상 징후(Anomalies), 드리프트(drift), 그리고 이벤트들이 신호(signals)로 나타납니다.

↓

  2
...

신호는 추론 추적(reasoning-trace) 라이브러리와 대조됩니다. 이것이 실행(execute), 최적화(optimize), 또는 발견(discover) 중 무엇인지 판단합니다. 이 라우팅(routing) 결정이 어떤 에이전트들이 참여할지를 결정합니다.

↓

  3
...

최적화/발견 경로의 경우, 심층 연구 에이전트(deep research agents)가 데이터, 도구, 그리고 디지털 트윈(digital twins) 전반으로 퍼져나가 후보 계획들을 제안하고 순위를 매깁니다.

↓

  4
...

계획은 실제 인프라에 적용하기 전에 디지털 트윈을 통해 시뮬레이션됩니다. 이는 L4-5 수준의 자율성을 수용 가능하게 만드는 안전 게이트(safety gate) 역할을 합니다.

↓

  5
...

선택된 계획은 오케스트레이션(orchestrated) 및 거버넌스(governed)를 거쳐 보안 런타임(secure runtime) 내에서 실행됩니다. 온디맨드 에이전트(On-demand agents)는 조치를 취하고, 롱러닝 에이전트(long-running agents)는 해당 문제에 계속 머뭅니다.

↓

  6
...

롱러닝 에이전트는 영향을 모니터링하고, 회귀(regression) 발생 시 롤백(roll back)하며, 성공적인 추적(traces)을 재사용 가능한 기술(skills)로 코드화하여 자율성 라이브러리를 성장시킵니다.

이 루프는 왜 모델의 품질이 아니라 조정(coordination)이 제약 사항인지를 보여줍니다. 모든 단계는 에이전트, 도구, 그리고 트윈 간의 공유 상태(shared state)에 의존하기 때문입니다.

플랫폼 아키텍처

그 중심에는 '통신 도메인 모델(telecom-domain models)과 에이전트 하네스(agent harness)를 기반으로 구축되어, 보안 실행 런타임(secure execution runtime) 내에서 실행되며 도구, 디지털 트윈(digital twins), 공유 기술(shared skills)에 연결된' 통신 에이전트들이 자리 잡고 있습니다. 데이터 계층은 선택 사항이 아닙니다. NVIDIA는 '고품질의 네트워크 및 고객 데이터가 통신 인지 AI 에이전트(telecom-aware AI agents)의 토대'라고 명시하며, NeMo Data Designer와 NeMo Safe Synthesizer를 사용하여 '합성 데이터(synthetic data)를 생성하고 민감한 기록을 익명화함으로써, 프라이버시를 보호하는 동시에 실제 환경과 유사한 데이터셋의 양과 다양성을 높인다'고 설명합니다.

그 후 Nemotron 추론 모델(reasoning models)은 '이러한 데이터셋을 통해 추가적인 미세 조정(fine-tuning)'을 거칩니다. 이는 교과서적인 합성 데이터와 미세 조정 (fine-tuning)의 결합이며, 디지털 트윈과 도구 액세스가 실행 시점(runtime)에서 검색 방식의 근거(retrieval-style grounding)를 제공합니다. 특별히 생소한 기술은 아닙니다. 핵심은 어느 한 부분만을 고립시켜 수행하는 것이 아니라, 이 모든 과정을 통합적으로 수행하는 규율에 있습니다. NVIDIA의 자체 NeMo Framework 문서에는 미세 조정 메커니즘이 자세히 설명되어 있습니다.