프로토콜 전쟁이 다가오고 있습니다 — 당신의 AI 에이전트에는 중립적인 ID가 필요합니다
요약
AI 에이전트 생태계 내 다양한 프로토콜(MCP, ARD, A2A 등) 간의 주도권 경쟁과 그로 인한 파편화 문제를 다룹니다. 특히 프로토콜 간 경계를 넘나드는 에이전트의 신뢰성 검증 및 중립적 신원 확인 메커니즘의 부재를 핵심 과제로 지적합니다.
핵심 포인트
- MCP, ARD, A2A 등 다양한 에이전트 프로토콜 간의 표준화 경쟁 심화
- 프로토콜 파편화로 인한 에이전트 신뢰 검증 및 상호 운용성 문제 발생
- 에이전트 생존율 및 신뢰도 격차가 플랫폼별로 매우 크게 나타남
- 프로토콜 경계를 넘나드는 중립적인 신원 및 신뢰 검증 메커니즘 필요
2026년 6월 30일
조용한 전쟁이 AI 에이전트 생태계를 재편하고 있습니다. 6개월 전만 해도 걱정해야 할 프로토콜은 단 하나였습니다. 하지만 이제는 최소 네 개의 주요 프로토콜이 주도권을 잡기 위해 싸우고 있으며, 이들은 서로 다른 의도를 가진 조 단위 달러 규모의 기업들의 지원을 받고 있습니다.
6월 19일, Google과 Microsoft는 Hugging Face, Salesforce, NVIDIA 및 8개 기업과 힘을 합쳐 ARD (Agentic Resource Discovery)를 출시했습니다. OpenAI와 Anthropic은요? 그들은 서명하지 않았습니다. 초대조차 받지 못했습니다.
일주일 후, 중국은 신원(identity), 발견(discovery), 그리고 에이전트 간 협업(cross-agent collaboration)을 아우르는 AI 에이전트 상호 연결을 위한 7가지 국가 표준을 발표했습니다. 완전히 평행한 우주가 펼쳐진 것입니다.
한편, Anthropic의 MCP는 여전히 추진력을 얻고 있습니다. Salesforce의 Agentforce는 A2A를 밀어붙이고 있습니다. 그리고 모두가 자신의 프로토콜이 "개방형 표준(open standard)"이라고 주장합니다.
문제는 이것입니다: 이 프로토콜들이 필연적으로 파편화될 때, 어떤 플랫폼의 어떤 에이전트가 실제로 신뢰할 수 있는지 누가 당신에게 알려줄 것인가 하는 점입니다.
프로토콜 알파벳 수프 (The Protocol Alphabet Soup)
실제로 무슨 일이 일어나고 있는지 번역해 드리겠습니다:
| 프로토콜 | 후원사 | 중점 사항 | 제외된 곳 |
|---|---|---|---|
| MCP | Anthropic | 도구 호출 (Tool calling) | Google, Microsoft, OpenAI |
| ... |
각 프로토콜은 실제 문제를 해결합니다. MCP는 모델이 도구에 연결되도록 합니다. A2A는 에이전트들이 서로 대화할 수 있게 합니다. ARD는 에이전트가 다른 에이전트를 찾는 것을 돕습니다. AIP는 신원에서 협업에 이르기까지 모든 것을 표준화하는 것을 목표로 합니다.
하지만 이들이 해결하지 못하고 있는 것이 있습니다: 바로 프로토콜 경계를 넘나드는 신뢰 검증 (trust verification) 입니다.
프로토콜 표준의 신뢰 격차
모든 프로토콜은 신뢰가 다른 곳에서 처리된다고 가정합니다. ARD는 에이전트를 발견합니다. MCP는 도구에 연결합니다. A2A는 통신을 가능하게 합니다. 하지만 그 중 어느 것도 다음과 같이 묻지 않습니다: "이 에이전트가 실제로 주장하는 바를 수행했는지 어떻게 알 수 있는가?"
AgentRisk에서 우리는 여러 플랫폼에 걸쳐 230만 개 이상의 에이전트를 인덱싱했습니다. 우리가 관찰한 결과는 다음과 같습니다:
- 269,334개의 에이전트가 해당 플랫폼에서 상장 폐지(delisted)되었습니다.
- **추적된 모든 에이전트의 28%**가 더 이상 응답하지 않습니다.
- 단 **81,319개의 에이전트(3.5%)**만이 T1 (신뢰할 수 있는) 상태를 획득했습니다.
- 플랫폼 신뢰도는 149배까지 차이가 납니다 — 일부 플랫폼은 에이전트 생존율이 거의 0%에 가깝습니다.
이것은 예외적인 사례가 아닙니다. 이것이 현재 에이전트 생태계의 기본 현실입니다.
그리고 개발자가 에이전트를 발견하기 위해 ARD를 채택하거나, 도구를 연결하기 위해 MCP를 채택할 때, 다음과 같은 사항을 검증할 수 있는 내장된 메커니즘은 없습니다:
- 이 에이전트가 실제로 주장하는 작업을 수행했는가?
- 이 에이전트가 상장 폐지되었거나 아카이브되었는가?
- 다른 플랫폼에 있는 유사한 에이전트들과 비교했을 때 어떠한가?
중립적 관찰자의 문제 (The Neutral Observer Problem)
프로토콜 전쟁은 예측 가능한 패턴을 보입니다: 각 플레이어는 자신의 생태계에 유리한 신뢰 메커니즘을 구축합니다.
Google의 ARD는 Google Cloud 내의 에이전트를 검증합니다. Anthropic의 MCP는 Claude 통합을 검증합니다. 중국의 AIP는 국가 표준에 따라 검증합니다.
만약 당신이 크로스 플랫폼 (cross-platform) 에이전트 시스템을 구축하고 있다면, 다음과 같은 선택에 직면하게 됩니다:
- 각 플랫폼의 네이티브 검증을 신뢰한다 (이해 상충 발생)
- 자체적인 검증 레이어 (verification layer)를 구축한다 (비용이 많이 들고 지속적인 유지보수 필요)
- 최선의 결과가 나오기를 바란다
3번 옵션은 대부분의 개발자가 하고 있는 방식입니다. 그리고 그것은 제대로 작동하지 않고 있습니다.
Nesbitt의 연구는 개발자들이 의심해 왔던 사실을 입증했습니다: 에이전트의 77.6%가 기만적인 설명에 의해 오도될 수 있습니다. 플랫폼의 신뢰 배지, 인증, 평점은 빈번하게 잘못되어 있거나, 정확도 최적화보다는 게임화(gaming) 최적화되어 있습니다.
크로스 프로토콜 신뢰 검증에 실제로 필요한 것
우리는 평점 시스템에 대해 이야기하는 것이 아닙니다. 평점 시스템은 조작되거나, 구매되거나, 단순히 부정확할 수 있습니다.
생태계에 진정으로 필요한 것은 다음과 같습니다:
-
행동 기반 증거 체인 (Behavior-based evidence chains): "이 에이전트는 신뢰할 수 있다고 말한다"가 아니라, "이 에이전트가 실제로 무엇을 했는지에 대한 타임스탬프가 찍힌 검증 가능한 기록"이 필요합니다.
-
프로토콜 불가지론적 신원 (Protocol-agnostic identity): 에이전트의 이력은 특정 플랫폼의 레지스트리에 종속되는 것이 아니라, 에이전트와 함께 이동할 수 있어야 합니다.
-
독립적인 해시 앵커링 (Independent hash anchoring): 어떤 당사자라도 증거가 사후에 변경되지 않았음을 검증할 수 있어야 합니다.
-
신뢰도 보정 점수 (Confidence-calibrated scoring): 비즈니스를 따내기 위해 부풀려진 점수가 아니라, 우리가 알고 있는 것과 알지 못하는 것에 대한 정직한 인정을 의미합니다.
이것이 바로 AgentRisk가 메우기 위해 구축된 격차입니다. 우리는 에이전트가 어떤 프로토콜을 구현하든 상관없이, 플랫폼 전반에 걸친 에이전트 생존, 성능 이벤트 및 행동 신호를 추적합니다.
다가오는 통합 (The Coming Consolidation)
역사적으로 프로토콜 전쟁은 다음 두 가지 방식 중 하나로 끝났습니다:
- 단일 승자 (TCP/IP와 같은 경우)
- 프로토콜 간의 차이를 추상화하는 상호 운용성 계층 (Interoperability layers) (이메일이 Gmail, Outlook, 기업용 서버 간에 여전히 작동하는 방식과 같은 경우)
AI 에이전트의 경우, 두 번째 경로가 더 현실적입니다. 너무나 많은 강력한 플레이어들이 자신들의 프로토콜에 막대한 투자를 하고 있기 때문에, 단일 표준이 승리하기는 어렵습니다.
하지만 상호 운용성 계층에는 중립적인 관찰자가 필요합니다. 누군가는 "이 MCP 등록 에이전트"를 "당신이 배포한 A2A 에이전트와 비교했을 때의 상태"로 번역해 주어야 합니다.
그것이 바로 우리가 지향하는 역할입니다. 프로토콜 전쟁에서 어느 한 편을 드는 것이 아니라, 어떤 프로토콜 스택이라도 실행 가능하게 만드는 신뢰 인프라를 제공하는 것입니다.
개발자에게 의미하는 바
만약 당신이 오늘날 어떤 에이전트 플랫폼에서든 개발을 하고 있다면:
-
프로토콜 채택이 품질을 의미한다고 가정하지 마세요: ARD에 등록된 에이전트는 검증된 것이 아니라, 단지 발견된 것뿐입니다.
-
에이전트의 생존 여부를 독립적으로 추적하세요: 플랫폼은 중단될 수 있습니다. 에이전트는 목록에서 제외될 수 있습니다. 당신의 모니터링은 플랫폼에 독립적(platform-independent)이어야 합니다.
-
에이전트 선택 로직에 신뢰 검증을 구축하세요: 특정 에이전트를 확정하기 전에 여러 신뢰 신호(trust signals)를 조회하세요.
-
프로토콜 전환에 대비하세요: 오늘 MCP와 함께 작동하는 에이전트가 내일은 A2A 지원을 필요로 할 수도 있습니다. 당신의 신뢰 계층(trust layer)은 이식 가능(portable)해야 합니다.
데이터는 거짓말을 하지 않습니다
다음은 우리의 현재 스냅샷(2026년 6월 30일)입니다:
추적된 총 에이전트 수: 2,300,349
T1 (신뢰할 수 있는 단계): 81,319 (3.5%)
T2 (탐색 단계): 1,551,611 (67.4%)
...
T2/T3 상태인 에이전트가 거의 100만 개에 달합니다. 이들 중 상당수는 여전히 운영 시스템(production systems)에서 실행되며 오류를 발생시키거나, 단순히 응답하지 않고 있습니다. 그 이유는 아무도 그들이 여전히 살아있는지 확인하려 하지 않았기 때문입니다.
프로토콜 전쟁이 다가오고 있습니다. 하지만 신뢰의 격차는 바로 지금 여기에 존재합니다.
AgentRisk 소개
AgentRisk는 AI 에이전트를 위한 독립적인 신뢰 계층(trust layer)을 구축하고 있습니다. 우리는 에이전트가 어떤 프로토콜을 구현하든 상관없이, 플랫폼 전반에 걸쳐 에이전트의 생존, 성능 이벤트 및 행동 신호를 추적합니다.
현재 실시간 생존 모니터링과 신뢰도 보정된 신뢰 점수(confidence-calibrated trust scores)를 통해 230만 개 이상의 에이전트를 인덱싱하고 있습니다.
AgentRisk — 당신의 에이전트, 검증 완료
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기