신뢰할 수 없는 에이전트를 신뢰할 수 있는가? ERC-8004 탈중앙화 AI 에이전트 생태계에 대한 실증적 연구
요약
ERC-8004 프로토콜을 통해 탈중앙화 AI 에이전트 생태계의 신뢰 계층을 실증적으로 분석한 연구입니다. Ethereum, BSC, Base 체인을 대상으로 신원, 평판, 검증 시스템의 취약점과 Sybil 공격 가능성을 조사했습니다.
핵심 포인트
- ERC-8004의 온체인 신원 등록 중 실제 서비스와 연결된 비율이 매우 낮음
- 현재의 평판 시스템은 조작이 쉽고 신뢰할 수 있는 신호로 기능하기 어려움
- 대다수의 리뷰어가 조직적인 Sybil 행위를 보이는 것으로 확인됨
- AI 에이전트 경제를 위한 프로토콜 설계 개선 방향 및 기준점 제시
자율적인 AI 에이전트들이 조직의 경계를 넘어 거래하는 일이 점점 늘어남에 따라, 근본적인 신뢰의 과제가 발생하고 있습니다. 즉, 에이전트가 미지의 상대방이 신뢰할 수 있는지 어떻게 평가할 수 있는가 하는 문제입니다. ERC-8004 프로토콜은 Identity(신원), Reputation(평판), Validation(검증)을 위한 세 가지 온체인 레지스트리(on-chain registries)를 중심으로 구축된, AI 에이전트 경제를 위한 최초의 허가 없는(permissionless) 신뢰 계층을 통해 이 과제를 해결하고자 합니다. 빠른 채택에도 불구하고, 이 프로토콜에 대한 실증적인 연구는 이루어지지 않았으며, 프로토콜이 기록하는 정보가 의사결정을 위한 신뢰할 수 있는 근거를 제공하는지는 불분명한 상태로 남아 있습니다.
이러한 공백을 메우기 위해, 우리는 프로토콜 배포부터 2026년 5월 13일까지의 기간을 대상으로 Ethereum, BNB Smart Chain (BSC), Base의 세 가지 체인에 걸친 ERC-8004의 첫 번째 실증적 연구를 제시합니다. 우리는 온체인 Identity 및 Reputation 이벤트, 오프체인 파일, 그리고 x402 결제 트랜잭션을 크롤링했습니다. Identity 측면에서, 우리는 대부분의 등록이 활성 에이전트라기보다는 플레이스홀더(placeholders)라는 것을 발견했으며, 유효한 ERC-8004 등록 파일을 최소 하나 이상의 라이브 서비스 엔드포인트와 함께 노출하는 비율은 매우 낮았습니다 (Ethereum, BSC, Base에서 각각 3%, 4%, 15%).
Reputation 측면에서, 우리는 현재 배포된 상태의 레지스트리가 신뢰 신호로서 기능할 수 없음을 보여줍니다. 값들은 서로 비교 가능하지 않으며, 피드백 기록은 검증 가능한 상호작용에 근거하는 경우가 드물고, 평판은 최소한의 비용으로 조작될 수 있습니다. 이러한 설계상의 약점과 일치하게, 우리는 상당수의 리뷰어(Ethereum, BSC, Base에서 각각 73.6%, 59.2%, 90.6%)가 조직적인 Sybil(시빌) 행위를 보인다는 것을 발견했습니다. Sybil로 표시된 피드백을 제거한 후, 평가된 에이전트 중 각각 15.5%, 72.3%, 89.4%가 유효한 피드백이 없는 상태로 남게 됩니다.
그 후 우리는 이러한 발견을 ERC-8004의 향후 수정을 위한 구체적인 권고 사항으로 전환합니다. 우리의 연구는 실행 가능한 프로토콜 설계 함의를 도출하며, AI 에이전트 시장 연구를 위한 실증적 기준점(baseline)을 수립합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기