Amazon Bedbedrock AgentCore 웹 검색: 아키텍처, 설정 및 RAG보다 뛰어난 경우

원래 twarx.com에서 게시되었습니다 - 전체 대화형 버전은 그곳에서 읽어보세요.

최종 업데이트: 2026년 6월 19일

여러분의 팀이 2026년 6월 이전에 출시한 모든 AI 에이전트는 AWS가 방금 공식적으로 인정한 구조적 결함 상태로 작동하고 있습니다. 그리고 이 해결책은 지난 3개월간의 RAG (Retrieval-Augmented Generation, 검색 증강 생성) 파이프라인 엔지니어링을 값비싼 임시 가설물처럼 보이게 만듭니다. Amazon Bedrock AgentCore 웹 검색은 단순히 도구 호출 (tool call)을 추가하는 것이 아니라, 대부분의 기업 팀이 여전히 구축 목표로 삼고 있는 아키텍처를 퇴출시킵니다. 만약 여러분의 에이전트가 여전히 고정된 학습 데이터에 의존하고 있다면, 이것이 여러분의 로드맵을 바꿀 출시 소식입니다.

2026년 6월 17일 AWS Summit New York 2026에서 Channy Yun에 의해 발표된 Amazon Bedrock AgentCore의 웹 검색은 실시간 검색 (live retrieval)을 AgentCore 런타임 (Runtime) 내부에 네이티브하게 내장합니다. Serper, Tavily, 혹은 별도의 오케스트레이션 접착제 (orchestration glue)가 필요 없습니다. 지식 차단 (knowledge-cutoff) 벽은 기업용 에이전트에 대한 불신의 가장 큰 원인이기 때문에 지금 이 기술이 중요합니다.

이 가이드를 마칠 때쯤 여러분은 아키텍처를 이해하고, 단계별로 이를 구현하며, 정확히 언제 RAG를 유지해야 하는지 알게 될 것입니다.

Amazon Bedrock AgentCore web search architecture diagram showing live retrieval inside AgentCore Runtime

Amazon Bedrock AgentCore 웹 검색은 실시간 검색을 별도로 부착된 API가 아닌 네이티브 런타임 기능으로 배치합니다. 이것이 이번 출시의 핵심적인 아키텍처 변화입니다. 출처

Amazon Bedrock AgentCore 웹 검색이란 무엇인가? (이 기술이 실제로 해결하는 문제)

Amazon Bedrock AgentCore 웹 검색 (web search)은 프로덕션 에이전트가 실시간 웹 콘텐츠를 쿼리하고, 출처 표기 (source attribution)와 함께 해당 콘텐츠를 기반으로 답변을 근거화 (grounding)하며, IAM 범위가 지정되고 세션이 격리된 실행 환경 내에서 이를 수행할 수 있도록 하는 관리형, 런타임 네이티브 검색 기능 (retrieval capability)입니다. 짧게 요약하자면, 여러분의 에이전트가 학습 중단 시점 (training cutoff) 이후의 세상에 대해 추측하는 것을 멈추고, 직접 읽기 시작하는 것입니다.

지식 동결 문제 (The Knowledge Freeze Problem): 여러분이 출시한 모든 에이전트가 구조적 결함을 가진 이유

대부분의 팀이 출시 3주 후에 발견하게 되는 불편한 진실이 있습니다. 기술적으로 인상적인 에이전트와 운영 측면에서 쓸모없는 에이전트가 동일한 에이전트일 수 있다는 점입니다. 그 차이는 바로 '시간'입니다. 2025년 12월을 학습 중단 시점으로 하여 훈련된 에이전트는 첫날에는 매우 훌륭하지만, 그 이후 매일 조용히 성능이 저하됩니다. 이는 모델의 가중치 (weights)가 변해서가 아니라, 현실이 변하기 때문입니다.

명명된 프레임워크 (Coined Framework)

지식 동결 문제 (The Knowledge Freeze Problem) — 에이전트의 지능은 기술적으로 인상적이지만, 세계 모델 (world model)이 학습 중단 시점에서 업데이트를 멈춤으로써 운영 측면에서 쓸모없게 되는 구조적 실패 모드. 이는 에이전트가 프로덕션에서 실행되는 매일 확산되는 '확신-환각 간극 (confidence-hallucination gap)'을 생성함

이 용어는 모든 정적 지식 에이전트 (static-knowledge agent)의 핵심 결함을 지칭합니다. 즉, 모델은 유창하고 자신감 있게 답변을 유지하지만 사실 관계는 부식되어 가며, 그 결과 모델이 들리는 확신 정도와 실제 정확도 사이의 간극이 시간이 지날수록 벌어집니다. 웹 근거화 (Web grounding)는 이를 해결할 수 있는 유일한 구조적 해결책입니다. 재학습 (retraining)은 단지 시계 바늘을 초기화할 뿐입니다.

지식 동결 문제는 프롬프트 (prompt)로 해결할 수 있는 환각 버그 (hallucination bug)가 아닙니다. 이는 아키텍처 (architectural)의 문제입니다. 에이전트에게는 자신이 오래되었다는 것을 인지할 내부 메커니즘이 없으므로, 2026년 6월의 사건에 대해 확립된 역사적 사실에 대해 답변할 때와 동일한 자신감으로 답변합니다. 규제 산업 (regulated industries)에서 이러한 자신감은 곧 리스크 (liability)가 됩니다. 원문 RAG 논문의 검색 근거화 (retrieval grounding) 연구는 왜 사실 관계의 최신성 (factual currency) 측면에서 외부 지식 주입 (external knowledge injection)이 파라미터 메모리 (parametric memory)보다 우월한지를 입증했습니다.

정적인 에이전트는 시간이 흐른다고 해서 더 멍청해지지는 않습니다. 대신 더 확신에 차서 틀리게 됩니다. 그리고 그 확신은 기업 사용자들이 뒤통수를 맞는 그날까지 신뢰하는 바로 그 요소입니다.

AWS Summit New York 2026에서 AWS가 공식 발표한 내용

2026년 6월 17일, AWS는 AWS Context 및 AWS Continuum도 함께 공개된 광범위한 AgentCore 확장 프로그램의 일부로, Amazon Bedrock AgentCore Runtime 내에서 웹 검색 (web search)을 일급 기능 (first-class capability)으로 발표했습니다. Channy Yun의 출시 포스트는 그 동기를 직접적으로 설명합니다. 바로 프로덕션 에이전트 (production agents)를 위한 지식 컷오프 (knowledge cutoff) 문제를 제거하는 것입니다. AWS 내부 문서에서는 지식 동결 문제 (Knowledge Freeze Problem)가 설명하는 것과 동일한, 컷오프 이후 측정 가능한 정확도 저하 (accuracy decay)를 핵심 동기로 언급하고 있습니다. 전체 기능 상세 내용은 공식 AgentCore 제품 페이지에서 확인할 수 있습니다.

AgentCore 웹 검색이 단순한 API 도구 호출 (Tool Call)과 다른 점

만약 여러분이 LangGraph나 CrewAI로 구축해 보았다면, Tavily나 SerpAPI 도구를 직접 연결해 보았을 것입니다. 이는 여러분이 인증 (authentication), 속도 제한 (rate limits), 결과 포맷팅 (result formatting), 그리고 그라운딩 로직 (grounding logic)이라는 네 가지 계층을 직접 관리해야 함을 의미합니다. AgentCore는 이 네 가지를 모두 추상화합니다. 웹 검색은 여러분의 Claude 또는 Nova 에이전트가 이미 사용 중인 것과 동일한 MCP (Model Context Protocol) 도구 계층을 통해 노출됩니다. 즉, 외부 오케스트레이션 접착제 (orchestration glue)도, 인증 로테이션 (auth rotation)도, 수동 청크 포맷팅 (manual chunk formatting)도 필요하지 않습니다.

차이점은 편의성이 아니라 출처 (provenance)에 있습니다. 가공되지 않은 SerpAPI 호출은 여러분의 코드가 포맷팅하고 신뢰해야 하는 JSON 블롭 (JSON blob)을 반환합니다. 반면 AgentCore는 검색된 콘텐츠를 출처 속성 메타데이터 (source attribution metadata)를 온전하게 유지한 채 모델 컨텍스트 (model context)에 주입합니다. 따라서 인용 (citations) 정보가 조용히 병합되어 사라지는 대신, 왕복 과정 (round trip)을 거쳐도 그대로 살아남습니다.

AgentCore 웹 검색의 배후 아키텍처: 내부에서 실제로 일어나는 일

이를 책임감 있게 배포하려면 검색 (retrieval)이 어디에 위치하는지, 그라운딩 (grounding)이 어떻게 강제되는지, 그리고 왜 MCP가 중요한지를 알아야 합니다. 이것이 바로 대부분의 출시 보도에서 생략된 시스템 계층 (systems layer)에 대한 이야기입니다.

AgentCore 런타임 스택에서 웹 검색(Web Search)의 위치

AgentCore Runtime은 세션 수준의 격리(session-level isolation)를 제공합니다. 즉, 각 사용자 세션은 고유한 컨테이너 경계(container boundary) 내에서 실행됩니다. 이는 단순한 부연 설명이 아니라, 웹 검색이 기업 환경에서 안전하게 사용될 수 있는 이유입니다. 검색된 결과는 세션별로 범위(scope)가 지정되어 에이전트 인스턴스 간에 유출될 수 없습니다. 만약 사용자 A의 에이전트가 기밀 M&A 루머를 검색하더라도, 해당 결과는 사용자 B의 컨텍스트(context)를 절대 오염시키지 않습니다. 범위 지정이 제대로 되지 않은 글로벌 캐시(global cache)가 테넌트(tenant) 간에 검색 상태를 유출할 수 있는 공유 LangGraph 프로세스와 비교해 보십시오.

AgentCore 웹 검색 요청 라이프사이클 (세션 격리형)

  1

    **사용자가 에이전트 호출 (AgentCore Runtime)**

요청이 격리된 세션 컨테이너로 진입합니다. IAM 역할(role)은 웹 검색을 포함하여 에이전트가 호출할 수 있는 도구(tool)의 범위를 지정합니다.

↓

  2
...

모델이 MCP 호환 도구 호출(tool call)을 생성합니다. 개발자가 작성한 오케스트레이션(orchestration)이 이를 결정하는 것이 아니라, 모델이 실시간 데이터가 필요한지 여부를 스스로 추론합니다.

↓

  3
...

AgentCore가 인증(auth), 속도 제한(rate limits), 도메인 허용 목록(domain allowlist) 필터링 및 결과 제한을 처리합니다. 결과 수에 따라 약 800ms~2.5s의 시간이 추가됩니다.

↓

  4
...

검색된 콘텐츠는 소스 URL 및 신뢰도 신호(confidence signals)와 함께 태그되어 컨텍스트 윈도우(context window)에 진입합니다. 출처(provenance)가 병합되지 않고 보존됩니다.

↓

  5
...

모델이 출처를 인용하는 답변을 생성합니다. AgentCore Evaluations를 통해 검색된 콘텐츠에 대한 사실적 일관성(factual consistency)을 점수화할 수 있습니다.

이 시퀀스가 중요한 이유는 그라운딩(grounding)이 주입 시점(injection time)에 강제되기 때문입니다. 모델은 세션 경계 내에서 검색하지 않은 출처를 인용할 수 없습니다.

그라운딩(Grounding)이 강제되는 방식: 인용, 소스 필터링 및 신뢰도 점수화

AgentCore에서의 그라운딩 (Grounding)은 검색된 웹 콘텐츠가 출처 속성 메타데이터와 함께 모델 컨텍스트 창 (context window)에 주입됨을 의미합니다. 이는 임베딩 (embedding) 및 회상 (recall) 과정에서 청크의 출처 (provenance)가 빈번히 손실되는 단순한 RAG (Retrieval-Augmented Generation) 파이프라인과는 아키텍처적으로 구별됩니다. 도메인 필터링 (Domain filtering)은 주입 전에 수행되며, 신뢰도 신호 (confidence signals)가 각 결과와 함께 전달되어 모델이 신뢰도가 낮은 출처의 가중치를 낮출 수 있도록 합니다. 검색 그라운딩이 환각 (hallucination)을 어떻게 완화하는지에 대한 배경 지식은 원본 RAG 논문을 참조하십시오.

AgentCore의 도구 계층에서 MCP (Model Context Protocol)의 역할

MCP는 AWS가 AgentCore 내부에서 채택한 표준화된 도구 호출 (tool-calling) 인터페이스입니다. 웹 검색이 MCP 호환 도구로 노출되어 있기 때문에, Bedrock의 Anthropic Claude를 포함하여 MCP를 지원하는 모든 에이전트는 동일한 프로토콜 계층을 통해 이를 호출할 수 있습니다. 이것이 채택의 이점이 되는 이유는 다음과 같습니다. 즉, 독점적인 도구 스키마 (proprietary tool schema)를 배우는 것이 아니라, 귀하의 오케스트레이션 (orchestration)이 이미 사용 중인 것과 동일한 프로토콜을 사용하는 것입니다. 프로토콜 사양은 Model Context Protocol 문서에 게시되어 있습니다.

Nova 및 Claude를 포함한 Amazon Bedrock 모델과의 통합 지점

Amazon Nova 모델은 AgentCore 도구 사용을 위한 일급 시민 (first-class citizens)이며, 웹 검색 그라운딩은 브라우저 인접 워크플로우에 대해 Nova Act를 통해 검증되었습니다. Bedrock을 통한 Claude 역시 MCP를 통해 동일한 도구를 호출합니다. 실질적인 시사점은 다음과 같습니다. 모델 선택이 그라운딩 사용을 제한하지 않습니다. 지원되는 모델은 Amazon Bedrock 문서에서 확인하십시오.

30–40%
ML 팀의 에이전트 유지보수 스프린트 중 일반적으로 임베딩 갱신, 청킹 (chunking) 및 검색 튜닝에 소비됨
[Pinecone Docs, 2025](https://docs.pinecone.io/)
...

Session-isolated AgentCore Runtime container boundary showing web search results scoped per user session

AgentCore 런타임(Runtime)의 세션 수준 격리(Session-level isolation)는 웹 검색 결과가 에이전트 인스턴스 간에 절대 섞이지 않도록 보장하며, 이는 엔터프라이즈 수준의 안전한 근거 제시(grounding)를 가능하게 하는 아키텍처적 특성입니다. 출처

Amazon Bedrock AgentCore 웹 검색 vs RAG: 엔터프라이즈 팀에 필요한 솔직한 비교

웹 검색이 RAG를 대체하는 것은 아닙니다. 그렇게 말하는 사람은 무언가를 팔려고 하는 것입니다. 웹 검색이 대체하는 것은 실시간 공개 지식을 추적하기 위해 RAG를 사용하는 특정하고 비용이 많이 드는 관행이며, 이는 RAG가 원래 잘하지 못했던 유스케이스(use case)입니다.

웹 검색이 (아직) 대체할 수 없는 RAG의 강점

계약서, 코드베이스(codebases), 지원 티켓(support tickets), 거래 내역과 같은 독점적인 내부 문서에 대한 RAG는 여전히 대체 불가능합니다. 웹 검색은 에이전트를 공개적으로 인덱싱된 콘텐츠에만 근거(grounding)하게 합니다. 고객의 계약 조건은 Google에 없으며, 있어서도 안 됩니다. 내부 지식의 경우, 귀하의 엔터프라이즈 지식 베이스(enterprise knowledge base)와 벡터 스토어(vector store)는 그대로 유지됩니다.

웹 검색이 구조적으로 벡터 데이터베이스 RAG 파이프라인보다 뛰어난 점

실시간 공개 지식 유스케이스의 경우, 웹 검색은 엔지니어링 카테고리 하나를 통째로 없애줍니다. 임베딩(embedding) 갱신 파이프라인이 필요 없습니다. 청킹(chunking) 전략에 대한 논쟁도 없습니다. 검색 튜닝(retrieval tuning)을 위한 스프린트도 필요 없습니다. Pinecone, OpenSearch 또는 pgvector와 같은 벡터 데이터베이스가 최신 상태 유지를 위해 요구하는 유지보수 노력의 30~40%는 정보의 원천(source of truth)이 라이브 웹일 때 단순히 사라집니다.

대부분의 팀은 에이전트를 최신 상태로 유지하기 위해 RAG 파이프라인을 구축했습니다. 그것은 원래 RAG의 역할이 아니었습니다. 그것은 네이티브 근거 제시(native grounding) 기능이 부재했을 때 사용하던 임시방편이었으며, AWS는 방금 그 부재를 제거했습니다.

하이브리드 근거 제시 아키텍처: 동일한 에이전트에서 두 가지를 모두 사용하는 시점

실제 운영 환경에 적합한 패턴은 하이브리드(Hybrid) 방식입니다. 최신 사건에 대한 근거 제시(grounding), 경쟁사 정보(competitive intelligence), 규제 업데이트 검색에는 AgentCore 웹 검색을 사용하십시오. 내부 정책, 제품 문서, 과거 거래 데이터에는 RAG를 사용하십시오. 단일 에이전트가 두 가지를 모두 호출할 수 있습니다. 즉, RAG는 '우리의 환불 정책은 무엇인가'를 해결하고, 웹 검색은 '이번 주에 FTC가 환불 공시 규칙을 업데이트했는가'를 해결합니다.

구분	AgentCore 웹 검색	Vector DB RAG
최적 용도	실시간 공개 지식, 최신 사건	독점 내부 문서
최신성	실시간 (분 단위)	인덱스 갱신에 의존 (일~주 단위)
유지보수 오버헤드	AWS에서 관리	스프린트 주기의 30–40%