【Build 2026 속보】Foundry IQ(Azure AI Search)에 새로운 플랜 Serverless 추가! 지식 소스에 Web IQ

올해 Microsoft Build 2026에서의 Foundry IQ(Azure AI Search)는 기존의 검색 서비스에서 에이전트(Agent)를 위한 「풀 매니지드 지식 레이어 (Full-managed Knowledge Layer)」로 진화했습니다. 업데이트의 핵심은 Azure AI Search의 지식 베이스 (Knowledge Base), 지식 소스 (Knowledge Source), Agentic Retrieval이며, Microsoft Foundry Portal, Foundry Agent Service, MCP를 통해 이용할 수 있습니다.

그리고 오늘, Foundry IQ Serverless라는 새로운 티어 (Tier)가 등장했습니다. 드디어 왔군요. 이것은 Agentic AI 시대의 이용 방식에 적응한 Azure AI Search의 역사적인 전환점이라고 느껴집니다.

Foundry IQ Serverless (프리뷰)

사용한 컴퓨팅 리소스와 스토리지 용량에 따라 과금되며, 유휴(Idle) 상태가 되면 서비스는 제로(0)까지 스케일 다운(Scale down)됩니다.

새로운 지식 소스 추가

Work IQ, Fabric IQ, File Search, Azure SQL, MCP Server 등을 지식 베이스를 통해 참조할 수 있어, 사내외 지식을 횡단하는 Agentic Retrieval을 구성하기 쉬워집니다.

지식 베이스의 GA 및 업데이트

2026-04-01

API를 통해 주요 지식 베이스 기능이 GA(General Availability)가 되며, `2026-05-01-preview`에서는 검색 기본값, GPT-5, CORS 등의 확장이 추가되었습니다.

Web IQ가 Foundry IQ에서 이용 가능

사내 데이터만으로는 부족한 최신 Web 정보를 Foundry IQ의 검색 플로우에 통합하여 답변의 근거로 이용할 수 있습니다.

에이전트 검색 엔진의 검색 품질 향상

쿼리 계획 (Query Planning), 소스 선택 (Source Selection), 리랭킹 (Reranking), 답변 합성 (Answer Synthesis)이 개선되어, 여러 소스를 가로지르는 질문에서도 필요한 근거를 찾기 쉬워졌습니다.

데이터 파이프라인 업데이트 (프리뷰)

SharePoint 페이지 및 Lists, 시맨틱 청크 분할 (Semantic Chunking), 이미지 설명 (Image Captioning), Image Serving을 통해 문서 구조와 시각 정보를 검색에 활용하기 쉬워집니다.

검색 실행 및 운영 API 추가 (프리뷰)

Retrieve Action의 새로운 파라미터, 서비스 통계, List API 페이지네이션 (Pagination)을 통해 검색 결과의 양, 장애 발생 시의 처리, 운영 모니터링을 세밀하게 제어할 수 있습니다.

보안 / 거버넌스 업데이트 (프리뷰)

Purview 민감도 레이블 (Sensitivity Label), SharePoint 권한 동기화, 프라이빗 연결 (Private Connection), Managed Identity 연동을 통해 기업 데이터를 안전하게 검색으로 연결하기 쉬워집니다.

Foundry IQ Serverless는 에이전트 워크로드의 「사용할 때만 갑자기 검색이 필요하고, 사용하지 않을 때는 멈춰 있는」 성질에 맞춘 실행 모델입니다. 기존의 Azure AI Search SKU는 파티션 (Partition) / 레플리카 (Replica) / 검색 유닛 (Search Unit)을 상시 확보하는 방식이지만, Serverless는 유휴 시 제로 스케일링하며 컴퓨팅 유닛 (CU) 기반으로 소비를 측정하는 설계로 발표되었습니다. PoC, 이벤트 드리븐 (Event-driven) 에이전트, 이용량을 예측하기 어려운 초기 도입 단계에서 특히 유효합니다.

능력	Developer Tier
컴퓨팅 사용량	0.24 CU/시간
...
※ 과금은 2026년 하반기에 시작될 예정이며, 상세 내용은 최소 30일 전까지 통지됩니다. Serverless Developer는 과금 시작 전에 요금이 발생하지 않습니다. 현재의 컴퓨팅 유닛 측정값은 개략적인 수치이며, 과금 시작 전에 변경될 가능성이 있습니다.

새로운 지식 소스는 에이전트가 「문서 안을 찾는 것」뿐만 아니라 「조직의 대화·회의·메일」, 「Fabric 상의 업무 개념과 라이브 데이터」, 「SQL의 구조화된 데이터」, 「MCP로 공개된 외부 도구 및 지식」까지 다룰 수 있도록 하기 위한 확장입니다. 이를 통해 예를 들어 영업 에이전트가 고객 회의의 문맥, Fabric의 매출 데이터, 계약서, 외부 MCP의 전문 지식을 동일한 지식 베이스를 통해 참조하는 설계가 가능해집니다.

지식 소스 (Knowledge Source)	내용
Work IQ	Microsoft 365의 이메일, 회의, 파일, Teams 메시지 등 조직 내 협업 정보를 권한을 고려하여 활용한다.
...

검색 인덱스의 지식 소스는 영구적인 검색 기본값(persistent retrieval defaults)을 지원하게 되었습니다. 여기에는 모든 검색에 적용되는 baseFilter와, AND 로직을 사용하여 baseFilter와 결합하는 런타임 filterAddOn이 포함됩니다.

인덱스화된 지식 소스에 대해 신선도 정책(freshness policy)을 설정하여, 최근에 업데이트된 문서를 우선적으로 검색할 수 있도록 합니다.

지식 베이스(Knowledge Base)는 Azure AI Search 상의 최상위 리소스로 GA(General Availability)되었습니다. GA 버전인 2026-04-01 API에서는 일반 제공되는 지식 소스 유형에 대한 추출형 검색(extractive search)을 지원합니다.

지식 베이스가 GPT-5 패밀리 모델을 지원하며, gpt-5.4-mini 등을 쿼리 계획(query planning) 및 응답 생성에 사용할 수 있게 되었습니다. 더 작은 모델을 사용하여 응답성과 비용을 조정하면서, 지식 베이스 측의 에이전틱 검색(Agentic Retrieval)을 활용하는 설계를 더 쉽게 할 수 있습니다. 새로운 corsOptions 속성을 사용하여 CORS를 설정하면 브라우저에서 서비스로의 직접적인 검색 호출(retrieval call)이 가능해집니다.

검색 액션(Retrieve action)은 지식 베이스에 질의를 던지는 API입니다. 요청에는 사용자 질문이나 대화 이력을 포함하는 messages, 또는 검색 의도를 직접 전달하는 intents, 나아가 대상 지식 소스를 제어하는 knowledgeSourceParams를 포함할 수 있습니다. 2026-05-01-preview의 경우, messages에 채팅 이력을 전달하면 LLM이 대화 문맥으로부터 검색해야 할 쿼리를 판단합니다.

에이전트에 의한 정보 검색 파이프라인에서는 검색 액션을 통해 지식 베이스로부터 병렬 쿼리 처리가 호출됩니다. 검색 액션은 검색 서비스 REST API 또는 Azure SDK를 사용하여 직접 호출할 수 있습니다. 각 지식 베이스에는 MCP 호환 에이전트가 이용할 수 있는 MCP 엔드포인트도 마련되어 있습니다.

Web IQ는 모델의 지식 컷오프(knowledge cutoff)나 사내 데이터만으로는 답할 수 없는 질문에 대해 웹, 뉴스, 이미지, 동영상, 쇼핑 등의 외부 정보를 검색 소스로 사용하기 위한 신기능입니다. Grounding with Bing의 진화된 버전이며, 웹 검색 페이지를 인간에게 보여주는 것이 아니라 LLM / 에이전트 워크플로의 그라운딩 소스(grounding source)로서 저지연(low latency)으로 사용하는 설계라는 점이 특징입니다. 사내 지식 소스와 결합하면 사내 정책이나 제품 자료에 더해, 최신 시장 정보나 공개 정보로 보완하는 에이전트를 만들 수 있습니다.

Agentic Retrieval은 사용자의 질문을 그대로 한 번 검색하는 것이 아니라, 질문을 분해하고, 필요한 지식 소스를 선택하며, 여러 검색을 병렬 및 반복 수행하고, 시맨틱 랭커(Semantic Ranker)나 분류기(classifier)로 결과를 좁히는 검색 방식입니다. 2026-05-01-preview의 개선 사항에서는 검색의 재현율(Recall)(엄밀히 말하면 주로 답변 정확도 자체가 아니라, 근거 문서의 재현율인 evidence recall의 개선), 답변의 완전성, 토큰 효율성이 개선되었습니다.

단발성 RAG를 지식 베이스로 교체할 경우, 근거의 Recall이 최대 46% 개선
작은 에이전트 모델과 Agentic Retrieval을 결합할 경우, 근거의 Recall이 최대 54% 개선
검색 도구 호출(tool calling) 감소를 통해 토큰 비용 34% 절감
이전 릴리스 대비 근거 Recall: Minimal +10%, Low +8%, Medium +9%
답변 품질: Minimal +20%, Low +8%, Medium +10%
BM25 대비 무응답률 94.5% 감소 및 근거 Recall 37.9% 개선

이번 품질 향상에서는 Agentic Retrieval 파이프라인의 각 단계에서 다음과 같은 개선이 이루어졌습니다.

개선 요인	설명
동적인 Agentic Retrieval 루프	모든 소스를 고정적으로 검색하는 대신, 질문에 따라 지식 소스(Knowledge Source)를 선택하고, 쿼리(Query)를 분해하며, 필요 시 추가 검색을 수행함.
...

지식 베이스(Knowledge Base)는 독립형 검색 도구보다 근거의 Recall(재현율)과 답변 품질을 높이면서도, 검색 도구 호출 횟수를 줄여줍니다.
작은 규모의 에이전트 모델이라도 검색을 지식 베이스에 맡김으로써, 높은 검색 품질과 응답성(Responsiveness)을 동시에 달성하기 쉽습니다.
BM25나 단순 하이브리드 검색(Hybrid Search)보다, 지식 베이스의 Minimal / Low / Medium 구성은 근거 취득, 답변 완전성, 무응답률 측면에서 단계적으로 유리해집니다.
MCP, Fabric, SQL과 같은 이기종 소스를 포함하는 평가에서도 효과가 확인되었으며, 구조화 데이터(Structured Data)와 비구조화 문서(Unstructured Document)를 아우르는 검색에 적합합니다.

검색 추론 노력(Search Reasoning Effort) 파라미터
Medium

은 품질을 중시하므로, 응답 시간 및 토큰 비용과의 균형을 고려하여 채택해야 합니다.

2026-05-01-preview

이후, 에이전트에 의한 검색 플로우에서는 시맨틱(Semantic) 설정이 옵션이 됩니다. 기존의 시맨틱 검색(Semantic Search)에서는 계속해서 명시적인 시맨틱 설정이 필요합니다.

데이터 파이프라인 업데이트는 검색 시의 알고리즘 이전에, 원본 데이터를 얼마나 정확하게 가져올 수 있는지를 개선하는 업데이트입니다. RAG의 실패는 검색 로직이 아니라 "표가 깨져 있음", "이미지 내 정보가 누락됨", "SharePoint의 페이지나 리스트가 포함되지 않음"과 같이 데이터 수집(Ingestion) 측면에 원인이 있는 경우가 많습니다. 이번 업데이트는 SharePoint 대상 확대, Content Understanding을 통한 구조적 이해, Image Serving을 통한 시각 정보 유지 등을 통해 에이전트가 참조할 수 있는 근거를 늘립니다.

SharePoint 인덱싱 확장(Indexing Extension)은 기업 내 지식이 "파일"뿐만 아니라 페이지, 리스트, 서브사이트에도 존재하는 현실에 대응하는 기능입니다. ASPX 페이지나 Lists를 가져올 수 있으면 사내 포털, 절차서, 업무 대장, 운영 상황 등을 에이전트의 검색 대상으로 만들 수 있습니다. 소스 URL의 추적성(Traceability)은 답변의 근거로부터 원본 SharePoint 콘텐츠로 돌아가기 위해서도 중요합니다.

SharePoint 인덱서(Indexer)가 다음 사항을 프리뷰(Preview)로 지원합니다.

모던 ASPX 사이트 페이지
SharePoint Lists
문서 라이브러리(Document Library)
재귀적 서브사이트 탐지
소스 URL의 추적성

Content Understanding 연동은 PDF, Office 문서, 이미지를 포함한 복잡한 문서에서 레이아웃이나 표 구조를 의식하여 검색 가능한 텍스트를 추출하는 기능입니다. 일반적인 텍스트 추출에서는 표의 행렬 관계, 그림의 의미, 페이지를 넘나드는 표 등이 깨지기 쉬워 답변 품질에 영향을 미칩니다. Content Understanding을 수집 파이프라인에 통합함으로써, 문서 구조를 더 잘 유지한 청크(Chunk)와 설명문을 만들어 후속 검색 및 답변 생성 단계로 전달할 수 있습니다.

Foundry Tools의 Content Understanding 연동에서는 다음 사항이 프리뷰로 강화되었습니다.

시맨틱 청크 분할(Semantic Chunking)
AI를 통한 이미지 설명 생성
레이아웃 인식형 추출
tables / diagrams / scanned images 등의 의미 표현 유지

Image Serving은 문서 내에서 추출된 이미지를 검색 시에 반환할 수 있도록 하는 기능입니다. 도면, 차트, 스크린샷, 스캔된 양식 등은 텍스트로만 변환할 경우 중요한 근거가 누락될 수 있습니다. Image Serving을 통해 에이전트나 멀티모달 모델(Multimodal Model)이 원본 이미지를 참조하여 시각적 근거를 포함해 판단할 수 있게 됩니다.

APIM / 프라이빗 연결 / 모델 엔드포인트 대응은 기업 내 네트워크, 인증, 감사, 트래픽 제어에 맞춰 AI 인리치먼트(Enrichment) 및 벡터화(Vectorization)를 운영하기 위한 업데이트입니다. Azure API Management을 거침으로써 모델 호출에 대한 정책, 라우팅, 모니터링을 중앙에서 관리하기 쉬워집니다. 프라이빗 연결(Private Connection)은 기밀 데이터를 다루는 수집/인리치먼트 통신이 퍼블릭 경로로 노출되지 않도록 하는 데 중요합니다.

Azure OpenAI Embedding 스킬, GenAI Prompt 스킬, 그리고 Azure OpenAI Vectorizer는 Azure API Management를 통한 라우팅을 위해 azure-api.net 엔드포인트를 수용할 수 있게 되었습니다.

List API 페이징을 통해 $top, $skip, 연속 토큰(continuation token)으로 대규모 목록을 단계적으로 가져올 수 있습니다.

Get Service Statistics가 knowledgeBasesCount와 knowledgeSourcesCount를 반환함에 따라, 서비스 내의 지식 베이스(Knowledge Base) 수와 지식 소스(Knowledge Source) 수를 더 쉽게 파악할 수 있게 되었습니다.

보안 / 거버넌스(Governance) 업데이트는 Foundry IQ를 기업 데이터로 사용하기 위한 핵심입니다. 에이전트가 답변할 수 있는 범위는 단순히 검색에 히트되었는지 여부가 아니라, 사용자가 해당 정보에 접근할 권한이 있는지, 민감도 레이블(Sensitivity Label)을 어떻게 다루는지, 관리자의 조사 접근(Investigative Access)이 감사(Audit)되는지, 그리고 통신 경로가 허용된 경계 내에 있는지에 따라 결정됩니다.

SharePoint 권한 동기화는 SharePoint 측에서 변경되는 권한을 검색 인덱스(Search Index) 측에 지속적으로 반영하기 위한 기능입니다. 권한이 변경되었음에도 검색 인덱스가 오래된 ACL(Access Control List) 상태로 남아 있다면, 에이전트가 보여주어서는 안 될 정보를 제공하거나 보여주어야 할 정보를 제공하지 못할 위험이 있습니다. 증분 동기화(Incremental Sync)를 통해 SharePoint와 Foundry IQ 사이의 권한 불일치를 최소화할 수 있습니다.

2026-05-01-preview에서는 SharePoint 권한 동기화가 개선되었습니다.

예약된 인덱서(Indexer) 실행을 통해 문서 ACL의 증분 업데이트를 가져옵니다.
Foundry IQ의 지식 소스(Knowledge Source) 설정을 통한 예약 작업도 지원합니다.
SharePoint 그룹을 지원합니다.
문서 라이브러리뿐만 아니라 Lists / ASPX 페이지의 ACL도 지원합니다.
쿼리 시의 ACL 적용과 결합하여, 소스 시스템과 검색 레이어 간의 권한 불일치를 줄입니다.

Purview 민감도 레이블(Sensitivity Label)은 문서의 분류 및 민감도를 AI 검색 흐름에 도입하기 위한 기능입니다. 검색 결과가 단순히 추출되는 것에 그치지 않고, 해당 문서가 Confidential(기밀)인지, 사외비인지, 암호화나 보호 정책이 적용되어 있는지를 인덱스, 지식 베이스, Foundry Agent 경험, MCP 연동 과정에서 다룰 수 있도록 합니다. 이를 통해 답변 생성 시에도 레이블 문맥(Context)을 잃지 않도록 합니다.

Foundry IQ의 지식 베이스 시나리오에서 Microsoft Purview 민감도 레이블의 전파(Propagation)가 지원됩니다.

소스 시스템에서 인덱스로 레이블을 가져옵니다.
지식 베이스 검색 흐름에 레이블 문맥을 전달합니다.
MCP 기반의 상호작용 및 Foundry 포털의 지식에서도 레이블 문맥을 다룹니다.
사용자 인가(Authorization)와 결합하여, 분류 및 보호된 콘텐츠를 AI 워크플로우에서도 다룰 수 있도록 합니다.

Azure AI Search는 Microsoft Foundry 리소스 연결 시 네트워크 보안 경계와 공유 프라이빗 링크(Shared Private Link)를 지원하게 되었습니다. 이를 통해 스킬, 벡터화 도구(Vectorizer), 지식 베이스에 대한 안전한 프라이빗 연결이 가능해집니다.

RAGOps Studio — for Azure AI Search에도 Build 2026의 최신 기능을 구현할 예정입니다.

【Build 2026 속보】Foundry IQ(Azure AI Search)에 새로운 플랜 Serverless 추가! 지식 소스에 Web IQ

요약

핵심 포인트

사용한 컴퓨팅 리소스와 스토리지 용량에 따라 과금되며, 유휴(Idle) 상태가 되면 서비스는 제로(0)까지 스케일 다운(Scale down)됩니다.

Work IQ, Fabric IQ, File Search, Azure SQL, MCP Server 등을 지식 베이스를 통해 참조할 수 있어, 사내외 지식을 횡단하는 Agentic Retrieval을 구성하기 쉬워집니다.

API를 통해 주요 지식 베이스 기능이 GA(General Availability)가 되며, `2026-05-01-preview`에서는 검색 기본값, GPT-5, CORS 등의 확장이 추가되었습니다.

사내 데이터만으로는 부족한 최신 Web 정보를 Foundry IQ의 검색 플로우에 통합하여 답변의 근거로 이용할 수 있습니다.

쿼리 계획 (Query Planning), 소스 선택 (Source Selection), 리랭킹 (Reranking), 답변 합성 (Answer Synthesis)이 개선되어, 여러 소스를 가로지르는 질문에서도 필요한 근거를 찾기 쉬워졌습니다.

SharePoint 페이지 및 Lists, 시맨틱 청크 분할 (Semantic Chunking), 이미지 설명 (Image Captioning), Image Serving을 통해 문서 구조와 시각 정보를 검색에 활용하기 쉬워집니다.

Retrieve Action의 새로운 파라미터, 서비스 통계, List API 페이지네이션 (Pagination)을 통해 검색 결과의 양, 장애 발생 시의 처리, 운영 모니터링을 세밀하게 제어할 수 있습니다.

댓글

【Build 2026 속보】Foundry IQ(Azure AI Search)에 새로운 플랜 Serverless 추가! 지식 소스에 Web IQ

요약

핵심 포인트

사용한 컴퓨팅 리소스와 스토리지 용량에 따라 과금되며, 유휴(Idle) 상태가 되면 서비스는 제로(0)까지 스케일 다운(Scale down)됩니다.

Work IQ, Fabric IQ, File Search, Azure SQL, MCP Server 등을 지식 베이스를 통해 참조할 수 있어, 사내외 지식을 횡단하는 Agentic Retrieval을 구성하기 쉬워집니다.

API를 통해 주요 지식 베이스 기능이 GA(General Availability)가 되며, 2026-05-01-preview에서는 검색 기본값, GPT-5, CORS 등의 확장이 추가되었습니다.

사내 데이터만으로는 부족한 최신 Web 정보를 Foundry IQ의 검색 플로우에 통합하여 답변의 근거로 이용할 수 있습니다.

쿼리 계획 (Query Planning), 소스 선택 (Source Selection), 리랭킹 (Reranking), 답변 합성 (Answer Synthesis)이 개선되어, 여러 소스를 가로지르는 질문에서도 필요한 근거를 찾기 쉬워졌습니다.

SharePoint 페이지 및 Lists, 시맨틱 청크 분할 (Semantic Chunking), 이미지 설명 (Image Captioning), Image Serving을 통해 문서 구조와 시각 정보를 검색에 활용하기 쉬워집니다.

Retrieve Action의 새로운 파라미터, 서비스 통계, List API 페이지네이션 (Pagination)을 통해 검색 결과의 양, 장애 발생 시의 처리, 운영 모니터링을 세밀하게 제어할 수 있습니다.

댓글

API를 통해 주요 지식 베이스 기능이 GA(General Availability)가 되며, `2026-05-01-preview`에서는 검색 기본값, GPT-5, CORS 등의 확장이 추가되었습니다.