
AI 에이전트 시대의 「파일 시스템 종언」론——Oracle AI Database 26ai
요약
Oracle AI Database 26ai는 AI 기능을 데이터베이스의 핵심 요소로 통합하여, 벡터 검색과 SQL을 단일 트랜잭션 내에서 처리합니다. RAG 파이프라인 내장 및 멀티모달 데이터의 네이티브 청킹 기능을 통해 AI 에이전트 시대에 최적화된 데이터 관리 환경을 제공합니다.
핵심 포인트
- 하이브리드 검색을 통한 전문 검색과 벡터 유사도 결합
- DBMS_VECTOR_CHAIN을 활용한 DB 내부 RAG 파이프라인 완결
- 이미지, PDF 등 멀티모달 데이터의 네이티브 AI 청킹 지원
- AI 에이전트를 위한 Tool Use 및 Function Calling 레이어 제공
AI 에이전트 시대의 「파일 시스템 종언」론——Oracle AI Database 26ai
서론
"왜 파일을 S3에 저장하는가?"——이 질문에 답할 수 있는 엔지니어는 많지만, "그렇다면 2026년 이후에도 그것이 최적해인가?"라고 다시 질문하면 갑자기 정적이 흐른다.
Oracle Database 26ai는 그 질문에 대해 하나의 도발적인 답변을 제시한다. 문서, 이미지, 음성, 텍스트를 데이터베이스에 직접 저장하고, LLM과 벡터 검색(Vector Search) 및 SQL을 동일 트랜잭션(Transaction) 내에서 다룬다는 설계다.
본 기사에서는 Oracle AI Database 26ai의 주요 기능과 아키텍처, 그리고 「AI 에이전트가 주역이 되는 시대의 데이터 관리」라는 관점에서 그 의미를 깊이 있게 파헤쳐 본다.
Oracle AI Database 26ai란
Oracle Database 26ai는 Oracle Database 23ai의 후속으로 2025~2026년에 걸쳐 출시된 버전으로, AI 기능을 **퍼스트 클래스 시민 (First-class citizen)**으로 취급하는 첫 번째 Oracle DB 메이저 버전이다.
기존 Oracle DB와의 주요 차이점은 다음 3가지이다:
| 기능 | 23ai까지 | 26ai에서 추가·강화 |
|---|---|---|
| 벡터 검색 (Vector Search) | VECTOR 타입 (23ai 추가) | 하이브리드 검색 (Hybrid Search, 전문+의미) 통합 |
| LLM 호출 | 외부 API로의 프로시저 (Procedure) | DBMS_VECTOR_CHAIN을 통한 RAG 파이프라인 내장 |
| 멀티모달 (Multimodal) | 미지원 | 이미지·PDF·음성의 네이티브 AI 청킹 (Chunking) |
| AI 에이전트 연동 | 미지원 | Tool Use / Function Calling 레이어 |
주요 기능 심층 분석
1. VECTOR 타입과 하이브리드 검색
Oracle 23ai에서 도입된 VECTOR 타입은 26ai에서 대폭 강화되었다. 가장 큰 변경점은 **하이브리드 검색 (Hybrid Search)**의 통합이다.
-- 하이브리드 검색: 전문(Full-text) 스코어 × 벡터 유사도를 조합함
SELECT doc_id, title, content,
VECTOR_DISTANCE(embedding, :query_vec, COSINE) AS vec_score,
...
전문 검색 (Oracle Text)과 벡터 검색을 SQL의 WHERE 절에서 혼합하여 사용할 수 있기 때문에, "키워드로 필터링하면서 의미적으로 가까운 문서를 우선시하는" RAG 패턴을 SQL 하나로 구현할 수 있다.
2. DBMS_VECTOR_CHAIN을 통한 RAG 파이프라인
26ai의 가장 큰 특징 중 하나가 DBMS_VECTOR_CHAIN 패키지다. 임베딩 생성 → 검색 → LLM 호출 → 답변 생성을 DB 내부에서 완결시키는 파이프라인을 정의할 수 있다.
-- RAG 파이프라인 전체를 PL/SQL로 정의
DECLARE
v_params CLOB := '{
...
Python 앱에서는 LangChain이나 LlamaIndex의 Oracle DB 커넥터를 사용하여 동일한 파이프라인을 호출할 수 있다.
3. 멀티모달 문서 처리
26ai에서 새롭게 추가된 DBMS_VECTOR_CHAIN.UTL_TO_CHUNKS는 PDF나 이미지를 DB에 저장하면서 AI 청킹 (Chunking)을 자동으로 수행한다.
-- PDF/이미지를 직접 저장하여 청킹
INSERT INTO document_store (doc_id, doc_name, doc_content)
VALUES (1, '계약서.pdf', TO_BLOB(bfilename('DOC_DIR','contract.pdf')));
...
"S3에 PDF를 두고 Lambda로 전처리하여 OpenSearch Serverless에 넣고..." 하는 기존의 파이프라인이 DB로의 INSERT로 완결된다. 이것이 「파일 시스템 종언」론의 핵심이다.
AI 에이전트 연동 레이어
26ai가 가장 야심 차게 추진하는 것이 Tool Use / Function Calling과의 통합이다. Oracle Select AI 기능이 확장되어, 자연어 쿼리를 SQL로 변환할 뿐만 아니라 에이전트가 DB 내의 함수를 직접 도구(Tool)로서 호출할 수 있다.
Select AI와 에이전트 통합
import oracledb
conn = oracledb.connect(
user=os.environ.get("DB_USER"),
...
action => 'narrate'
를 지정하면 SQL을 실행하고 그 결과를 자연어(Natural Language)로 반환한다. 'runsql'
를 사용하면 가공되지 않은 SQL이 반환되므로 에이전트의 중간 단계(Intermediate Step)로 사용할 수 있다.
MCP (Model Context Protocol) 대응
26ai는 Oracle Database의 MCP 서버 구현을 공식 지원하며, Claude Code나 Cursor와 같은 AI 에이전트에서 직접 DB 조작이 가능하다.
// .mcp.json
{
"mcpServers": {
...
실전: Oracle 26ai로 RAG 시스템 구축하기
다음은 Python과 Oracle 26ai를 사용한 간단한 RAG (Retrieval-Augmented Generation) 시스템의 예시다. LangChain의 Oracle DB 벡터 스토어(Vector Store)를 사용한다.
from langchain_community.vectorstores.oraclevs import OracleVS
from langchain_community.vectorstores.utils import DistanceStrategy
from langchain_openai import OpenAIEmbeddings
...
기존의 Pinecone/Weaviate와 비교했을 때, 애플리케이션이 연결하는 엔드포인트(Endpoint)가 OracleDB 하나뿐이 된다. 트랜잭션 관리(Transaction Management), RBAC (Role-Based Access Control), 감사 로그(Audit Log)를 기존의 DB 운영 노하우로 그대로 사용할 수 있다는 점이 크다.
「파일 시스템 종언」론의 현실적 해답
제목의 「파일 시스템 종언」은 다소 자극적이지만, 정확하게는 「AI가 데이터를 소비하는 경로로서의 파일 시스템의 퇴장」이라고 말해야 할 것이다.
실제 유스케이스(Use Case)별 사용법을 정리하면 다음과 같다:
| 유스케이스 | 권장 아키텍처 |
|---|---|
| 대용량 바이너리 (동영상·대규모 CSV) | 오브젝트 스토리지 (S3 등) + Oracle External Tables |
| ... |
「무엇이든 DB에 넣는다」가 아니라, 「AI가 추론(Inference)에 사용하는 데이터는 DB에 넣고, AI가 소비하지 않는 데이터는 오브젝트 스토리지에 그대로 둔다」는 역할 분담이 현실적인 해답이다.
요약
Oracle AI Database 26ai의 핵심 포인트를 정리한다:
- VECTOR 타입 + 하이브리드 검색 (Hybrid Search): 전문 검색(Full-text Search)과 벡터 검색을 SQL로 통합하여, RAG 패턴을 DB 내부에서 완결 가능
- DBMS_VECTOR_CHAIN: 임베딩 생성 → 검색 → LLM 호출을 PL/SQL 파이프라인으로 정의
- 멀티모달 (Multimodal) 대응: PDF·이미지를 BLOB으로 저장하고, AI 청킹(Chunking)을 자동으로 실행
- Select AI: 자연어 → SQL 변환과 에이전트 연동을 공식 지원
- MCP 대응: Claude Code 등의 AI 에이전트에서 직접 DB 조작 가능
- 현실적 해답은 역할 분담: AI 추론에 사용하는 데이터는 DB, 대용량 바이너리는 오브젝트 스토리지
AI 에이전트가 업무 데이터에 직접 접근하는 시대에, 데이터의 신뢰성·일관성·보안을 DB 레이어(Layer)에서 담보하는 설계는 다시 한번 중요성이 커지고 있다.
Discussion

AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기