AI 에이전트 구축을 멈추세요. 데이터 시스템을 먼저 구축하세요.
요약
AI 에이전트 구축 시 프레임워크보다 데이터 시스템 구축이 선행되어야 함을 강조합니다. 에이전트의 추론 능력은 모델이 아닌, 정제된 구조화된 데이터와 비즈니스 지식 계층에 의존하기 때문입니다.
핵심 포인트
- 에이전트의 추론은 언어 모델이 아닌 구조화된 지식에서 비롯됨
- 기업용 AI의 핵심은 데이터 정제와 표준 구조 설계에 있음
- 프롬프트 엔지니어링만으로는 누락된 비즈니스 지식을 해결할 수 없음
- 비즈니스 프로세스를 먼저 이해하고 데이터화하는 것이 자동화의 전제 조건
모두가 AI 에이전트 (AI Agents)를 만들고 있습니다.
매주 새로운 프레임워크가 등장합니다.
CrewAI.
LangGraph.
OpenAI Agents SDK.
AutoGen.
Semantic Kernel.
사람들은 오케스트레이션 (orchestration)에 집착합니다.
하지만 더 근본적인 질문을 던지는 사람은 거의 없습니다.
에이전트가 정확히 무엇을 바탕으로 추론(reasoning)하고 있는가?
AI 에이전트는 마법이 아닙니다
기업의 재무 팀을 상상해 봅시다.
은행 명세서가 도착합니다.
PAYMENT FROM ALPHABRIDGE
AI 에이전트가 이 거래를 수신합니다.
이 결제 건을 대조(reconcile)할 수 있을까요?
대부분의 사람들은 그렇다고 가정합니다.
하지만 현실은 다릅니다.
에이전트는 즉시 질문을 던지기 시작합니다.
어떤 고객인가?
어떤 송장(invoice)인가?
어떤 계약인가?
이미 지불되었는가?
부분 결제가 허용되는가?
그 정보는 어디에서 오는가?
분명 언어 모델 (language model)에서 나오는 것은 아닙니다.
누락된 계층
대부분의 AI 아키텍처 (architectures)는 다음과 같이 보입니다.
Document
↓
...
우아해 보입니다.
불행히도 이는 실제 운영 환경 (production)에서 살아남는 경우가 드뭅니다.
왜일까요?
기업은 텍스트로 운영되지 않기 때문입니다.
기업은 구조화된 지식 (structured knowledge)으로 운영됩니다.
고객.
계약.
송장 (Invoices).
구매 주문서 (Purchase Orders).
정책.
자산.
직원.
거래.
AI 에이전트는 이러한 관계를 스스로 만들어낼 수 없습니다.
누군가는 이를 구축해야 합니다.
실제 운영 시스템의 모습
더 현실적인 아키텍처는 다음과 같습니다:
Operational Data
↓
...
AI 에이전트가 어디에 나타나는지 주목하십시오.
맨 마지막입니다.
시작점이 아닙니다.
AI 에이전트가 제품은 아닙니다
이것은 아마도 제가 거래 인텔리전스 시스템 (Transaction Intelligence System)을 구축하면서 배운 가장 큰 교훈일 것입니다.
처음에는 모델을 학습시키는 것이 가장 어려운 부분일 것이라고 믿었습니다.
하지만 그렇지 않았습니다.
어려운 부분은 다음과 같았습니다:
- 기업 데이터 정제 (cleaning enterprise data)
- 표준 구조 (canonical structures) 설계
- 합성 데이터셋 (synthetic datasets) 생성
- 비즈니스 분류 체계 (business taxonomies) 정의
- 엔티티 해소 (resolving entities)
- 비즈니스 규칙 검증 (validating business rules)
AI 모델은 단순히 그 토대 위에 놓여 있을 뿐이었습니다.
이러한 계층이 없다면 에이전트는 추론할 수 있는 신뢰할 만한 대상이 아무것도 없게 됩니다.
기업용 AI는 데이터에서 시작됩니다
스스로에게 간단한 질문을 던져보십시오.
여러분의 AI가 다음 질문에 답할 수 있습니까:
"MFG-INV-000157 송장(invoice)이 이미 결제되었습니까?"
다음 항목들이 없다면:
- 고객 마스터 (customer master)
- 송장 마스터 (invoice master)
- 계약서 (contracts)
- 대조 이력 (reconciliation history)
답을 내는 것은 불가능합니다.
프롬프트 엔지니어링 (Prompt engineering)은 누락된 비즈니스 지식을 해결할 수 없습니다.
자동화에 앞선 이해
한 가지 원칙이 제가 AI 시스템을 설계하는 방식을 바꾸어 놓았습니다.
이해하지 못하는 것을 자동화하지 마십시오.
에이전트 (agents)를 도입하기 전에, 먼저 여러분의 비즈니스를 이해 가능한 상태로 만드십시오.
그것은 다음을 의미합니다:
- 표준 모델 (canonical models)
- 공유된 비즈니스 어휘 (shared business vocabulary)
- 엔티티 해상도 (entity resolution)
- 결정론적 검증 (deterministic validation)
그제서야 AI 에이전트 (AI Agent)가 의사결정을 오케스트레이션 (orchestrate)할 수 있습니다.
지능에 앞선 아키텍처
오늘날 모든 이들이 자율 에이전트 (autonomous agents)를 원합니다.
하지만 자율성을 가능하게 하는 아키텍처 (architecture)에 투자하는 조직은 거의 없습니다.
기업용 AI (Enterprise AI)로 성공하는 기업들이 반드시 가장 똑똑한 모델을 가진 것은 아닙니다.
그들은 자신들의 데이터에 대해 가장 잘 이해하고 있는 기업들일 것입니다.
그것이 진정한 경쟁 우위입니다.
마치며
AI 에이전트 (AI Agents)는 흥미롭습니다.
하지만 그것은 기반(foundation)이 아닙니다.
그것은 인터페이스 (interface)입니다.
진정한 기반은 데이터입니다.
그것을 먼저 구축하십시오.
그러면 다른 모든 것들이 극적으로 쉬워질 것입니다.
이 아키텍처가 실제로 어떻게 작동하는지 궁금하시다면, 저는 최근 실제 트랜잭션 인텔리전스 시스템 (Transaction Intelligence System)을 사용하여 MT950 은행 명세서부터 금융 NER (Financial NER), 엔티티 해상도 (Entity Resolution), 대조 (Reconciliation), 그리고 프로덕션 준비가 된 API에 이르기까지의 전체 프로세스를 문서화했습니다.
여기에는 데모용이 아닌 프로덕션 AI를 구축하는 엔지니어들을 위해 설계된 아키텍처 다이어그램, 합성 데이터셋 (synthetic datasets), 구현 세부 사항 및 소스 코드가 포함되어 있습니다.
즐거운 구축 되시길 바랍니다.
리소스
📘 저는 아키텍처, 합성 데이터셋, 금융 NER (Financial NER), 엔티티 해상도 (Entity Resolution), 대조 로직 (reconciliation logic), 그리고 프로덕션 준비가 된 Python 예제를 포함한 전체 구현 과정을 Enterprise AI Automation Blueprint에 문서화했습니다.
👉 https://uigerhana.gumroad.com/l/enterprise-ai-automation-blueprint
또한 저는 Dev.to에 엔터프라이즈 AI 아키텍처 (Enterprise AI Architecture), 데이터 엔지니어링 (Data Engineering), AI 자동화 (AI Automation), 그리고 프로덕션 AI 시스템 (Production AI Systems)을 다루는 무료 엔지니어링 시리즈를 게시하고 있습니다. 프로토타입을 넘어선 AI 구축에 관심이 있다면 계속 지켜봐 주세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기