AI, AI 에이전트(AI Agents), 그리고 에이전틱 AI(Agentic AI)의 정확한 차이점: 마침내 쉽게 설명해 드립니다

AI, AI 에이전트(AI Agents), 그리고 에이전틱 AI(Agentic AI)의 정확한 차이점
AI, AI 에이전트, 그리고 에이전틱 AI는 단일 스펙트럼 상에서 세 가지의 뚜렷한 역량 수준을 나타냅니다. AI는 무언가를 알고 그것에 대해 당신에게 알려주는 시스템이며, AI 에이전트는 동일한 시스템에 당신이 지정한 작업을 수행하기 위해 세상 속에서 행동할 수 있는 도구(tools)를 부여한 것이고, 에이전틱 AI는 목표를 설정하면 이를 달성하기 위한 경로를 스스로 계획하고, 경로가 변경될 때 적응하며, 다음에 무엇을 해야 할지 지시받기를 기다리지 않고 계속해서 나아가는 시스템입니다.

대화 중에 이러한 용어들이 나올 때마다 고개를 끄덕이면서도, 이들이 모두 같은 것인지 조용히 궁금해했다면 당신의 의구심은 타당했습니다. 이들은 같지 않습니다. 이들은 자율성(autonomy)이 증가하는 동일한 개념의 세 단계이며, 1단계에서 3단계 사이의 거리는 당신의 질문에 답하는 도구와 당신이 다른 일에 집중하는 동안 당신을 대신해 프로젝트를 운영하는 시스템 사이의 차이입니다.

우리는 하나의 점진적으로 확장되는 시나리오를 통해 이 세 단계를 완전히 명확하게 만들 것입니다. 시나리오는 전체 과정 동안 동일하게 유지됩니다. 오직 시스템의 역량(capability)만 변합니다. 마지막에 이르면, 당신은 이 차이점에 대한 직관적인 감각과 이를 정확하게 설명할 수 있는 기술적 어휘를 모두 갖게 될 것입니다.

세 단계를 관통하는 시나리오
당신이 스타트업의 제품 관리자(product manager)라고 상상해 보십시오. 당신은 주요 경쟁사가 최근에 가격 정책을 변경했는지 확인하려고 합니다. 당신은 조사한 내용에 대한 서면 요약이 필요합니다.

이것은 단순하고 익숙한 작업입니다. 당신은 오후 시간 동안 직접 수행할 수 있습니다. 세 가지 다른 유형의 AI 시스템이 이 작업을 어떻게 수행하는지, 그리고 그들 사이의 차이점이 AI, AI 에이전트, 그리고 에이전틱 AI에 관한 모든 중요한 요소를 어떻게 포착하는지 살펴보겠습니다.

1단계 AI: 의자에서 일어나지 않는 전문가

[

Stage One AI: The Expert Who Will Not Leave the Chair

]

완전한 에이전틱 (Agentic) 시스템의 구조

1단계 시스템에 다음과 같이 작업을 설명합니다: “우리 경쟁사가 최근에 가격을 변경했는지 알아보고, 찾은 내용을 요약해 줘.”

시스템은 즉시 응답을 생성합니다. SaaS 기업들이 일반적으로 가격 변경 사항을 어떻게 전달하는지에 대해 사려 깊은 요약을 작성하고, 어디를 살펴봐야 할지에 대한 프레임워크를 제공하며, 무엇에 주의를 기울여야 하는지 알려줍니다. 요약은 세련되고 유용합니다. 그러고 나서 시스템은 멈춰서 기다립니다.

당신은 시스템이 실제로 경쟁사의 웹사이트를 확인하지 않았다는 사실을 깨닫습니다. 최근 뉴스를 검색하지도 않았습니다. 시스템은 정보를 어떻게 찾는지에 대해서는 말해주었지만, 정보를 직접 찾아내지는 못했습니다. 당신은 여전히 브라우저를 열고, 경쟁사의 가격 페이지를 방문하고, 공지 사항을 검색하고, 그 결과를 직접 읽어야 합니다.

이것이 바로 1단계의 일반적인 AI입니다. GPT-4o, Claude, 또는 Gemini의 기본 버전과 같은 대규모 언어 모델 (Large Language Model, LLM)에 질문 외에 아무것도 주지 않았을 때의 모습입니다. 이 모델이 담고 있는 것은 놀랍습니다. 방대한 양의 텍스트에서 추출된 지식이 압축되어, 거의 모든 질문에 유창하고 일관된 언어로 응답할 수 있는 일련의 가중치 (Weights)로 존재합니다. 하지만 부족한 점은 세상에 작용할 수 있는 능력입니다. 모델에게는 손이 없습니다. 가격 변경이 어떤 모습인지, 그리고 그것을 어디서 찾을 수 있는지는 설명할 수 있지만, 직접 찾아볼 수는 없습니다.

이러한 한계의 기술적인 이유는 명확합니다. 대규모 언어 모델은 다음 토큰 예측 (Next-token prediction) 엔진입니다. 지금까지 작성된 모든 내용, 즉 당신의 질문, 이전 단어들, 그리고 모든 학습 데이터를 바탕으로 통계적으로 가장 가능성이 높은 다음 텍스트 조각을 예측합니다. 이것이 당신이 채팅 AI로부터 받아본 모든 인상적인 응답 뒤에 있는 엔진입니다. 하지만 이 엔진이 단독으로 작동할 때는 웹사이트에 접속하거나, 검색을 실행하거나, 라이브 웹페이지를 읽을 수 있는 메커니즘이 없습니다. 텍스트를 예측하는 것과 세상에서 행동하는 것은 서로 다른 작업입니다. 1단계는 오직 첫 번째 작업만을 수행합니다.

1단계의 또 다른 특징 중 하나는 위에서 언급한 모든 사항에 중요하기 때문에 기억해 둘 가치가 있습니다. 기본적으로 1단계는 대화 간의 메모리 (Memory)를 유지하지 않습니다. 각 세션은 새롭게 시작됩니다. 어제의 연구 내용은 사라집니다. 또한 시스템은 때때로 단순히 틀린 내용을 확신에 차서 주장할 수 있는데, 업계에서는 이러한 동작을 환각 (Hallucination)이라고 부릅니다. 행동의 부재, 지속적인 메모리의 부재, 간헐적인 작화 (Confabulation)와 같은 이러한 특성들은 다음 두 단계가 구축되는 기초가 됩니다.

2단계 AI 에이전트 (AI Agent): 마침내 일어서는 전문가
이제 우리는 동일한 시스템에 일련의 도구 (Tools)를 건네주고 다시 질문합니다: “우리 경쟁사가 최근에 가격을 변경했는지 알아보고, 찾은 내용을 요약해 줘.”

이번에 시스템은 경쟁사의 웹사이트를 검색합니다. 현재의 가격 페이지를 읽습니다. 경쟁사의 가격 정책에 관한 최근 발표를 찾기 위해 웹 검색 (Web search)을 실행합니다. 그리고 3주 전에 20% 가격 인상을 발표한 블로그 게시물을 찾아냅니다. 게시물을 읽고 정보를 처리한 뒤, 깔끔한 세 문단 분량의 요약문을 작성합니다. 요약이 완료되면 시스템은 멈추고, 당신의 다음 질문을 받을 준비를 합니다.

이것이 바로 2단계인 AI 에이전트입니다. 동일한 언어 모델 (Language model)이지만, 이제는 실제로 사용할 수 있는 도구들, 즉 웹 검색 기능, 웹 브라우징 (Web browsing) 기능, 어쩌면 문서 읽기 기능 등을 갖게 되었습니다. 시스템이 1단계보다 더 많은 지식을 가진 것은 아닙니다. 뇌는 동일합니다. 바뀐 점은 이제 시스템에게 '손'이 생겼다는 것입니다.

이 기술적 메커니즘의 이면에는 2023년 6월 OpenAI가 도입한 함수 호출 (Function Calling)이 있습니다. 이 개념은 우아할 정도로 단순합니다. 시스템에게 다음과 같이 지시하는 것입니다: “당신은 이 도구들에 접근할 수 있습니다. 도구를 사용해야 할 때, 산문(Prose)을 생성하는 대신 어떤 도구를 사용할지, 그리고 어떤 인자(Arguments)를 전달할지를 명시하는 구조화된 요청을 출력하세요.” 주변 소프트웨어는 해당 도구 호출을 실행하고, 결과를 받아 모델에게 다시 전달하며, 모델은 그 결과를 읽고 다음에 무엇을 할지 결정합니다. '모델이 도구를 요청하고, 도구가 실행되며, 결과가 모델로 돌아오는' 이 루프 모델이 AI 에이전트가 갖게 된 모든 '손'의 이면에 있는 전체 기술적 메커니즘입니다.

매번 맞춤형 통합 코드를 작성하지 않고도 어떤 모델이든 어떤 도구와도 연결할 수 있는 상호 운용성 (Interoperability) 문제는, 2024년 11월 Anthropic이 모델 컨텍스트 프로토콜 (Model Context Protocol, MCP)을 오픈 소스로 공개하면서 실질적으로 해결되었습니다. MCP는 모델과 도구가 통신하는 방식을 표준화하여, 모델이 별도의 맞춤형 배선 없이도 새로운 도구에 훨씬 쉽게 연결될 수 있도록 합니다. 이는 USB 표준과 유사합니다. USB 이전에는 모든 장치마다 고유한 전용 연결 방식이 필요했지만, USB 이후에는 하나의 표준 인터페이스가 모든 것에 작동합니다.

이제 2단계 에이전트가 무엇을 했는지 살펴보십시오. 에이전트는 당신이 지정한 작업을 완전하고 정확하게 수행했습니다. 작업이 완료되었을 때 에이전트는 멈췄습니다. 스스로에게 무엇을 더 알면 유용할지 묻지 않았습니다. 그곳에 있는 김에 제품 로드맵 힌트를 찾기 위해 경쟁사의 블로그도 확인해야겠다고 결정하지도 않았습니다. 당신은 특정 작업을 주었고, 에이전트는 그 작업을 수행한 뒤 당신의 다음 지시를 기다렸습니다. 여전히 할 일 목록 (To-do list)을 쥐고 있는 것은 당신입니다. 에이전트는 목록의 각 항목을 수행하는 데는 탁월하지만, 목록 자체를 만들지는 않습니다.

3단계 에이전틱 AI (Agentic AI): 프로젝트 전체를 맡는 전문가
이제 당신은 시스템에 작업(Task)이 아닌 목표(Goal)를 전달합니다: “오늘 일과 종료 전까지 우리의 상위 두 경쟁사에 대한 완전한 경쟁 정보 브리프 (Competitive intelligence brief)를 작성해 줘.”

당신은 무엇을 조사해야 할지 명시하지 않습니다. 출처를 나열하지도 않습니다. 가격 책정, 제품 로드맵 (product roadmap), 팀 구성 변화, 그리고 최근 고객 리뷰를 확인하라고 말하지도 않습니다. 당신은 그저 목표를 부여하고 물러납니다.

시스템이 작동하기 시작합니다. 시스템은 경쟁 정보 브리프 (competitive intelligence brief)에 무엇이 포함되어야 하는지 식별하고, 스스로 조사 의제 (research agenda)를 결정하며, 실행에 옮깁니다. 각 경쟁사의 웹사이트를 검색합니다. 최근 제품 발표 내용을 읽습니다. 고객의 감정 변화 (customer sentiment shifts)를 확인하기 위해 리뷰 플랫폼을 점검합니다. 각 기업에 대한 뉴스 보도를 검색합니다. 작업 중간에, 시스템은 한 경쟁사가 오늘 아침 새로운 가격 페이지를 게시했다는 사실과, 다른 경쟁사가 웹사이트에서 제품 기능 하나를 조용히 삭제했다는 사실을 발견합니다. 두 가지 모두 중요한 정보입니다. 시스템은 이러한 발견 사항이 더 눈에 띄도록 브리프 개요를 조정합니다.

시스템은 다음 단계로 무엇을 해야 할지 당신에게 묻기 위해 멈추는 일이 전혀 없습니다. 한 검색 결과가 무관한 내용을 반환하면, 쿼리 (query)를 재구성하여 다시 시도합니다. 브리프 초안에 시장 포지셔닝 (market positioning) 섹션이 부족하면, 당신이 명시적으로 언급하지 않았더라도 목표가 이를 암시하고 있었기에 섹션을 추가합니다. 한 섹션을 완료하면, 원래의 목표와 대조하여 읽어본 뒤 브리프가 달성해야 했던 목적을 충분히 다루지 못한 부분을 수정합니다. 하루가 끝날 무렵, 완성된 브리프가 당신의 편지함에 도착합니다.

이것이 바로 3단계 에이전틱 AI (Agentic AI)입니다. 동일한 언어 모델 (Language Model)과 동일한 도구 (Tools)를 사용하지만, 이제는 2022년 10월 arXiv에 발표된 ReAct 논문에서 처음으로 공식 기술된 계획 루프 (Planning Loop) 내에서 작동합니다. ReAct 프레임워크는 언어 모델이 추론 (Reasoning)과 행동 (Acting)을 교차하여 수행할 때 복잡한 작업에서 능력이 극적으로 향상된다는 것을 보여주었습니다. 즉, 한 번에 완벽한 답변을 내놓으려 하기보다, 단계를 계획하고, 도구를 사용하여 실행하며, 도구가 반환한 결과를 관찰하고, 학습한 내용을 바탕으로 계획을 업데이트하며, 목표가 달성될 때까지 이 과정을 반복합니다. 여러분이 접하게 될 모든 에이전틱 AI 시스템은 특정 프레임워크나 아키텍처에 관계없이 이 루프의 어떤 버전을 실행하고 있는 것입니다.

2단계와 3단계 사이의 결정적인 차이점은 Anthropic이 효과적인 에이전트를 구축하기 위해 발표한 가이드라인에서 정확하게 설명되었습니다. 워크플로 (Workflow)에서는 설계자가 단계를 미리 결정하고 모델은 세부 사항을 채워 넣는 반면, 에이전틱 시스템 (Agentic System)에서는 모델이 진행 과정에서 발견한 내용을 바탕으로 스스로 단계를 결정합니다. 2단계가 레시피를 따르는 것이라면, 3단계는 스스로 레시피를 작성합니다.

(더 읽어보기: https://www.itdaksh.com/blog/what-is-agentic-ai-a-complete-beginner-s-guide-for-2026/)

KNOW-DO-DECIDE 프레임워크: 세 단계 모두를 보여주는 정밀한 지도

The KNOW-DO-DECIDE Capability Ladder<br>

(위의 프레임워크 시각 자료 참조)

KNOW-DO-DECIDE 프레임워크는 세 단계를 세 가지 별개의 능력으로 매핑하며, 각 단계는 이전 단계를 기반으로 구축됩니다.

1단계 — KNOW (AI / LLM): 시스템은 무언가를 알고 이를 설명할 수 있는 두뇌를 가지고 있습니다. 하지만 행동할 수는 없습니다. 도구도 없고 계획 능력도 없습니다. 적절한 사용 사례는 당신(인간)이 모든 행동을 수행하며, 필요한 가치가 지식, 설명, 요약, 또는 텍스트 생성인 모든 상황입니다.

2단계 — DO (AI 에이전트 (AI Agent)): 시스템은 두뇌에 도구를 더해 당신이 명시한 작업에 따라 행동할 수 있습니다. 당신이 작업을 정의하면, 시스템이 이를 실행합니다. 적절한 사용 사례는 단계가 대부분 예측 가능하고 목표가 명확한 잘 정의된 개별 작업입니다. 예: "이 특정 소스들을 검색하여 구조화된 비교 결과를 반환하라" 또는 "이 문서를 읽고 주요 수치들을 표로 추출하라" 등입니다.

3단계 — DECIDE (에이전틱 AI (Agentic AI)): 시스템은 두뇌, 도구, 계획 루프 (planning loop), 단계 간의 메모리 (memory), 그리고 잠재적으로 협력하는 여러 개의 하위 에이전트 (subagents)를 가지고 있습니다. 시스템은 목표를 전달받아 스스로 경로를 결정합니다. 적절한 사용 사례는 경로를 사전에 완전히 정의할 수 없는 복잡한 작업입니다. 이 작업은 시스템이 진행 과정에서 무엇을 해야 할지 스스로 발견하고, 예상치 못한 결과에 적응하며, 여러 작업 흐름을 통합해야 합니다.

이 단계들은 별개의 제품이 아닙니다. 이는 연속적인 다이얼 위의 지점들이며, 동일한 시스템이라도 어떻게 호출되느냐에 따라 서로 다른 단계에서 작동할 수 있습니다. 질문에 답하도록 요청받은 언어 모델은 1단계에 있습니다. 동일한 모델에 웹 검색 도구를 주고 특정 주제를 조사하도록 요청하면 2단계에 있습니다. 동일한 모델에 그 도구와 계획 프롬프트 (planning prompt), 그리고 다단계 목표를 부여하면 3단계에 있게 됩니다.

완전한 에이전틱 AI 시스템의 내부 구성 요소

3단계 시스템의 구성 요소를 이해하는 것은 이러한 도구로 무언가를 구축하거나 AI 제품을 평가하려는 모든 사람에게 유용합니다. 모든 에이전틱 시스템은 동일한 구성 요소 세트를 가지고 있으며, 당신이 마주하는 어떤 시스템에서든 이 요소들을 식별해낸다면 그 시스템이 무엇을 할 수 있고 무엇을 할 수 없는지를 알 수 있습니다.

AI, AI 에이전트(AI Agents), 그리고 에이전틱 AI(Agentic AI)의 정확한 차이점: 마침내 쉽게 설명해 드립니다

요약

핵심 포인트

댓글