AgenticRAG-Survey

이 저장소의 목차에서 새로운 Agentic Workflow Patterns(에이전트 워크플로우 패턴)를 확인하려면 섹션 4를 참조하세요. Agentic RAG의 개요(Overview)를 강화하기 위해 새로운 이미지들이 추가되었습니다. 논문 또한 업데이트되었습니다.

Agentic Retrieval-Augmented Generation (Agentic RAG, 에이전트 검색 증강 생성)은 RAG 파이프라인에 자율 에이전트(autonomous agents)를 내장함으로써 인공지능 분야의 변혁적인 도약을 나타냅니다. 이 저장소는 서베이 논문인 "Agentic Retrieval-Augmented Generation (Agentic RAG): A Survey On Agentic RAG"를 보완하며, 다음과 같은 통찰을 제공합니다:

성찰(reflection), 계획(planning), 도구 사용(tool use), 다중 에이전트 협업(multi-agent collaboration)과 같은 **Agentic Patterns (에이전트 패턴)**을 포함한 기초 원칙.
단일 에이전트(single-agent), 다중 에이전트(multi-agent), 계층적(hierarchical), 교정적(corrective), 적응형(adaptive), 그래프 기반(graph-based) RAG와 같은 프레임워크를 보여주는 Agentic RAG 시스템의 상세한 분류 체계(taxonomy).
전통적인 RAG, Agentic RAG, 그리고 Agentic Document Workflows (ADW, 에이전트 문서 워크플로우)의 비교 분석을 통해 각각의 강점, 약점 및 최적의 시나리오를 강조.
의료, 교육, 금융, 법률 분석과 같은 산업 전반에 걸친 실제 응용 사례.
확장성(scaling), 윤리적 AI, 멀티모달 통합(multimodal integration), 인간-에이전트 협업(human-agent collaboration)에서의 과제 및 향후 방향.

이 저장소는 연구자와 실무자들이 Agentic RAG 시스템의 역량을 탐구, 구현 및 발전시키기 위한 포괄적인 리소스로 활용됩니다.

📜 초록 (Abstract)
🧩 서론 (Introduction)
🤖 에이전트 패턴 (Agentic Patterns)
🔄 에이전트 워크플로우 패턴 (Agentic Workflow Patterns)
🛠️ Agentic RAG 시스템의 분류 체계 (Taxonomy of Agentic RAG Systems)
🔍 Agentic RAG 프레임워크의 비교 분석 (Comparative Analysis of Agentic RAG Frameworks)
💼 응용 분야 (Applications)
🚧 과제 및 향후 방향 (Challenges and Future Directions)
🛠️ RAG 에이전트 분류 체계의 구현: 기술 및 도구 (Implementation of RAG Agentic Taxonomy: Techniques and Tools)
📰 Agentic RAG에 관한 블로그 및 튜토리얼 (Blogs and Tutorials on Agentic RAG)
🖊️ 주목할 만한 관련 개념 (Noteworthy Related Concepts)
💡 Agentic RAG의 실제 구현 및 사용 사례 (Practical Implementations and Use Cases of Agentic RAG)
📚 참고 문헌 (References)
🖊️ 인용 방법 (How to Cite)

검색 증강 생성 (Retrieval-Augmented Generation (RAG)) 시스템은 대규모 언어 모델 (LLMs)의 능력과 검색 메커니즘을 결합하여 문맥적으로 관련성이 높고 정확한 응답을 생성합니다. 전통적인 RAG 시스템은 지식 검색 및 생성에는 뛰어나지만, 동적이고 다단계인 추론 작업, 적응성, 그리고 복잡한 워크플로우를 위한 오케스트레이션 (Orchestration)을 처리하는 데에는 종종 한계를 보입니다.

**에이전틱 검색 증강 생성 (Agentic Retrieval-Augmented Generation (Agentic RAG))**은 자율적인 AI 에이전트를 통합함으로써 이러한 한계를 극복합니다. 이러한 에이전트들은 성찰 (Reflection), 계획 (Planning), 도구 사용 (Tool use), 그리고 다중 에이전트 협업 (Multi-agent collaboration)과 같은 핵심 **에이전틱 패턴 (Agentic Patterns)**을 채택하여, 작업별 요구 사항에 동적으로 적응하고 다음과 같은 분야에서 탁월한 성능을 제공합니다:

다중 도메인 지식 검색.
실시간, 문서 중심 워크플로우.
확장 가능하고 적응적이며 윤리적인 AI 시스템.

이 저장소(Repository)는 RAG에서 Agentic RAG로의 진화를 탐구하며 다음을 제시합니다:

에이전틱 패턴 (Agentic Patterns): 시스템의 적응성과 지능을 구동하는 핵심 원칙.
분류 체계 (Taxonomy): Agentic RAG 아키텍처에 대한 포괄적인 분류.
비교 분석 (Comparative Analysis): 전통적인 RAG, Agentic RAG, 그리고 ADW 간의 주요 차이점.
응용 분야 (Applications): 의료, 교육, 금융 등 다양한 분야의 실제 사용 사례.
과제 및 향후 방향 (Challenges and Future Directions): 확장성, 윤리적 AI, 그리고 멀티모달 (Multimodal) 통합 문제 해결.

연구자, 개발자, 또는 실무자라면 누구나 이 저장소를 통해 Agentic RAG 시스템을 이해하고 발전시키기 위한 가치 있는 통찰력과 리소스를 얻을 수 있습니다.

Agentic RAG 시스템은 잘 정의된 에이전틱 패턴으로부터 지능과 적응성을 얻습니다. 이러한 패턴은 에이전트가 복잡한 추론 작업을 처리하고, 동적인 환경에 적응하며, 효과적으로 협업할 수 있도록 합니다. 다음은 Agentic RAG의 중심이 되는 주요 패턴입니다:

정의 (Definition): 에이전트 (Agents)는 자신의 결정과 출력을 평가하여 오류와 개선이 필요한 부분을 식별합니다.
주요 이점 (Key Benefits):

결과의 반복적인 개선 (Iterative refinement)을 가능하게 합니다.
다단계 추론 (Multi-step reasoning) 작업에서의 정확도를 향상시킵니다.

예시 (Example): 의료 진단 시스템에서 에이전트는 검색된 데이터로부터 얻은 반복적인 피드백을 바탕으로 진단을 정교화합니다.

정의 (Definition): 에이전트는 문제를 효율적으로 해결하기 위해 구조화된 워크플로우 (Workflows)와 작업 시퀀스 (Task sequences)를 생성합니다.
주요 이점 (Key Benefits):

작업을 세분화함으로써 다단계 추론 (Multi-step reasoning)을 용이하게 합니다.
최적화된 작업 우선순위 설정을 통해 계산 오버헤드 (Computational overhead)를 줄입니다.

예시 (Example): 금융 분석 시스템은 리스크를 평가하고 권장 사항을 제공하기 위해 데이터 검색 작업을 계획합니다.

정의 (Definition): 에이전트는 외부 도구 (Tools), API, 지식 베이스 (Knowledge bases)와 상호작용하여 데이터를 검색하고 처리합니다.
주요 이점 (Key Benefits):

사전 학습된 지식 (Pre-trained knowledge)을 넘어 시스템의 역량을 확장합니다.
외부 리소스를 통합함으로써 도메인 특화 (Domain-specific) 애플리케이션을 가능하게 합니다.

예시 (Example): 법률 보조 에이전트는 계약 데이터베이스에서 조항을 검색하고 준수 여부 분석을 위해 도메인 특화 규칙을 적용합니다.

정의 (Definition): 여러 에이전트가 협업하여 복잡한 작업을 분할 정복 (Divide and conquer)하고, 정보와 결과를 공유합니다.
주요 이점 (Key Benefits):

대규모 및 분산된 문제를 효율적으로 처리합니다.
더 나은 결과를 위해 전문화된 에이전트 역량을 결합합니다.

예시 (Example):

고객 지원 분야에서 에이전트들은 FAQ에서 지식을 검색하고, 응답을 생성하며, 후속 조치를 제공하기 위해 협업합니다.

LawGlance는 관련 문서를 검색하고, 정보를 분석하며, 정확한 법률적 통찰력을 전달하기 위해 **멀티 에이전트 워크플로우 (Multi-agent workflows)**를 활용함으로써 법률 조사를 단순화합니다. 이는 Crew AI, LangChain, Chroma를 통합하여 법률 문서를 검색하고, 웹 검색을 수행하며, 사용자 질의에 맞춤화된 간결하고 정확한 답변을 제공합니다.

Google Colab에서 LawGlance 접속하기

이러한 패턴들은 Agentic RAG 시스템의 중추를 형성하며, 시스템이 다음과 같은 작업을 수행할 수 있도록 합니다:

작업 요구 사항에 따라 동적으로 적응 (Adapt dynamically).
자기 평가 (Self-evaluation)를 통해 의사 결정 개선.
도메인 특화 추론 (Domain-specific reasoning)을 위해 외부 리소스 활용.
협업을 통해 복잡하고 분산된 워크플로 (Workflows) 처리.

Agentic 워크플로 패턴은 LLM 기반 애플리케이션을 구조화하여 성능, 정확도 및 효율성을 최적화하는 데 도움을 줍니다. 작업의 복잡성과 처리 요구 사항에 따라 서로 다른 접근 방식이 적합합니다.

출처: Anthropic Research 및 LangGraph Workflows

정의:

프롬프트 체이닝 (Prompt chaining)은 복잡한 작업을 여러 단계로 분해하며, 각 단계는 이전 단계의 결과물을 바탕으로 구축됩니다. 이러한 구조적 접근 방식은 다음 단계로 넘어가기 전 각 하위 작업 (Subtask)을 단순화함으로써 정확도를 향상시킵니다. 그러나 순차적 처리로 인해 지연 시간 (Latency)이 증가할 수 있습니다.

사용 시점:

이 워크플로는 작업이 고정된 하위 작업으로 분해될 수 있고, 각 작업이 최종 출력에 기여할 수 있을 때 가장 효과적입니다. 특히 단계별 추론 (Step-by-step reasoning)이 정확도를 높이는 시나리오에서 유용합니다.

활용 사례:

한 언어로 마케팅 콘텐츠를 생성한 다음, 뉘앙스를 유지하면서 다른 언어로 번역하기.
먼저 개요를 생성하고, 완성도를 검증한 다음, 전체 텍스트를 작성하여 문서 생성 구조화하기.

정의:

라우팅 (Routing)은 입력을 분류하고 이를 적절한 전문 프롬프트나 프로세스로 전달하는 것을 포함합니다. 이 방법은 서로 다른 쿼리나 작업을 별도로 처리하도록 보장하여 효율성과 응답 품질을 향상시킵니다.

사용 시점:

입력 유형에 따라 서로 다른 처리 전략이 필요한 시나리오에 이상적이며, 각 카테고리에 대해 최적화된 성능을 보장합니다.

활용 사례:

고객 서비스 쿼리를 기술 지원, 환불 요청 또는 일반 문의와 같은 카테고리로 분류하여 전달하기.
비용 효율성을 위해 간단한 쿼리는 더 작은 모델에 할당하고, 복잡한 요청은 고급 모델로 전달하기.

정의:

병렬화 (Parallelization)는 작업을 동시에 실행되는 독립적인 프로세스로 나누어 지연 시간 (latency)을 줄이고 처리량 (throughput)을 향상시킵니다. 이는 다음과 같이 분류할 수 있습니다:

섹셔닝 (Sectioning): 작업을 독립적인 하위 작업으로 분할하기.
투표 (Voting): 정확도를 높이기 위해 여러 개의 출력을 생성하기.

사용 시점:

속도를 높이기 위해 작업을 독립적으로 실행할 수 있거나, 여러 출력을 통해 신뢰도를 높일 수 있을 때 유용합니다.

예시 애플리케이션:

섹셔닝 (Sectioning): 한 모델이 입력을 검사하는 동안 다른 모델이 응답을 생성하는 콘텐츠 모더레이션 (content moderation)과 같은 작업 분할.
투표 (Voting): 여러 모델을 사용하여 코드의 취약점을 교차 검증하거나 콘텐츠 모더레이션 결정을 분석하기.

정의:

이 워크플로 (workflow)는 중앙 오케스트레이터 (orchestrator) 모델이 작업을 하위 작업으로 동적으로 분해하고, 이를 전문화된 워커 (worker) 모델에 할당하며, 결과를 취합하는 특징을 가집니다. 병렬화와 달리, 입력의 복잡성 변화에 적응합니다.

사용 시점:

하위 작업이 미리 정의되어 있지 않고, 동적인 분해와 실시간 적응이 필요한 작업에 가장 적합합니다.

예시 애플리케이션:

요청된 변경 사항의 성격에 따라 코드베이스 내의 여러 파일을 자동으로 수정하기.
여러 소스에서 관련 정보를 수집하고 합성하여 실시간 리서치 수행하기.

정의:

평가자-최적화 (evaluator-optimizer) 워크플로는 초기 출력을 생성하고 평가 모델 (evaluation model)의 피드백을 바탕으로 이를 개선함으로써 콘텐츠를 반복적으로 향상시킵니다.

사용 시점:

반복적인 개선이 응답 품질을 크게 향상시킬 때, 특히 명확한 평가 기준이 존재할 때 효과적입니다.

예시 애플리케이션:

여러 차례의 평가 및 개선 사이클을 통해 문학 번역 품질 향상하기.
추가적인 반복을 통해 검색 결과를 정교화하는 다회차 리서치 쿼리 수행하기.

에이전틱 검색 증강 생성 (Agentic Retrieval-Augmented Generation (RAG)) 시스템은 특정 작업과 복잡도 수준에 맞게 설계된 다양한 아키텍처와 워크플로를 포함합니다. 아래는 이러한 시스템에 대한 상세한 분류 체계입니다:

핵심 아이디어 (Key Idea): 단일 자율 에이전트 (Single autonomous agent)가 검색 (Retrieval) 및 생성 (Generation) 프로세스를 관리합니다.

워크플로 (Workflow):

에이전트에게 쿼리 (Query)가 제출됩니다.
에이전트가 외부 소스로부터 관련 데이터를 검색합니다.
데이터가 처리되어 응답으로 합성 (Synthesize)됩니다.

장점 (Advantages):

기본적인 사용 사례에 대해 단순한 아키텍처를 가집니다.
구현 및 유지보수가 용이합니다.

한계 (Limitations):

확장성 (Scalability)이 제한적입니다.
다단계 추론 (Multi-step reasoning) 또는 대규모 데이터셋에는 비효율적입니다.

핵심 아이디어 (Key Idea): 에이전트 팀 (Team of agents)이 협력하여 복잡한 검색 및 추론 작업을 수행합니다.

워크플로 (Workflow):

에이전트들이 작업을 동적으로 분할합니다 (예: 검색, 추론, 합성).
각 에이전트는 특정 하위 작업 (Sub-task)에 특화되어 있습니다.
결과가 집계되어 일관된 출력물로 합성됩니다.

장점 (Advantages):

분산된 다단계 작업에 대해 더 나은 성능을 보입니다.
모듈성 (Modularity)과 확장성이 향상됩니다.

한계 (Limitations):

에이전트 수가 증가함에 따라 조정 (Coordination) 복잡성이 증가합니다.
에이전트 간의 중복 또는 충돌 위험이 있습니다.

AgentFlow는 오늘날의 도구 증강 추론 (Tool-augmented reasoning) 방식이 가진 **확장성 및 일반화의 한계 (Scalability and generalization limits)**를 극복하기 위해 설계된 **학습 가능하고 도구가 통합된 에이전트 프레임워크 (Trainable, tool-integrated agentic framework)**입니다. 이 프레임워크는 Planner (계획가), Executor (실행가), Verifier (검증가), **Generator (생성가)**라는 네 가지 특화된 모듈을 조정하며, Flow-GRPO를 사용하여 다회차 (Multi-turn) 작업의 흐름 속에서 planner를 최적화함으로써 장기적 신용 할당 (Long-horizon credit assignment)과 도구 사용의 신뢰성을 향상시킵니다.

주요 특징 (Key Features):

🧩 모듈형 에이전트 시스템 (Modular Agentic System) – 여러 회차에 걸쳐 진화하는 메모리 및 통합된 도구를 통해 조정되는 네 가지 특화된 에이전트 모듈 (Planner, Executor, Verifier, Generator).

🔗 멀티 도구 통합 (Multi-Tool Integration) – base_generator, python_coder, google_search, wikipedia_search, web_search 등을 포함한 다양한 도구 생태계와 원활하게 연결됩니다.

🎯 Flow-GRPO 알고리즘 – 희소 보상 (Sparse rewards)이 발생하는 장기 추론 작업에 대해 흐름 내 에이전트 최적화 (In-the-flow agent optimization)를 가능하게 합니다.

핵심 아이디어 (Key Idea): 더 나은 작업 우선순위 지정 및 위임을 위해 에이전트들을 계층 구조 (Hierarchy)로 조직화합니다.

워크플로우 (Workflow):

최상위 에이전트가 하위 레벨 에이전트들 간의 하위 작업 (Subtasks)을 조율 (Orchestrate)합니다.
각 하위 레벨 에이전트는 프로세스의 특정 부분을 처리합니다.
결과물은 상위 레벨에서 반복적으로 정제되고 통합됩니다.

장점 (Advantages):

크고 복잡한 작업에 대해 확장성 (Scalable)을 가집니다.
모듈형 설계 (Modular design)를 통해 전문화를 용이하게 합니다.

한계 (Limitations):

정교한 조율 메커니즘 (Orchestration mechanisms)이 필요합니다.
계층 구조의 상위 레벨에서 잠재적인 병목 현상 (Bottlenecks)이 발생할 수 있습니다.

핵심 아이디어 (Key Idea): 피드백 루프 (Feedback loops)를 통해 에이전트가 자신의 출력물을 반복적으로 평가하고 정제할 수 있게 합니다.

워크플로우 (Workflow):

에이전트에 의해 초기 응답이 생성됩니다.
비평 모듈 (Critic module)이 응답의 오류나 불일치를 평가합니다.
에이전트는 피드백을 바탕으로 응답을 정제합니다.
출력물이 품질 표준을 충족할 때까지 2~3단계가 반복됩니다.

장점 (Advantages):

반복적인 개선을 통해 높은 정확도와 신뢰성을 확보합니다.
오류가 발생하기 쉽거나 위험 부담이 큰 (High-stakes) 작업에 유용합니다.

한계 (Limitations):

계산 오버헤드 (Computational overhead)가 증가합니다.
무한 루프를 방지하기 위해 피드백 메커니즘이 잘 설계되어야 합니다.

AgenticRAG-Survey

요약

핵심 포인트

댓글