NVIDIA/workbench-example-agentic-rag
요약
NVIDIA AI Workbench를 사용하여 Agentic RAG 시스템을 구축하고 실행하는 방법을 설명합니다. 경로 설정, 평가, 반복 과정을 통해 RAG의 정확도를 높이고 프롬프트 및 파라미터를 조정하는 가이드를 제공합니다.
핵심 포인트
- Agentic RAG의 핵심 프로세스(Route, Evaluate, Iterate) 설명
- NVIDIA 엔드포인트 및 Tavily API를 활용한 구현 방법
- 초보자부터 고급 사용자까지 단계별 모드 제공
- NVIDIA AI Workbench를 통한 프로젝트 복제 및 설정 가이드
Route (경로): RAG 컨텍스트가 쿼리와 관련이 있는지 확인하고, 컨텍스트가 부족할 경우 실시간 웹 검색을 추가합니다.
Evaluate (평가): 응답의 관련성과 정확성을 확인하고, 환각 (Hallucination) 현상을 탐지합니다.
Iterate (반복): 여러 번의 평가 및 생성 사이클을 거칩니다.
Edit Prompts (프롬프트 편집): 자신만의 프롬프트를 통해 결과를 맞춤 설정합니다.
Change Parameters (파라미터 변경): 파라미터와 런타임 변수를 통해 에이전트의 동작을 조정합니다.
Look and Feel (외관 및 느낌): 코드를 직접 편집하여 에이전트와 UI를 변경합니다.
Free Endpoints (무료 엔드포인트): build.nvidia.com의 무료 엔드포인트를 사용합니다.
Self-Hosted (자체 호스팅): 본인의 GPU에 있는 Ollama 또는 NIM을 가리킵니다.
Easy Mode (쉬운 모드): 애플리케이션을 사용합니다.
Intermediate Mode (중급 모드): 애플리케이션을 수정합니다.
Advanced Mode (고급 모드): 추론을 위해 GPU를 자체 호스팅합니다.
Workbench 없이도 Agentic RAG를 실행할 수 있지만, 이 README는 NVIDIA AI Workbench가 설치되어 있음을 전제로 합니다. 설치 방법은 여기를 참조하세요.
Agentic RAG는 문서 임베딩 (Embedding)을 위해 NVIDIA 엔드포인트를 사용하므로 인터넷 연결이 필요합니다.
- NVIDIA 및 Tavily API 키를 확보하세요:
AI Workbench로 이 리포지토리를 Clone (복제) 하세요 > 프롬프트가 나타나면 키를 설정합니다. - Open Chat (채팅 열기) 클릭 > 웹 앱의 Document (문서) 탭으로 이동 > Add to Context (컨텍스트에 추가) 클릭. - 질문을 입력하고 엔터를 누르세요 > 답변은 무료 클라우드 엔드포인트에서 제공됩니다.
Click to Expand Easy Mode (클릭하여 쉬운 모드 확장)

| 단계 | 발생 가능한 문제 | 스크린샷 |
|---|---|---|
| 1. 데스크톱 앱 열기 > local 선택 | 아마도 Docker Desktop 문제일 것입니다 (설치 시 선택한 경우). 해결 방법: 여기에서 문제 해결 방법을 확인하세요 | |
| 2. Clone Project 클릭 > 리포지토리 URL 붙여넣기 > Clone | 잘못된 URL. 해결 방법: 올바른 URL을 사용하세요. | |
| 3. Resolve Now 클릭 > NVIDIA 및 Tavily API 키 입력 | 배너가 보이지 않음. 해결 방법: Project Container > Variables > API 키 설정을 위해 구성하세요. 문서 참조 | |
| 4. Open Chat 클릭 | 거의 문제가 발생하지 않습니다 | |
| 5. Documents 클릭 > Create Context 클릭 | 잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요. | |
| 6. 질문 입력 > 엔터 누르기 | 잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요. |
자신만의 문서와 프롬프트 (prompts)를 사용하여 작업하고 싶을 때는 다음 단계들을 따르세요.
| 단계 | 발생할 수 있는 문제 | 스크린샷 |
|---|---|---|
| 1. Documents > Clear Context 클릭 | 거의 없음. | Vector DB (벡터 데이터베이스) 초기화. |
| 2. URL 삭제 > 본인의 URL 추가 > Add to Context 클릭 | 해결할 수 없는 URL. 해결 방법: 적절한 URL을 입력하세요. | 새로운 컨텍스트 (context). |
| 3. 질문 입력 > 엔터 누르기 | 잘못된 API 키. 해결 방법: 위 표의 3단계에 따라 수정하세요. | 에이전트 (agent) 실행. |
중간 모드 (Intermediate Mode) 펼치기

이 애플리케이션은 빠른 프로토타입 (prototype)이며 견고한 소프트웨어가 아닙니다. 따라서 개선할 수 있는 많은 기회가 있습니다.
- 이 프로젝트를 본인의 GitHub 계정으로 포크 (Fork) 하세요. 그런 다음 Workbench에서 클론 (clone) 하세요.
- 프로젝트에 VS Code를 추가하세요.
- 메인 (main) 브랜치를 보호하기 위해
experiment브랜치를 생성하세요 - 데스크톱 앱에서 VS Code를 열고 애플리케이션 코드를 편집하세요. - 재귀 제한 (recursion limit), Tavily가 반환하는 웹사이트 수, 이전 검색 저장 여부를 변경하세요.
- build.nvidia.com에서 새로운 엔드포인트 (endpoints)를 추가하세요.
- Gradio 앱의 디자인을 변경하거나 새로운 기능을 추가하세요.
- 에이전트 (agent)를 수정하세요.
- 발견되는 모든 버그를 수정하세요.
고급 모드 (Advanced Mode) 펼치기
프롬프트 (prompts) 구성, 본인만의 엔드포인트 (endpoints) 추가, Gradio 앱 변경 등 원하는 대로 애플리케이션을 수정하려면 다음 세부 사항을 사용하세요.
- NVIDIA GPU와 Docker가 설치된 Linux 환경을 구축하세요.
- 해당 호스트에 Ollama 컨테이너 또는 NVIDIA NIM을 배포하세요.
- 채팅 앱이 셀프 호스팅된 엔드포인트 (self-hosted endpoint)를 사용하도록 구성하세요.
이 NVIDIA AI Workbench 예제 프로젝트는 Apache 2.0 라이선스 하에 있습니다.
이 프로젝트는 추가적인 제3자 오픈 소스 소프트웨어 프로젝트를 활용할 수 있습니다. 사용하기 전에 이러한 오픈 소스 프로젝트의 라이선스 약관을 검토하십시오. 이 프로젝트의 일부로 사용된 제3자 구성 요소는 해당 구성 요소와 함께 제공되는 별도의 법적 고지 또는 약관의 적용을 받습니다. 제3자 구성 요소의 라이선스 약관 및 요구 사항 준수 여부를 확인하는 것은 귀하의 책임입니다.
| ❓ 질문이 있으신가요? |
|---|
| 이 프로젝트에 대한 문제 제기, 수정 사항, 제안 및 토론은 여기 DevZone Members Only Forum 스레드로 문의해 주세요 |
⬇️ AI Workbench 다운로드 | 📖 사용자 가이드 | 📂 기타 프로젝트 | 🚨 사용자 포럼
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Tools의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기