본문으로 건너뛰기

© 2026 Molayo

GitHub요약2026. 06. 15. 10:16

NVIDIA/workbench-example-agentic-rag

요약

NVIDIA AI Workbench를 사용하여 Agentic RAG 시스템을 구축하고 실행하는 방법을 설명합니다. 경로 설정, 평가, 반복 과정을 통해 RAG의 정확도를 높이고 프롬프트 및 파라미터를 조정하는 가이드를 제공합니다.

핵심 포인트

  • Agentic RAG의 핵심 프로세스(Route, Evaluate, Iterate) 설명
  • NVIDIA 엔드포인트 및 Tavily API를 활용한 구현 방법
  • 초보자부터 고급 사용자까지 단계별 모드 제공
  • NVIDIA AI Workbench를 통한 프로젝트 복제 및 설정 가이드

Route (경로): RAG 컨텍스트가 쿼리와 관련이 있는지 확인하고, 컨텍스트가 부족할 경우 실시간 웹 검색을 추가합니다.
Evaluate (평가): 응답의 관련성과 정확성을 확인하고, 환각 (Hallucination) 현상을 탐지합니다.
Iterate (반복): 여러 번의 평가 및 생성 사이클을 거칩니다.

Edit Prompts (프롬프트 편집): 자신만의 프롬프트를 통해 결과를 맞춤 설정합니다.
Change Parameters (파라미터 변경): 파라미터와 런타임 변수를 통해 에이전트의 동작을 조정합니다.
Look and Feel (외관 및 느낌): 코드를 직접 편집하여 에이전트와 UI를 변경합니다.

Free Endpoints (무료 엔드포인트): build.nvidia.com의 무료 엔드포인트를 사용합니다.
Self-Hosted (자체 호스팅): 본인의 GPU에 있는 Ollama 또는 NIM을 가리킵니다.

Easy Mode (쉬운 모드): 애플리케이션을 사용합니다.
Intermediate Mode (중급 모드): 애플리케이션을 수정합니다.
Advanced Mode (고급 모드): 추론을 위해 GPU를 자체 호스팅합니다.

Workbench 없이도 Agentic RAG를 실행할 수 있지만, 이 README는 NVIDIA AI Workbench가 설치되어 있음을 전제로 합니다. 설치 방법은 여기를 참조하세요.

Agentic RAG는 문서 임베딩 (Embedding)을 위해 NVIDIA 엔드포인트를 사용하므로 인터넷 연결이 필요합니다.

  • NVIDIA 및 Tavily API 키를 확보하세요:
    AI Workbench로 이 리포지토리를 Clone (복제) 하세요 > 프롬프트가 나타나면 키를 설정합니다. - Open Chat (채팅 열기) 클릭 > 웹 앱의 Document (문서) 탭으로 이동 > Add to Context (컨텍스트에 추가) 클릭. - 질문을 입력하고 엔터를 누르세요 > 답변은 무료 클라우드 엔드포인트에서 제공됩니다.

Click to Expand Easy Mode (클릭하여 쉬운 모드 확장)

Agentic RAG Web App Screenshot

단계발생 가능한 문제스크린샷
1. 데스크톱 앱 열기 > local 선택아마도 Docker Desktop 문제일 것입니다 (설치 시 선택한 경우). 해결 방법: 여기에서 문제 해결 방법을 확인하세요
2. Clone Project 클릭 > 리포지토리 URL 붙여넣기 > Clone잘못된 URL. 해결 방법: 올바른 URL을 사용하세요.
3. Resolve Now 클릭 > NVIDIA 및 Tavily API 키 입력배너가 보이지 않음. 해결 방법: Project Container > Variables > API 키 설정을 위해 구성하세요. 문서 참조
4. Open Chat 클릭거의 문제가 발생하지 않습니다
5. Documents 클릭 > Create Context 클릭잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요.
6. 질문 입력 > 엔터 누르기잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요.

자신만의 문서와 프롬프트 (prompts)를 사용하여 작업하고 싶을 때는 다음 단계들을 따르세요.

단계발생할 수 있는 문제스크린샷
1. Documents > Clear Context 클릭거의 없음.Vector DB (벡터 데이터베이스) 초기화.
2. URL 삭제 > 본인의 URL 추가 > Add to Context 클릭해결할 수 없는 URL. 해결 방법: 적절한 URL을 입력하세요.새로운 컨텍스트 (context).
3. 질문 입력 > 엔터 누르기잘못된 API 키. 해결 방법: 위 표의 3단계에 따라 수정하세요.에이전트 (agent) 실행.

중간 모드 (Intermediate Mode) 펼치기

Diagram of Agentic Framework

이 애플리케이션은 빠른 프로토타입 (prototype)이며 견고한 소프트웨어가 아닙니다. 따라서 개선할 수 있는 많은 기회가 있습니다.

  • 이 프로젝트를 본인의 GitHub 계정으로 포크 (Fork) 하세요. 그런 다음 Workbench에서 클론 (clone) 하세요.
  • 프로젝트에 VS Code를 추가하세요.
  • 메인 (main) 브랜치를 보호하기 위해 experiment 브랜치를 생성하세요 - 데스크톱 앱에서 VS Code를 열고 애플리케이션 코드를 편집하세요.
  • 재귀 제한 (recursion limit), Tavily가 반환하는 웹사이트 수, 이전 검색 저장 여부를 변경하세요.
  • build.nvidia.com에서 새로운 엔드포인트 (endpoints)를 추가하세요.
  • Gradio 앱의 디자인을 변경하거나 새로운 기능을 추가하세요.
  • 에이전트 (agent)를 수정하세요.
  • 발견되는 모든 버그를 수정하세요.

고급 모드 (Advanced Mode) 펼치기

프롬프트 (prompts) 구성, 본인만의 엔드포인트 (endpoints) 추가, Gradio 앱 변경 등 원하는 대로 애플리케이션을 수정하려면 다음 세부 사항을 사용하세요.

  • NVIDIA GPU와 Docker가 설치된 Linux 환경을 구축하세요.
  • 해당 호스트에 Ollama 컨테이너 또는 NVIDIA NIM을 배포하세요.
  • 채팅 앱이 셀프 호스팅된 엔드포인트 (self-hosted endpoint)를 사용하도록 구성하세요.

이 NVIDIA AI Workbench 예제 프로젝트는 Apache 2.0 라이선스 하에 있습니다.

이 프로젝트는 추가적인 제3자 오픈 소스 소프트웨어 프로젝트를 활용할 수 있습니다. 사용하기 전에 이러한 오픈 소스 프로젝트의 라이선스 약관을 검토하십시오. 이 프로젝트의 일부로 사용된 제3자 구성 요소는 해당 구성 요소와 함께 제공되는 별도의 법적 고지 또는 약관의 적용을 받습니다. 제3자 구성 요소의 라이선스 약관 및 요구 사항 준수 여부를 확인하는 것은 귀하의 책임입니다.

❓ 질문이 있으신가요?
이 프로젝트에 대한 문제 제기, 수정 사항, 제안 및 토론은 여기 DevZone Members Only Forum 스레드로 문의해 주세요

⬇️ AI Workbench 다운로드 | 📖 사용자 가이드 | 📂 기타 프로젝트 | 🚨 사용자 포럼

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub AI Tools의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0