NVIDIA/workbench-example-agentic-rag

요약

NVIDIA AI Workbench를 사용하여 Agentic RAG 시스템을 구축하고 실행하는 방법을 설명합니다. 경로 설정, 평가, 반복 과정을 통해 RAG의 정확도를 높이고 프롬프트 및 파라미터를 조정하는 가이드를 제공합니다.

핵심 포인트

Agentic RAG의 핵심 프로세스(Route, Evaluate, Iterate) 설명
NVIDIA 엔드포인트 및 Tavily API를 활용한 구현 방법
초보자부터 고급 사용자까지 단계별 모드 제공
NVIDIA AI Workbench를 통한 프로젝트 복제 및 설정 가이드

Route (경로): RAG 컨텍스트가 쿼리와 관련이 있는지 확인하고, 컨텍스트가 부족할 경우 실시간 웹 검색을 추가합니다.
Evaluate (평가): 응답의 관련성과 정확성을 확인하고, 환각 (Hallucination) 현상을 탐지합니다.
Iterate (반복): 여러 번의 평가 및 생성 사이클을 거칩니다.

Edit Prompts (프롬프트 편집): 자신만의 프롬프트를 통해 결과를 맞춤 설정합니다.
Change Parameters (파라미터 변경): 파라미터와 런타임 변수를 통해 에이전트의 동작을 조정합니다.
Look and Feel (외관 및 느낌): 코드를 직접 편집하여 에이전트와 UI를 변경합니다.

Free Endpoints (무료 엔드포인트): build.nvidia.com의 무료 엔드포인트를 사용합니다.
Self-Hosted (자체 호스팅): 본인의 GPU에 있는 Ollama 또는 NIM을 가리킵니다.

Easy Mode (쉬운 모드): 애플리케이션을 사용합니다.
Intermediate Mode (중급 모드): 애플리케이션을 수정합니다.
Advanced Mode (고급 모드): 추론을 위해 GPU를 자체 호스팅합니다.

Workbench 없이도 Agentic RAG를 실행할 수 있지만, 이 README는 NVIDIA AI Workbench가 설치되어 있음을 전제로 합니다. 설치 방법은 여기를 참조하세요.

Agentic RAG는 문서 임베딩 (Embedding)을 위해 NVIDIA 엔드포인트를 사용하므로 인터넷 연결이 필요합니다.

NVIDIA 및 Tavily API 키를 확보하세요:
AI Workbench로 이 리포지토리를 Clone (복제) 하세요 > 프롬프트가 나타나면 키를 설정합니다. - Open Chat (채팅 열기) 클릭 > 웹 앱의 Document (문서) 탭으로 이동 > Add to Context (컨텍스트에 추가) 클릭. - 질문을 입력하고 엔터를 누르세요 > 답변은 무료 클라우드 엔드포인트에서 제공됩니다.

Click to Expand Easy Mode (클릭하여 쉬운 모드 확장)

단계	발생 가능한 문제	스크린샷
1. 데스크톱 앱 열기 > local 선택	아마도 Docker Desktop 문제일 것입니다 (설치 시 선택한 경우). 해결 방법: 여기에서 문제 해결 방법을 확인하세요
2. Clone Project 클릭 > 리포지토리 URL 붙여넣기 > Clone	잘못된 URL. 해결 방법: 올바른 URL을 사용하세요.
3. Resolve Now 클릭 > NVIDIA 및 Tavily API 키 입력	배너가 보이지 않음. 해결 방법: Project Container > Variables > API 키 설정을 위해 구성하세요. 문서 참조

4. Open Chat 클릭	거의 문제가 발생하지 않습니다
5. Documents 클릭 > Create Context 클릭	잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요.
6. 질문 입력 > 엔터 누르기	잘못된 API 키. 해결 방법: 위 3단계에 따라 수정하세요.

자신만의 문서와 프롬프트 (prompts)를 사용하여 작업하고 싶을 때는 다음 단계들을 따르세요.

단계	발생할 수 있는 문제	스크린샷
1. Documents > Clear Context 클릭	거의 없음.	Vector DB (벡터 데이터베이스) 초기화.
2. URL 삭제 > 본인의 URL 추가 > Add to Context 클릭	해결할 수 없는 URL. 해결 방법: 적절한 URL을 입력하세요.	새로운 컨텍스트 (context).
3. 질문 입력 > 엔터 누르기	잘못된 API 키. 해결 방법: 위 표의 3단계에 따라 수정하세요.	에이전트 (agent) 실행.

중간 모드 (Intermediate Mode) 펼치기

이 애플리케이션은 빠른 프로토타입 (prototype)이며 견고한 소프트웨어가 아닙니다. 따라서 개선할 수 있는 많은 기회가 있습니다.

이 프로젝트를 본인의 GitHub 계정으로 포크 (Fork) 하세요. 그런 다음 Workbench에서 클론 (clone) 하세요.
프로젝트에 VS Code를 추가하세요.
메인 (main) 브랜치를 보호하기 위해 experiment 브랜치를 생성하세요 - 데스크톱 앱에서 VS Code를 열고 애플리케이션 코드를 편집하세요.
재귀 제한 (recursion limit), Tavily가 반환하는 웹사이트 수, 이전 검색 저장 여부를 변경하세요.
build.nvidia.com에서 새로운 엔드포인트 (endpoints)를 추가하세요.
Gradio 앱의 디자인을 변경하거나 새로운 기능을 추가하세요.
에이전트 (agent)를 수정하세요.
발견되는 모든 버그를 수정하세요.

고급 모드 (Advanced Mode) 펼치기

프롬프트 (prompts) 구성, 본인만의 엔드포인트 (endpoints) 추가, Gradio 앱 변경 등 원하는 대로 애플리케이션을 수정하려면 다음 세부 사항을 사용하세요.

NVIDIA GPU와 Docker가 설치된 Linux 환경을 구축하세요.
해당 호스트에 Ollama 컨테이너 또는 NVIDIA NIM을 배포하세요.
채팅 앱이 셀프 호스팅된 엔드포인트 (self-hosted endpoint)를 사용하도록 구성하세요.

이 NVIDIA AI Workbench 예제 프로젝트는 Apache 2.0 라이선스 하에 있습니다.

이 프로젝트는 추가적인 제3자 오픈 소스 소프트웨어 프로젝트를 활용할 수 있습니다. 사용하기 전에 이러한 오픈 소스 프로젝트의 라이선스 약관을 검토하십시오. 이 프로젝트의 일부로 사용된 제3자 구성 요소는 해당 구성 요소와 함께 제공되는 별도의 법적 고지 또는 약관의 적용을 받습니다. 제3자 구성 요소의 라이선스 약관 및 요구 사항 준수 여부를 확인하는 것은 귀하의 책임입니다.

❓ 질문이 있으신가요?
이 프로젝트에 대한 문제 제기, 수정 사항, 제안 및 토론은 여기 DevZone Members Only Forum 스레드로 문의해 주세요

⬇️ AI Workbench 다운로드 | 📖 사용자 가이드 | 📂 기타 프로젝트 | 🚨 사용자 포럼

AI 자동 생성 콘텐츠

원문 바로가기

NVIDIA/workbench-example-agentic-rag

요약

핵심 포인트

댓글