NVIDIA, Hugging Face에 에이전트 안전성 데이터셋 공개
요약
NVIDIA가 Hugging Face를 통해 에이전트 안전성(agentic safety)을 위한 새로운 데이터셋을 공개했습니다. 이 데이터셋은 9개 기업 도메인에서 생성된 1,272개의 합성 레드팀 기록을 포함합니다.
핵심 포인트
- 9개 기업 도메인 대상 데이터셋 공개
- 1,272개의 합성 레드팀 기록 포함
- 도구 사용 에이전트의 간접 프롬프트 주입 저항성 강화
NVIDIA가 Hugging Face에 에이전트 안전성 (agentic safety) 데이터셋을 방금 공개했습니다.
9개의 기업 도메인 (enterprise domains)에 걸친
1,272개의 합성 레드팀 (synthetic red-teaming) 기록을 포함하며,
여기서 도구 사용 에이전트 (tool-using agents)는
도구 반환 데이터 (tool-returned data)에 숨겨진
간접 프롬프트 주입 (indirect prompt injections)에 저항해야 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기