책임감 있게 비준수적인 기계에 대한 연구
요약
본 논문은 사용자 요청을 항상 준수하지 않을 수 있는 자율 지능형 에이전트 설계 문제를 다룹니다. 기계의 비준수성(non-compliance)이 다양한 형태로 나타남을 주장하며, 책임감 있게 이러한 비준수성을 구현하는 방법을 제시합니다.
핵심 포인트
- 자율 지능형 에이전트가 사용자 요청을 항상 준수하지 않을 수 있음을 다룸.
- 기계의 비준수성(non-compliance)은 여러 형태로 나타남.
- 책임감 있는 비준수성은 작업 거부 정당화, 무효화 경로 추적 등을 기반으로 함.
우리는 사용자 요청을 책임감 있게 준수하지 않을 수 있는 자율 지능형 에이전트를 설계하는 문제를 고려합니다. 우리는 기계의 비준수성(non-compliance)이 여러 가지 다른 형태로 나타난다고 주장하며, 책임감 있게 비준수적인 지능형 기계를 구현하는 과정에서 우리가 추구해야 할 문제들을 간략하게 설명합니다. 우리는 책임감 있는 비준수성을 작업 거부의 정당화, 비준수를 무효화할 수 있는 경로, 그리고 보안 위험 및 책임 전가에 대한 신중한 추적을 기반으로 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기