arXiv논문2026. 06. 11. 11:52

책임감 있게 비준수적인 기계에 대한 연구

요약

본 논문은 사용자 요청을 항상 준수하지 않을 수 있는 자율 지능형 에이전트 설계 문제를 다룹니다. 기계의 비준수성(non-compliance)이 다양한 형태로 나타남을 주장하며, 책임감 있게 이러한 비준수성을 구현하는 방법을 제시합니다.

핵심 포인트

자율 지능형 에이전트가 사용자 요청을 항상 준수하지 않을 수 있음을 다룸.
기계의 비준수성(non-compliance)은 여러 형태로 나타남.
책임감 있는 비준수성은 작업 거부 정당화, 무효화 경로 추적 등을 기반으로 함.

우리는 사용자 요청을 책임감 있게 준수하지 않을 수 있는 자율 지능형 에이전트를 설계하는 문제를 고려합니다. 우리는 기계의 비준수성(non-compliance)이 여러 가지 다른 형태로 나타난다고 주장하며, 책임감 있게 비준수적인 지능형 기계를 구현하는 과정에서 우리가 추구해야 할 문제들을 간략하게 설명합니다. 우리는 책임감 있는 비준수성을 작업 거부의 정당화, 비준수를 무효화할 수 있는 경로, 그리고 보안 위험 및 책임 전가에 대한 신중한 추적을 기반으로 합니다.

AI 자동 생성 콘텐츠

원문 바로가기

책임감 있게 비준수적인 기계에 대한 연구

요약

핵심 포인트

댓글