arXiv논문2026. 05. 05. 12:52

U-Define: LLM 기반 계획에서 하드/소프트 제약 조건을 위한 사용자 워크플로우 설계

요약

본 기술 기사는 LLM이 생성하는 작업 계획에 사용자가 효과적으로 개입하고 의도를 표현할 수 있도록 돕는 새로운 시스템 U-Define를 소개합니다. 기존 연구의 한계점인 하드 제약 조건의 경직성과 복잡한 가중치 문제를 해결하기 위해, U-Define는 제약을 '하드(Hard)'와 '소프트(Soft)'라는 두 가지 고수준 유형으로 추상화했습니다. 이 시스템은 사용자가 자연어로 제약을 정의하고, 이를 형식 모델 확인(하드) 또는 LLM 기반 평가(소프트)를 통해 검증함으로써, 사용자 경험을 유지하면서도 계획의 신뢰성과 유연성을 동시에 확보할 수 있게 합니다.

핵심 포인트

LLM 기반 작업 계획은 블랙박스 특성으로 인해 사용자의 제어 및 신뢰성 보장에 어려움이 있다.
기존의 하드 제약 조건 방식은 너무 경직적이거나 복잡하여 사용자에게 혼란을 줄 수 있다.
U-Define 시스템은 제약을 '하드(Hard)'와 '소프트(Soft)'라는 두 가지 고수준 유형으로 분류하여 사용자가 의도를 명확하게 표현하도록 돕는다.
하드 제약 조건은 형식 모델 확인(Formal Model Checking)으로, 소프트 제약 조건은 LLM-as-judge 평가로 검증된다.
사용자 연구 결과, 정의된 제약 유형을 활용하는 것이 시스템의 유용성, 성능 및 만족도를 모두 개선한다.

LLM 은 점차 최종 사용자 작업 계획에 사용되고 있지만, 그 블랙박스 특성은 사용자의 신뢰성 보장 및 제어 능력을 제한합니다. 최근 시스템이 검증 기술을 통합했음에도 불구하고, 사용자가 이러한 경직된 제약을 적용하여 의도를 표현하거나 실제 세계의 변동성에 적응하는 방법을 효과적으로 적용할 수 있는지 명확하지 않습니다. 예를 들어, 기존 연구는 하드만 제약 조건이 너무 경직적이며 수치적 유연성 가중치가 사용자를 혼란스럽게 한다고 발견했습니다. 우리는 LLM 생성 계획을 안내하기 위해 제약을 적용하는 데 사용자의 상호작용 워크플로우가 어떻게 더 잘 지원할 수 있는지 조사하고, 엄격한 강도를 고수준 유형 (즉, 하드와 소프트) 으로 추상화하고 다른 검증 메커니즘과 함께 하는 것이 사용자가 의도를 더 신뢰성 있게 표현하고 정렬하는 데 도움이 되는지 여부를 살펴보았습니다. 우리는 사용자가 자연어로 제약을 정의하고 이를 위반해서는 안 되는 하드 규칙 또는 유연성을 허용하는 소프트 선호도로 분류할 수 있도록 U-Define 라는 시스템을 제시했습니다. U-Define 는 하드 제약 조건을 위한 형식 모델 확인과 소프트 제약 조건을 위한 LLM-as-judge 평가를 통해 이러한 유형을 검증합니다. 일반 및 전문가 참여자를 대상으로 한 기술 평가와 사용자 연구를 통해, 사용자가 정의한 제약 유형은 사용성 유지하면서 인식된 유용성, 성능 및 만족도를 개선한다는 것을 발견했습니다. 이러한 발견은 유연하면서도 신뢰할 수 있는 제약 기반 워크플로우 설계를 위한 통찰력을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

U-Define: LLM 기반 계획에서 하드/소프트 제약 조건을 위한 사용자 워크플로우 설계

요약

핵심 포인트

댓글