arXiv논문2026. 06. 02. 13:07

거부 전 수리: 문맥적 의사결정을 위한 수리 증강 제약 학습 (Repair-Augmented Constraint Learning)

요약

제약 조건 위반 시 즉각 거부하는 대신, 가능한 수리(repair)를 통해 실행 가능성을 높이는 RACL 프레임워크를 제안합니다. 이 방식은 의사결정 의미론 내에서 수리 연산자를 통합하여 허위 거부를 획기적으로 줄입니다.

핵심 포인트

수리 증강 제약 학습(RACL) 프레임워크 소개
단순 거부 대신 수리 계획과 거부 사유를 함께 반환
허위 거부 격차(False-veto gap) 문제 해결
벤치마크 테스트를 통해 기존 블랙박스 방식 대비 압도적 성능 입증

강한 제약 조건 (Hard constraints)은 대개 최종적인 거부 (terminal vetoes)로 취급됩니다. 즉, 후보가 요구 사항을 위반하면 학습된 규칙이 이를 거부하며, 어떠한 수리 (repair)도 의사결정 의미론 (decision semantics) 외부에서 처리됩니다. 이는 시스템이 티켓 옵션 추가, 구성 변경, 또는 사용 가능한 서비스 업그레이드 요청과 같이 유한한 수정 메뉴를 이미 알고 있는 일반적인 배포 환경을 놓치고 있습니다. 기존의 제약 학습 (constraint-learning), 소프트 완화 (soft-relaxation), 그리고 구제 (recourse) 방법들은 유사한 문제들을 다루지만, 특정 옵션이 거부되기 전에 수리되어야 하는지 여부를 학습하지는 않습니다.

우리는 알려진 수리 연산자 (repair operators)를 분류기 의미론 (classifier semantics)으로 끌어올리는 문맥적 의사결정 프레임워크인 수리 증강 제약 학습 (Repair-Augmented Constraint Learning, RACL)을 소개합니다. 후보는 감당 가능한 수리를 통해 실행 가능하고(feasible) 충분히 선호될 수 있을 때 수락됩니다. 그렇지 않으면 시스템은 구조화된 거부 사유 (rejection credit)와, 적용 가능한 경우 수리 계획 (repair plan)을 반환합니다. 이러한 '거부 전 수리 (repair-before-veto)' 관점은 수리가 없는 HASSLE 스타일의 의미론을 엄격하게 일반화하며, 최종 거부 규칙 (terminal-veto rules)에 대한 줄일 수 없는 허위 거부 격차 (irreducible false-veto gap)를 드러내고, 이진 레이블 비식별성 (binary-label non-identifiability)과 의사결정 규칙 학습 가능성 (decision-rule learnability)을 분리하며, 관찰된 실행 가능성 공유 가중치 (observed-feasibility shared-weight) 설정에 대한 용량 및 교정 경계 (capacity and calibration bounds)를 제공합니다.

통제된 벤치마크와 DB1B 유도 벤치마크 전반에 걸쳐, RACL은 의도된 사유 및 수리 구조를 복구합니다. 가장 어려운 원시 데이터 유도 계층에서, 검증 선택된 (validation-selected) RACL은 가장 강력한 수리 탐색 블랙박스 베이스라인 (repair-search black-box baseline)이 약 1064/4039를 기록한 것에 비해 허위 거부를 10/4039 (FVR 0.0025)로 줄였으며, 동시에 FVR/EDR 트레이드오프를 명시적으로 보여주었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

거부 전 수리: 문맥적 의사결정을 위한 수리 증강 제약 학습 (Repair-Augmented Constraint Learning)

요약

핵심 포인트

댓글