순차적 가격 책정을 위한 자원 제약적 적응형 추론 (Resource-Constrained Adaptive Inference for
요약
자원 제약이 있는 환경에서 순차적 가격 책정을 위한 적응형 추론 메커니즘을 연구합니다. 컨트롤러의 자원 상태로 인해 목표 가격 달성이 어려워지는 문제를 공식화하고, 이를 해결하기 위한 목표 인식 가격 컨트롤러를 제안합니다.
핵심 포인트
- 자원 제약으로 인한 목표 가격 근방의 가용 집합 제외 문제 공식화
- 목표 인식 가격 컨트롤러 및 국소적 편향 제거 설계
- 저렴한 탐색이 추론에 불충분할 수 있음을 후회-정보 회계로 증명
- 자원 상태 붕괴 시 진단적 기권(diagnostic abstention) 메커니즘 제시
자원 제약적 가격 책정 컨트롤러 (Resource-constrained pricing controllers)는 고정 가격 추론 (fixed-price inference)을 불가능하게 만들 수 있습니다. 즉, 실현된 모든 행동 (realized action)이 알려진 양의 밀도 (positive density)를 가질 때조차도, 컨트롤러의 자원 상태 (resource state)가 가용 집합 (feasible set)에서 목표 가격 근방 (target price neighborhood)을 제거할 수 있습니다. 우리는 국소적 비식별 결과 (local non-identification result)와 실현된 정보 시계 (realized information clock)를 통해 이러한 지지 집합 제외 실패 (support-exclusion failure)를 공식화합니다. 그런 다음, 실행 가능한 목표 대역 (feasible target bands)을 인증하고 연속적인 국소 밀도 (local densities)를 기록하는 목표 인식 가격 컨트롤러 (target-aware pricing controller)를 설계합니다. 국소적 편향 제거 (Localized debiasing)는 이 시계에 의해 폭이 결정되는 학생화된 구간 (studentized intervals)을 제공합니다. 파일럿 재해결 오차 (pilot re-solving error)까지 명시된 결과적인 후회-정보 회계 (regret--information accounting)는 저렴한 탐색 (cheap exploration)이 추론에 불충분할 수 있음을 보여줍니다. 다항식 목표 질량 (polynomial target mass)은 다항식 속도 (polynomial rates)를 제공하지만, 순수한 $1/t$ 목표 분기 (target branch)는 추가적인 국소 이동 (local movement) 없이는 축소되는 고정 목표 구간 (shrinking fixed-target intervals)을 생성하지 못합니다. 실험을 통해 인증된 대역 내에서의 보정 (calibration)과 자원 상태가 목표 지지 집합 (target support)을 붕괴시킬 때의 진단적 기권 (diagnostic abstention)을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기