arXiv논문2026. 06. 16. 12:46

문맥적 확률적 최적화를 위한 의사결정 가중치 부여 플로우 매칭 (Decision-Weighted Flow Matching)

요약

표준 생성 모델의 목적 함수 불일치 문제를 해결하기 위해 의사결정 가중치 부여 플로우 매칭(DW-FM)을 제안합니다. 의사결정에 민감한 영역에 가중치를 두어 다운스트림 후회를 최소화하는 새로운 학습 프레임워크입니다.

핵심 포인트

표준 플로우 매칭의 균등 분포 적합 문제를 해결하는 DW-FM 제안
의사결정에 민감한 종단점 정보를 활용한 속도 회귀 목적 함수 재가중
이론적 분석을 통해 경로별 속도 불일치와 다운스트림 후회 간의 관계 증명
금융 포트폴리오 및 교통 CVaR 벤치마크에서 표준 모델 대비 성능 개선 입증

조건부 생성 모델 (Conditional generative models)은 확률적 최적화 (stochastic optimization)를 위한 시나리오 생성기로 점점 더 많이 사용되고 있지만, 표준 학습 목적 함수는 생성된 시나리오에 의해 유도되는 다운스트림 의사결정 (downstream decisions)보다는 균등한 분포 적합 (uniform distributional fit)을 강조합니다. 이는 목적 함수 불일치 (objective mismatch)를 초래합니다. 즉, 통계적으로 흔한 영역에서의 오류는 의사결정 후회 (decision regret)에 거의 영향을 미치지 않을 수 있는 반면, 의사결정에 민감한 영역에서의 오류는 최적의 행동을 실질적으로 변화시킬 수 있습니다. 우리는 표준 플로우 매칭 (flow matching)의 단순성을 유지하면서 의사결정에 민감한 종단점 정보 (endpoint information)를 사용하여 속도 회귀 (velocity-regression) 목적 함수를 재가중하는 후회 정렬 학습 프레임워크인 의사결정 가중치 부여 플로우 매칭 (Decision-Weighted Flow Matching, DW-FM)을 제안합니다. 이론적으로, 우리는 손실 유도 의사결정 불일치 (loss-induced decision discrepancy)와 수반 수송 논증 (adjoint transport argument)을 통해 다운스트림 후회 (downstream regret)를 경로별 속도 불일치 (pathwise velocity mismatch)와 연결하며, 이를 통해 이상적인 후회 정렬 대리 목적 함수 (regret-aligned surrogate)와 후회 보장 (regret guarantees)을 갖춘 실용적인 종단점 가중 목적 함수 (endpoint-weighted objectives)를 도출합니다. 경험적으로, 우리는 합성 포트폴리오 (synthetic portfolio), 준실제 금융 (semi-real financial), 그리고 교통-CVaR (traffic-CVaR) 작업을 아우르는 세 가지 CVaR 기반 문맥적 확률적 최적화 (contextual stochastic optimization) 벤치마크에서 DW-FM의 효과를 입증하며, 여기서 DW-FM은 표준 베이스라인 대비 다운스트림 후회를 개선합니다.

AI 자동 생성 콘텐츠

원문 바로가기

문맥적 확률적 최적화를 위한 의사결정 가중치 부여 플로우 매칭 (Decision-Weighted Flow Matching)

요약

핵심 포인트

댓글