arXiv논문2026. 05. 20. 12:56

D$^3$-Subsidy: 대규모 차량 호출 시장을 위한 온라인 및 순차적 드라이버 보조금 의사결정

요약

DiDi Chuxing은 차량 호출 플랫폼의 드라이버 보조금을 최적화하기 위해 계층적 확산 기반 프레임워크인 D$^3$-Subsidy를 제안합니다. 이 모델은 확률적 충격 대응, 보조금 비율 상한선 준수, 저지연 실행이라는 세 가지 제약 조건을 동시에 해결하며, 접두사 조건부 확산 모델을 통해 미래 궤적을 예측하고 도시 수준의 제어 신호로 변환합니다. 실제 A/B 테스트 결과, 예산 제약을 준수하면서도 운행 건수(Rides)와 총 거래액(GMV)을 유의미하게 개선하는 성과를 거두었습니다.

핵심 포인트

D$^3$-Subsidy는 접두사 조건부 확산 모델(prefix-conditioned diffusion model)을 사용하여 미래의 수요 및 공급 궤적을 샘플링합니다.
라그랑주 쌍대성(Lagrangian-dual) 기반 매핑을 통해 반복적인 최적화 없이도 보조금 비율 상한선을 주문 단위 인센티브에 직접 반영합니다.
다도시 사전 훈련 및 매개변수 효율적 미세 조정(PEFT)을 통해 서로 다른 도시 환경 간의 견고한 모델 전이를 지원합니다.
실제 운영 환경에서 저지연 실행이 가능하도록 도시 수준의 저차원 제어 신호로 디코딩하는 구조를 채택했습니다.

DiDi Chuxing과 같은 차량 호출 (Ride-hailing) 플랫폼은 드라이버 공급과 승객 수요의 균형을 맞추는 것이 매우 중요한 고도로 역동적인 환경에서 운영됩니다. 드라이버 측 보조금은 이러한 힘을 조절하고 완료된 운행 건수 (\texttt{Rides}) 및 총 거래액 (\texttt{GMV})과 같은 주요 KPI를 개선하는 주요 수단으로 작용하지만, 실제 운영 환경에서 이를 최적화하려면 세 가지 제약 조건을 동시에 충족해야 합니다: (i) 확률적 충격 (stochastic shocks)에 대한 대응성, (ii) 엄격한 보조금 비율 상한선 (subsidy-rate caps), (iii) 도시 규모에서의 저지연 (low-latency) 실행. 이러한 요구 사항은 비용이 많이 드는 주문별 (per-order) 최적화를 배제하며, 온라인 순차적 의사결정을 위한 미래 예측적이고 제약 조건을 인식하는 도시 수준의 컨트롤러를 필요로 합니다.

이러한 요구 사항을 충족하기 위해, 우리는 배포 가능한 도시 전역 보조금 제어를 위한 계층적 확산 기반 프레임워크인 D$^3$-Subsidy (Dynamic Driver-side Diffusion-based Subsidy)를 소개합니다. 훈련과 추론 사이의 간극을 메우기 위해, D$^3$-Subsidy는 불변하는 과거 관측치로부터 타당한 미래 궤적을 샘플링하는 접두사 조건부 확산 모델 (prefix-conditioned diffusion model)을 채택하여, 훈련 프로토콜이 온라인 배포의 고정된 이력 특성과 일치하도록 보장합니다. 이렇게 생성된 계획은 컨텍스트 조건부 역모듈 (context-conditioned inverse module)을 통해 저차원의 도시 수준 제어 신호로 디코딩됩니다. 확장 가능한 실행을 위해, 우리는 라그랑주 쌍대성 (Lagrangian-dual)에서 유도된 매핑을 통해 도시 수준의 계획과 미세한 배차 (dispatch) 사이의 간극을 메우며, 이는 반복적인 최적화 없이 보조금 비율 상한선을 주문-드라이버 인센티브에 직접 내장합니다. 또한, 매개변수 효율적 미세 조정 (parameter-efficient fine-tuning)을 결합한 다도시 사전 훈련 전략을 통해 이질적인 도시 간의 견고한 전이를 가능하게 합니다. 광범위한 오프라인 평가 결과, D$^3$-Subsidy는 상한선 준수를 강화하는 동시에 \texttt{Rides}와 \texttt{GMV}를 개선함을 입증하였으며, 실제 A/B 테스트를 통해 예산 관련 위반 지표를 운영 임계값 내로 유지하면서도 상당한 상승 효과를 확인했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

D$^3$-Subsidy: 대규모 차량 호출 시장을 위한 온라인 및 순차적 드라이버 보조금 의사결정

요약

핵심 포인트

댓글