arXiv논문2026. 06. 01. 11:04

FCR 시장에서의 입찰 학습: 두 세계의 장점을 결합한 접근 방식

요약

유럽 FCR 시장의 불완전한 피드백 환경에서 입찰 효율을 높이기 위한 온라인 학습 알고리즘을 제안합니다. 조합론적 세미 밴딧 알고리즘을 통해 확률적 및 적대적 환경 모두에서 낮은 후회(regret)를 달성함을 입증했습니다.

핵심 포인트

FCR 시장을 반복적 다수량 균일 가격 경매로 재구성
조합론적 세미 밴딧 알고리즘을 통한 입찰 최적화
확률적 환경에서 로그 형태의 의사 후회 달성
유럽 FCR 과거 데이터를 통한 실무적 유용성 검증

유럽 주파수 제어 예비력 (FCR, Frequency Containment Reserve) 시장에서의 입찰은 유연성 공급자(flexibility providers)에게 매우 도전적인 과제입니다. 경쟁 입찰가가 숨겨져 있고, 입찰자는 낙찰 가격(clearing price)이나 낙찰 수량(awarded quantity)과 같이 시장으로부터 부분적인 피드백만을 관찰할 수 있기 때문입니다. 단일 국가에서 활동하는 참여자의 경우, 우리는 다국가 FCR 낙찰 문제를 내생적 대립 입찰 벡터(endogenous vector of opposing bids)를 대상으로 하는 반복적 다수량 균일 가격 경매(repeated multi-unit uniform-price auction)로 재구성할 수 있음을 보여줍니다. 이러한 재구성을 통해 온라인 학습(online learning) 문제가 도출되며, 표준적인 시장 피드백으로부터 구현 가능한 '두 세계의 장점을 결합한(Best-of-Both-Worlds)' 조합론적 세미 밴딧 (combinatorial semi-bandit) 알고리즘을 적용할 수 있습니다. 결과적으로 해당 입찰자는 확률적 환경(stochastic environments)에서는 로그 형태의 의사 후회(logarithmic pseudo-regret)를 달성하고, 적대적 환경(adversarial ones)에서는 $\mathcal{O}(\sqrt{T})$의 후회(regret)를 달성합니다. 합성 실험(Synthetic experiments)을 통해 예상된 스케일링을 확인하였으며, 유럽 FCR 과거 데이터에 대한 백테스트(backtests) 결과 실제 환경에서도 경쟁력 있는 성능을 보여주었습니다. 이 방법은 특히 안정적인 상품에서 뛰어난 성능을 발휘하는 반면, EXP3 유형의 베이스라인(baselines)은 더 강한 비정상성(non-stationarity) 하에서 더 안전할 수 있습니다. 종합적으로, 본 연구 결과는 학습 기반의 FCR 시장 입찰이 이론적 근거를 갖추고 있으며, 학습 규칙이 상품 수준의 시장 안정성과 일치할 때 실무적으로 유용함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

FCR 시장에서의 입찰 학습: 두 세계의 장점을 결합한 접근 방식

요약

핵심 포인트

댓글