본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 15. 20:39

CLOVER: 엔드투엔드 자율주행 계획을 위한 폐쇄 루프 가치 추정 및 순위 지정 (Closed-Loop Value Estimation &

요약

본 글은 엔드투엔드 자율주행 계획의 한계점인 '학습-평가 불일치' 문제를 해결하기 위해 CLOVER라는 새로운 프레임워크를 제안합니다. CLOVER는 생성기(generator)와 스코어러(scorer)를 결합한 폐쇄 루프 가치 추정 및 순위 지정 방식을 사용하며, 의사 전문가 궤적과 집합 수준 커버리지 감독을 통해 생성기를 학습시키고, 보수적인 자기 증류 과정을 거쳐 성능을 향상시킵니다. 이 프레임워크는 NAVSIM 등 여러 평가 환경에서 기존 최고 기록(SOTA)을 경신하는 뛰어난 성능을 입증했습니다.

핵심 포인트

  • CLOVER는 엔드투엔드 자율주행 계획의 학습-평가 불일치 문제를 해결합니다.
  • 폐쇄 루프 가치 추정 및 순위 지정 프레임워크를 사용하여 생성기와 스코어러를 결합합니다.
  • 집합 수준 커버리지 감독과 보수적인 자기 증류 과정을 통해 모델을 정교화하여 안정성을 높입니다.
  • NAVSIM, NavHard 등 다양한 평가 환경에서 기존 최고 기록(SOTA)을 경신하는 성능을 보여주었습니다.

엔드투엔드 (End-to-end) 자율주행 플래너 (planner)들은 일반적으로 단일 기록된 궤적 (trajectory)을 모방함으로써 학습되지만, 안전성, 실행 가능성, 진행 상황 및 편안함을 측정하는 규칙 기반 (rule-based) 계획 지표에 의해 평가됩니다. 이는 학습-평가 불일치 (training--evaluation mismatch)를 발생시킵니다. 즉, 기록된 경로에 가까운 궤적은 계획 규칙을 위반할 수 있는 반면, 시연 (demonstration)에서 더 멀리 떨어진 대안들은 유효하며 높은 점수를 유지할 수 있습니다. 이러한 불일치는 후보군 커버리지 (candidate-set coverage)와 스코어러 (scorer)의 순위 지정 품질에 성능이 의존하는 제안-선택 (proposal-selection) 플래너들에게 특히 제한적입니다.

우리는 엔드투엔드 자율주행 계획을 위한 폐쇄 루프 가치 추정 및 순위 지정 (Closed-LOop Value Estimation and Ranking) 프레임워크인 CLOVER를 제안합니다. CLOVER는 경량화된 생성기-스코어러 (generator--scorer) 공식을 따릅니다. 생성기는 다양한 후보 궤적을 생성하고, 스코어러는 추론 (inference) 시점에 이들의 순위를 매기기 위해 계획 지표 하위 점수 (planning-metric sub-scores)를 예측합니다. 단일 궤적 모방을 넘어 제안 지원 (proposal support)을 확장하기 위해, CLOVER는 평가기 필터링을 거친 의사 전문가 (pseudo-expert) 궤적을 구축하고 집합 수준 커버리지 감독 (set-level coverage supervision)을 통해 생성기를 학습시킵니다. 그 후 보수적인 폐쇄 루프 자기 증류 (closed-loop self-distillation)를 수행합니다. 즉, 스코어러는 생성된 제안들에 대해 실제 평가기 하위 점수에 맞춰 피팅(fitting)되는 한편, 생성기는 안정성 정규화 (stability regularization)와 함께 교사(teacher)가 선택한 상위 $k$개 및 벡터-파레토 (vector-Pareto) 타겟을 향해 정교화됩니다.

우리는 불완전한 스코어러가 언제 생성기를 개선할 수 있는지 분석하며, 스코어러가 선택한 타겟이 실제 평가기 하에서 풍부해지고 업데이트가 보수적으로 유지될 때 스코어러 매개 정교화 (scorer-mediated refinement)가 신뢰할 수 있음을 보여줍니다. NAVSIM에서 CLOVER는 94.5 PDMS와 90.4 EPDMS를 달성하여 새로운 SOTA (state of the art)를 수립했습니다. 더 까다로운 NavHard 분할 데이터셋에서는 48.3 EPDMS를 기록하여 보고된 가장 강력한 결과와 일치했습니다. 추가적인 nuScenes 오픈 루프 (open-loop) 평가에서 CLOVER는 비교된 방법들 중 가장 낮은 L2 오차와 충돌률을 달성했습니다. 코드 데이터는 https://github.com/WilliamXuanYu/CLOVER 에서 공개될 예정입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0