본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 28. 12:38

SARAD: 자율 주행을 위한 충돌 예측 기반 LLM 기반 안전 인지 하이브리드 강화학습

요약

자율 주행의 안전성과 효율성을 높이기 위해 LLM과 DRL을 결합한 SARAD 프레임워크를 제안합니다. RAG를 통해 DRL의 무작위 탐색을 보완하고, 충돌 예측 모듈을 통해 안전성을 강화하여 시뮬레이션 성능을 입증했습니다.

핵심 포인트

  • LLM과 DRL의 시너지를 통한 하이브리드 프레임워크 제안
  • RAG를 활용하여 DRL의 무작위 탐색 문제 해결
  • 어텐션 판별기를 통한 LLM 사전 지식의 정책 최적화 통합
  • 충돌 예측 모듈 설계로 자율 주행 안전성 향상

자율 주행 시스템의 의사 결정에서 안전성과 효율성을 모두 보장하는 것은 여전히 근본적인 과제로 남아 있습니다. 전통적인 심층 강화학습 (Deep Reinforcement Learning, DRL)은 안전하지 않은 무작위 탐색 (random exploration)과 느린 수렴 속도로 인해 어려움을 겪는 반면, 대규모 언어 모델 (Large Language Models, LLMs)은 실시간 추론 (real-time inference) 작업에서 고유한 지연 시간 (latency)을 보입니다. 이러한 한계를 해결하기 위해, 본 논문은 자율 주행을 위해 LLMs와 DRL을 시너지화하는 새로운 안전 인지 하이브리드 프레임워크인 SARAD를 제안합니다. SARAD는 DRL의 무작위 탐색을 동적인 전문가 지식 저장소에서 가져온 검색 증강 생성 (Retrieval-Augmented Generation, RAG) 강화 및 LLM 가이드 의사 결정으로 대체합니다. LLMs의 사전 지식을 DRL 정책 최적화 (policy optimization)에 통합하기 위해 어텐션 판별기 (attention discriminator)를 제안합니다. 또한, 차량의 안전성을 향상시키기 위해 과거 충돌 데이터로 미세 조정된 충돌 예측기 (collision predictor) 모듈을 설계했습니다. 광범위한 실험을 통해 SARAD가 Highway-Env 시뮬레이터에서 상당한 성능 향상을 달성함을 보여주며, 자율 주행에서 제안된 모델의 효과를 검증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0