arXiv논문2026. 06. 09. 12:05

대규모 환경에서의 효율적인 교통량 예측: STGCN 아키텍처 깊이에 대한 체계적 연구

요약

STGCN 아키텍처의 깊이가 교통량 예측 성능과 효율성에 미치는 영향을 체계적으로 분석했습니다. 연구 결과, 단일 블록 모델이 성능과 계산 효율성 측면에서 표준 모델보다 우수하거나 대등함을 확인했습니다.

핵심 포인트

단일 블록 STGCN이 단기 예측에서 최적의 성능 달성
2-block 모델은 1-block 대비 추론 지연 시간이 61% 높음
3-block 모델은 계산 비용 대비 성능 개선이 미미함
기존 표준 STGCN 모델의 과잉 매개변수화 가능성 시사

시공간 그래프 신경망 (Spatio-temporal graph neural networks, STGNNs)은 교통량 예측을 위한 지배적인 접근 방식이 되었으나, 이들의 계산 요구 사항은 지능형 교통 시스템 (Intelligent Transportation Systems, ITS)의 실제 배포에 어려움을 주고 있습니다. 최근 연구들이 STGNN의 효율적인 대안들을 제안해 왔지만, 근본적인 질문 하나가 여전히 탐구되지 않은 채 남아 있습니다. 즉, 이러한 아키텍처 자체가 과잉 매개변수화 (over-parameterised) 되어 있는가 하는 점입니다. 우리는 이 분야에서 가장 널리 채택되는 모델 중 하나인 시공간 그래프 합성곱 네트워크 (Spatio-Temporal Graph Convolutional Network, STGCN)를 사용하여 이 질문을 조사합니다. 네 가지의 다양한 교통 데이터셋을 통한 체계적인 실험을 통해, 우리는 1-block, 2-block (표준), 그리고 3-block STGCN 변형 모델들을 비교합니다. 우리의 연구 결과에 따르면, 단일 블록 (single-block) 아키텍처는 4개 데이터셋 중 3개에서 단기 예측 (10분)에 대해 최적의 성능을 달성하는 동시에, 더 긴 예측 범위에서는 미미한 성능 저하 ($\leq$1.8% 상대 오차)만을 보였습니다. 결정적으로, 2-block 변형 모델은 1-block에 비해 CPU 추론 지연 시간 (inference latency)이 61% 더 높고 처리량 (throughput)은 37% 더 낮았습니다. 이는 자원이 제한된 ITS 배포 환경에서 상당한 오버헤드(overhead)가 됩니다. 3-block 아키텍처는 유리한 트레이드오프 (tradeoff)를 제공하지 못하며, 0.5% 미만의 상대적 개선을 위해 계산 비용을 두 배 이상 증가시킵니다. 이러한 결과는 기본 설정인 2-block STGCN이 많은 응용 분야에서 과잉 매개변수화 되어 있을 수 있음을 시사하며, 이는 교통량 예측 시스템을 배포하는 실무자와 효율성 중심의 방법론을 벤치마킹하는 연구자 모두에게 시사하는 바가 큽니다.

AI 자동 생성 콘텐츠

원문 바로가기

대규모 환경에서의 효율적인 교통량 예측: STGCN 아키텍처 깊이에 대한 체계적 연구

요약

핵심 포인트

댓글