【전 13회】 시계열 예측의 최전선 — ARIMA부터 Foundation Models · LLM까지, 실무에서 '어떤 기법을 선택할 것인가'를 - Insights | Molayo

「ARIMA로 작성한 코드를 상사에게 보여줬더니, "왜 DL(Deep Learning)을 쓰지 않지?"라는 말을 들었다」

「반대로 최신 Transformer를 사용했더니, 단순한 선형 모델(Linear Model)에 패배했다」

시계열 예측(Time Series Prediction) 학습에서 어려움을 겪는 부분은 기법의 원리를 외우는 것보다, 어떤 상황에서 어떤 기법을 선택할 것인가라는 판단 기준을 갖지 못하는 것이라고 느낍니다. 「최신 기법을 능숙하게 다루는 것」이 목적이 되어 버려, 비즈니스 과제와의 접점이 보이지 않게 되는 —— 그러한 경험이 이 시리즈를 쓰게 된 계기였습니다.

전 13회 시리즈 **「시계열 예측의 최전선」**을 Zenn Books로서 공개했습니다. ARIMA와 같은 통계적 기법부터 시작하여, ML(GBDT) · DL(Prophet · N-HiTS · PatchTST · TimesNet) · Foundation Models · LLM · Diffusion 모델까지, 「왜 그 기법이 탄생했는가」라는 과제 배경으로부터 체계적으로 쌓아 올리는 구성입니다.

이 시리즈의 설계 방침

일관되게 의식한 것은 「기법부터 시작하는 것이 아니라, 과제·니즈부터 시작한다」는 학습 순서입니다. 스코프(Scope)는 Forecasting(예측) 태스크로 한정하고(이상 탐지 · 분류는 별도 테마), 축이 되는 도메인은 소매 · EC(전자상거래)의 수요 예측으로 설정했습니다. 각 회차의 끝에는 확인 문제(정답 포함)를 게재하여, 읽고 끝나는 것이 되지 않도록 설계했습니다.

전 13회는 3개의 페이즈(Phase)로 구성되어 있습니다.

제1~5회 (기초): 비즈니스 과제 정리 · 데이터의 성질 이해 · 기법의 전체 맵 -
제6~9회 (기법 상세 해설): ARIMA · GBDT · DL 계열 기법의 계보와 단순한 모델이 승리하는 조건 -
제10~13회 (최전선): TimesNet · Foundation Models · LLM/Diffusion 모델과 실무에서의 위치づけ

NLP(자연어 처리)·CV(컴퓨터 비전)의 문맥에서 Foundation Models(파운데이션 모델)를 도입하여, Chronos·Lag-Llama·TimeGPT의 시계열 예측 응용 사례를 해설합니다. 회의적인 연구를 포함하여 객관적으로 평가하고, 실무 적용 가능성을 묻습니다.

제12회｜LLM과 Diffusion 모델의 시계열 예측 도전: 확률적 예측이라는 새로운 질문

LLM(거대 언어 모델)과 Diffusion(확산) 모델을 각각 시계열 이외의 문맥과 정의로부터 도입합니다. 수식에 의존하지 않고 주니어 DS(데이터 사이언티스트)가 이해할 수 있는 수준으로 해설하며, 확률적 예측(Probabilistic Forecasting)·불확실성 정량화(Uncertainty Quantification)라는 새로운 과제 축을 제시합니다.

제13회｜시계열 예측의 현재 위치와 향후 전망: 지금 실무에서 무엇을 사용할 수 있는가

시리즈 전체를 조망하며, 현재의 최전선을 실무 적용 가능성의 관점에서 정리하는 집대성 회차입니다. '지금 실무에서 사용할 수 있는 기법'과 '연구 단계의 기법'의 정리, 확률적 예측이라는 새로운 과제 축을 포함하여, DS로서의 의사결정 도달점을 보여줍니다.

대상 독자

독자층	추천 회차
시계열 예측은 공부하고 있지만 실무에서의 판단 기준이 없는 경우	제1~5회
...

SALT2 について

제가 소속된 SALT2는 생성 AI·예측 모델·최적화를 결합한 맞춤형 AI 솔루션을 제공하는 AI 스타트업입니다. 수요 예측·재고 최적화·AI Agent 개발 등을 다루고 있으며, 2025년 10월부터 부스트 컨설팅 주식회사(Boost Consulting Co., Ltd.)의 그룹사가 되었습니다.

데이터 사이언티스트·엔지니어 채용 및 인턴을 수시로 모집하고 있습니다. 관심 있으신 분은 언제든 편하게 연락해 주시기 바랍니다.

【전 13회】 시계열 예측의 최전선 — ARIMA부터 Foundation Models · LLM까지, 실무에서 '어떤 기법을 선택할 것인가'를

요약

핵심 포인트

이 시리즈의 설계 방침

목차

제1회｜이 시리즈를 읽기 전에: 왜 「기법부터 시작하는 학습」으로는 실무에서 사용할 수 없는가

제2회｜시계열 예측이 필요한 비즈니스 과제란 무엇인가

제3회｜시계열 데이터의 성질을 이해하기 ①: 트렌드(Trend) · 계절성(Seasonality) · 주기성(Cyclicity) · 노이즈(Noise)

제4회｜시계열 데이터의 성질을 이해하기 ②: 정상성(Stationarity) · 자기상관(Autocorrelation) · 이상치(Outlier) · 결측(Missing Value)

제5회｜기법의 전체 맵: 어떤 상황에서 어떤 기법을 선택할 것인가

제6회｜통계적 기법의 과제와 그 한계: ARIMA는 어디에서 막히는가

제7회｜ML로 시계열을 푼다는 것은 무엇인가: GBDT의 발상과 한계

제8회｜Deep Learning이 시계열에 가져온 것: Prophet · N-HiTS · PatchTST의 계보

제9회｜최신 기법이 항상 최선은 아니다: 단순한 모델이 승리하는 조건

제10회｜TimesNet: 시계열을 2차원으로 본다는 발상과 최전선으로의 가교

제11회｜Foundation Models라는 새로운 패러다임: 제로샷(Zero-shot) 예측은 실무에서 사용할 수 있는가

제12회｜LLM과 Diffusion 모델의 시계열 예측 도전: 확률적 예측이라는 새로운 질문

제13회｜시계열 예측의 현재 위치와 향후 전망: 지금 실무에서 무엇을 사용할 수 있는가

대상 독자

SALT2 について

Discussion

댓글