
【전 13회】 시계열 예측의 최전선 — ARIMA부터 Foundation Models · LLM까지, 실무에서 '어떤 기법을 선택할 것인가'를
요약
시계열 예측의 기초부터 최신 Foundation Models, LLM 활용까지 다루는 13회 분량의 전문 시리즈를 소개합니다. 단순한 기법 습득을 넘어 비즈니스 과제와 데이터 특성에 맞는 최적의 모델을 선택하는 판단 기준을 제시합니다.
핵심 포인트
- 기법 중심이 아닌 비즈니스 과제와 니즈 중심의 학습 설계
- ARIMA부터 LLM, Diffusion 모델까지 폭넓은 기술 스택 커버
- 데이터의 성질(트렌드, 계절성 등)에 따른 모델 선택 가이드 제공
- 실무 수요 예측(소매, EC) 도메인에 특화된 사례 중심 구성
「ARIMA로 작성한 코드를 상사에게 보여줬더니, "왜 DL(Deep Learning)을 쓰지 않지?"라는 말을 들었다」
「반대로 최신 Transformer를 사용했더니, 단순한 선형 모델(Linear Model)에 패배했다」
시계열 예측(Time Series Prediction) 학습에서 어려움을 겪는 부분은 기법의 원리를 외우는 것보다, 어떤 상황에서 어떤 기법을 선택할 것인가라는 판단 기준을 갖지 못하는 것이라고 느낍니다. 「최신 기법을 능숙하게 다루는 것」이 목적이 되어 버려, 비즈니스 과제와의 접점이 보이지 않게 되는 —— 그러한 경험이 이 시리즈를 쓰게 된 계기였습니다.
전 13회 시리즈 **「시계열 예측의 최전선」**을 Zenn Books로서 공개했습니다. ARIMA와 같은 통계적 기법부터 시작하여, ML(GBDT) · DL(Prophet · N-HiTS · PatchTST · TimesNet) · Foundation Models · LLM · Diffusion 모델까지, 「왜 그 기법이 탄생했는가」라는 과제 배경으로부터 체계적으로 쌓아 올리는 구성입니다.
이 시리즈의 설계 방침
일관되게 의식한 것은 「기법부터 시작하는 것이 아니라, 과제·니즈부터 시작한다」는 학습 순서입니다. 스코프(Scope)는 Forecasting(예측) 태스크로 한정하고(이상 탐지 · 분류는 별도 테마), 축이 되는 도메인은 소매 · EC(전자상거래)의 수요 예측으로 설정했습니다. 각 회차의 끝에는 확인 문제(정답 포함)를 게재하여, 읽고 끝나는 것이 되지 않도록 설계했습니다.
전 13회는 3개의 페이즈(Phase)로 구성되어 있습니다.
제1~5회 (기초): 비즈니스 과제 정리 · 데이터의 성질 이해 · 기법의 전체 맵 -
제6~9회 (기법 상세 해설): ARIMA · GBDT · DL 계열 기법의 계보와 단순한 모델이 승리하는 조건 -
제10~13회 (최전선): TimesNet · Foundation Models · LLM/Diffusion 모델과 실무에서의 위치づけ
목차
제1회|이 시리즈를 읽기 전에: 왜 「기법부터 시작하는 학습」으로는 실무에서 사용할 수 없는가
시리즈 전체의 학습 사상과 도달 목표를 보여주는 도입 회차입니다. 왜 Forecasting으로 스코프를 한정하는지, 무엇을 할 수 있어야 「사용할 수 있는」 상태라고 할 수 있는지에 대해 우선 정리합니다.
제2회|시계열 예측이 필요한 비즈니스 과제란 무엇인가
수요 예측 · 소매 EC를 축으로 다른 도메인도 횡단하며, 시계열 예측이 필요한 과제와 불필요한 과제를 정리합니다. 「과제 설정을 잘못하면 어떤 기법을 사용해도 의미가 없다」는 이야기입니다.
제3회|시계열 데이터의 성질을 이해하기 ①: 트렌드(Trend) · 계절성(Seasonality) · 주기성(Cyclicity) · 노이즈(Noise)
트렌드 · 계절성 · 주기성 · 노이즈를 실무 데이터의 맥락에서 정중하게 해설합니다. 「자신의 언어로 설명할 수 있는」 수준을 목표로 작성했습니다.
제4회|시계열 데이터의 성질을 이해하기 ②: 정상성(Stationarity) · 자기상관(Autocorrelation) · 이상치(Outlier) · 결측(Missing Value)
정상성 · 자기상관 · 이상치 · 결측이 데이터 품질과 기법 선택에 어떻게 영향을 미치는지 정리합니다.
제5회|기법의 전체 맵: 어떤 상황에서 어떤 기법을 선택할 것인가
통계 · ML · DL 기법군을 과제 베이스로 정리하여, 기법 선택의 판단 기준을 제시합니다. 이 시리즈의 「지도」가 되는 회차입니다.
제6회|통계적 기법의 과제와 그 한계: ARIMA는 어디에서 막히는가
ARIMA와 SARIMA가 풀 수 있는 문제와 풀 수 없는 문제를 배경으로부터 정리하고, 다음 기법이 필요해진 이유를 보여줍니다.
제7회|ML로 시계열을 푼다는 것은 무엇인가: GBDT의 발상과 한계
GBDT를 시계열에 응용하는 발상 · 피처 엔지니어링(Feature Engineering)의 사고방식과 그 한계를 해설합니다. 「왜 DL이 필요해졌는가」로 이어지는 가교 역할을 하는 회차입니다.
제8회|Deep Learning이 시계열에 가져온 것: Prophet · N-HiTS · PatchTST의 계보
DL 기반의 기법이 어떤 과제를 해결하기 위해 탄생했는지를 계보로서 해설합니다. 각 기법의 「배경 과제의 차이」를 명확히 하는 것에 의식했습니다.
제9회|최신 기법이 항상 최선은 아니다: 단순한 모델이 승리하는 조건
Transformer보다 단순한 선형 모델이 승리하는 케이스 등을 바탕으로, 실무에서의 기법 선택 의사결정 프레임워크를 완성합니다. 제5회의 「지도」가 여기서 한 단계 더 깊어집니다.
제10회|TimesNet: 시계열을 2차원으로 본다는 발상과 최전선으로의 가교
시계열을 2차원 이미지로 변환하여 학습하는 TimesNet의 설계 사상을 해설하면서, 최전선 파트로의 가교로서 MLP 계열 모델의 지속적인 경쟁력에 대해서도 다룹니다.
제11회|Foundation Models라는 새로운 패러다임: 제로샷(Zero-shot) 예측은 실무에서 사용할 수 있는가
NLP(자연어 처리)·CV(컴퓨터 비전)의 문맥에서 Foundation Models(파운데이션 모델)를 도입하여, Chronos·Lag-Llama·TimeGPT의 시계열 예측 응용 사례를 해설합니다. 회의적인 연구를 포함하여 객관적으로 평가하고, 실무 적용 가능성을 묻습니다.
제12회|LLM과 Diffusion 모델의 시계열 예측 도전: 확률적 예측이라는 새로운 질문
LLM(거대 언어 모델)과 Diffusion(확산) 모델을 각각 시계열 이외의 문맥과 정의로부터 도입합니다. 수식에 의존하지 않고 주니어 DS(데이터 사이언티스트)가 이해할 수 있는 수준으로 해설하며, 확률적 예측(Probabilistic Forecasting)·불확실성 정량화(Uncertainty Quantification)라는 새로운 과제 축을 제시합니다.
제13회|시계열 예측의 현재 위치와 향후 전망: 지금 실무에서 무엇을 사용할 수 있는가
시리즈 전체를 조망하며, 현재의 최전선을 실무 적용 가능성의 관점에서 정리하는 집대성 회차입니다. '지금 실무에서 사용할 수 있는 기법'과 '연구 단계의 기법'의 정리, 확률적 예측이라는 새로운 과제 축을 포함하여, DS로서의 의사결정 도달점을 보여줍니다.
대상 독자
| 독자층 | 추천 회차 |
|---|---|
| 시계열 예측은 공부하고 있지만 실무에서의 판단 기준이 없는 경우 | 제1~5회 |
| ... |
SALT2 について
제가 소속된 SALT2는 생성 AI·예측 모델·최적화를 결합한 맞춤형 AI 솔루션을 제공하는 AI 스타트업입니다. 수요 예측·재고 최적화·AI Agent 개발 등을 다루고 있으며, 2025년 10월부터 부스트 컨설팅 주식회사(Boost Consulting Co., Ltd.)의 그룹사가 되었습니다.
데이터 사이언티스트·엔지니어 채용 및 인턴을 수시로 모집하고 있습니다. 관심 있으신 분은 언제든 편하게 연락해 주시기 바랍니다.
Discussion

AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn ML의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기