탄소 네거티브 인프라 내 산불 대피 물류 네트워크를 위한 물리 보강 확산 모델링 (Physics-Augmented Diffusion Modeling)

화재 역학(Fire Dynamics)과 AI의 교차점으로 떠난 개인적인 여정

전통적인 대피 모델이 근본적으로 결함이 있다는 것을 깨달았던 순간을 여전히 기억합니다. 그것은 캘리포니아 시에라 네바다(Sierra Nevada) 산기슭에서 진행된 산불 대피 시뮬레이션 훈련 중이었으며, 저는 교통 경로 최적화를 위해 직접 구축한 강화학습 (Reinforcement Learning) 에이전트를 테스트하고 있었습니다. 에이전트는 실험실 환경에서는 매끄러운 수렴(Convergence)과 최적의 처리량(Throughput)을 보이며 훌륭하게 작동했지만, 실제 현장에서는 처참하게 실패했습니다. 모델이 "최적"이라고 판단한 도로들은 복사 열속(Radiative heat flux)으로 인해 통행이 불가능해졌고, 모델이 제안한 대피 경로는 대피자들을 가시성을 거의 제로로 만드는 연기 구름 속으로 직접 인도했습니다.

그날 밤, 지도와 센서 데이터에 둘러싸인 임시 연구소에 앉아 저는 깨달음을 얻었습니다. 우리는 화재 전파(Fire propagation), 대기 수송(Atmospheric transport), 그리고 열 복사(Thermal radiation)의 물리학을 무시한 채, 대피 물류를 순수하게 그래프 이론적 (Graph-theoretic) 문제로만 취급하고 있었던 것입니다. 해결책은 물리 기반 모델(Physics-based models)을 생성형 AI (Generative AI), 특히 확산 모델 (Diffusion models)과 융합하여, 탄소 네거티브 (Carbon-negative) 인프라를 최적화하는 동시에 화재 역학을 추론할 수 있는 새로운 범주의 대피 계획 도구를 만드는 데 있다는 것을 깨달았습니다.

이후 6개월 동안 저는 전산 유체 역학 (Computational fluid dynamics), 확률 미분 방정식 (Stochastic differential equations), 그리고 스코어 기반 생성 모델링 (Score-based generative modeling)의 교차점에 몰두했습니다. 그 결과로 탄생한 것이 제가 산불 대피 물류를 위해 **물리 보강 확산 모델링 (Physics-Augmented Diffusion Modeling, PADM)**이라고 부르는 프레임워크입니다. 이 글은 저의 학습 여정과 기술적 돌파구, 그리고 그 과정에서 발견한 실질적인 구현 사례들을 기록합니다.

기술적 토대: 왜 확산 모델 (Diffusion Models)인가?

물리 보강 (physics augmentation)에 깊이 들어가기에 앞서, 왜 확산 모델 (diffusion models)이 대피 물류 (evacuation logistics)에 독보적으로 적합한지 명확히 하고자 합니다. 점수 기반 생성 모델 (score-based generative models)을 탐구하면서, 무작위 필드 (random field)를 반복적으로 노이즈 제거 (denoising)하여 일관된 출력을 생성하는 그 근본적인 작동 방식이 불확실성 하에서의 대피 계획 생성 문제와 자연스럽게 매핑된다는 것을 발견했습니다.

전통적인 접근 방식은 결정론적 최적화 (deterministic optimization, 예: 교통 할당을 위한 선형 계획법 (linear programming)) 또는 단순한 휴리스틱 (heuristics, 예: 최단 경로 알고리즘 (shortest-path algorithms))을 사용합니다. 이러한 방식은 산불 대피가 본질적으로 확률적 (stochastic)이기 때문에 실패합니다. 즉, 화선 (fire fronts)은 예측 불가능하게 이동하고, 도로 폐쇄는 연쇄적으로 발생하며, 인간의 행동은 혼돈스러운 요소들을 도입합니다. 반면, 확산 모델은 실행 가능한 대피 계획의 _분포 (distribution)_를 학습하며, 가능한 여러 미래를 고려한 학습된 확률 지형 (probability landscape)으로부터 샘플링합니다.

제 연구를 이끈 핵심 통찰은 다음과 같습니다: 확산 모델의 노이즈 제거 과정은 수학적으로 외력 하에서의 입자 수송 (particle transport)에 대한 포커-플랑크 방정식 (Fokker-Planck equation)을 푸는 것과 유사하다는 점입니다. 물리학에서 포커-플랑크 방정식은 드리프트 (drift)와 확산 (diffusion) 하에서 확률 분포가 어떻게 진화하는지를 설명합니다. 대피 물류에서 "입자 (particles)"는 대피자이며, "외력 (external forces)"는 화재 역학 (fire dynamics), 도로 용량, 그리고 인프라 제약 조건입니다. 확산 모델의 점수 함수 (score function)를 물리 정보 기반 (physics-informed) 항으로 보강함으로써, 우리는 화재의 확률적 특성과 탄소 네거티브 인프라의 결정론적 제약을 모두 준수하는 대피 계획을 생성할 수 있습니다.

물리 보강 점수 함수 (The Physics-Augmented Score Function)

이를 공식화해 보겠습니다. 표준 확산 모델에서 우리는 타임스텝 (timestep) $t$에서 노이즈가 섞인 데이터 $x_t$의 로그 확률 (log-probability)의 기울기 (gradient)를 추정하는 점수 함수 $s_{\theta}(x_t, t)$를 학습합니다. 역과정 (reverse process)은 다음을 반복적으로 적용함으로써 실제 데이터 분포로부터 샘플링합니다:

[
x_{t-1} = \frac{1}{\sqrt{1-\beta_t}} \left( x_t + \beta_t s_\theta(x_t, t) \right) + \sigma_t z
]

여기서 $\beta_t$는 노이즈 스케줄 (noise schedule)이며, $z$는 가우시안 노이즈 (Gaussian noise)입니다.

저의 혁신은 이 스코어 함수 (score function)에 화재 역학 (fire dynamics)과 인프라 제약 조건을 인코딩하는 물리 기반 보정 항 (physics-based correction term) $\mathcal{P}(x_t, \phi, \psi)$를 추가하여 보강한 것이었습니다:

[
s_{\text{aug}}(x_t, t) = s_\theta(x_t, t) + \lambda \nabla_{x_t} \mathcal{P}(x_t, \phi, \psi)
]

여기서 $\phi$는 화재 상태 (온도장 (temperature fields), 열유속 맵 (heat flux maps), 연기 밀도 (smoke density)))를 나타내며, $\psi$는 인프라 파라미터 (도로 용량 (road capacities), 대피소 위치 (evacuation shelter locations), 탄소 네거티브 에너지 그리드 제약 조건 (carbon-negative energy grid constraints)))를 나타냅니다. 하이퍼파라미터 (hyperparameter) $\lambda$는 물리 보강 (physics augmentation)의 강도를 조절합니다.

이 공식을 사용하여 실험하는 동안, 저는 그래디언트 (gradient) $\nabla_{x_t} \mathcal{P}$가 전산 유체 역학 (computational fluid dynamics)의 수반 방법 (adjoint methods)을 사용하여 효율적으로 계산될 수 있다는 것을 발견했습니다. 이는 돌파구와 같은 순간이었습니다. 즉, 생성 모델 (generative model)의 확률적 솔루션 탐색 능력을 희생하지 않으면서도, 물리 시뮬레이터 (physics simulator)를 통해 역전파 (backpropagate)하여 확산 과정 (diffusion process)을 가이드할 수 있음을 의미했기 때문입니다.

구현: 물리 보강 확산 파이프라인 구축

제가 개발한 구현 과정을 안내해 드리겠습니다. 이 시스템은 화재 역학 시뮬레이터 (fire dynamics simulator), 교통 흐름 모델 (traffic flow model), 그리고 확산 모델 (diffusion model) 자체라는 세 가지 주요 구성 요소로 이루어져 있습니다.

1. 화재 역학 시뮬레이터

저는 지형을 나타내는 2D 그리드 상에 이산화된 Rothermel 화재 확산 모델 (Rothermel fire spread model)의 단순화된 버전을 사용했습니다. 주요 상태 변수는 온도 ($T(x,y,t)$)와 연료 분율 (fuel fraction, $F(x,y,t)$)입니다:

import jax.numpy as jnp
from jax import grad, jit, vmap

...

산불 물리 법칙을 학습하면서, 핵심 과제는 계산 효율성(computational efficiency)이라는 것을 깨달았습니다. 완전한 3D CFD (전산유체역학) 시뮬레이션은 실시간 대피 계획을 세우기에 너무 느립니다. 저의 해결책은 **물리 정보 신경망 (Physics-Informed Neural Network, PINN)**을 대리 모델 (surrogate model)로 사용하는 것이었습니다. 이는 화재 역학 (fire dynamics)을 높은 정확도로 근사하면서도 계산 속도는 수십 배 더 빠릅니다.

2. 교통 흐름 모델 (The Traffic Flow Model)

대피 물류를 위해, 저는 탄소 네거티브 인프라(예: 전기차 충전소, 바이오 연료 저장소)의 용량 제약 조건이 추가된 거시적 Lighthill-Whitham-Richards (LWR) 모델을 사용하여 교통을 모델링했습니다:

class EvacuationTrafficModel:
    def __init__(self, road_network, shelter_locations, ev_charging_capacity):
        self.graph = road_network
...

이 모델을 통한 실험에서 발견한 흥미로운 사실 중 하나는 탄소 네거티브 인프라가 무시할 수 없는 최적화 지형 (optimization landscape)을 형성한다는 점이었습니다. 탄소 포집 및 저장 (BECCS) 기술을 활용한 바이오 에너지 기반의 전기차 충전소는 음(-)의 배출을 생성하지만, 동시에 용량 제약을 부과합니다. 확산 모델 (diffusion model)은 총 배출량을 최소화하면서 동시에 사용 가능한 충전 용량이 있는 대피소로 대피자들을 경로 안내(route)하는 법을 학습해야 했습니다.

3. 물리 보강 확산 모델 (The Physics-Augmented Diffusion Model)

이제 핵심 기여 부분인 화재 역학(fire dynamics)과 교통 물리(traffic physics)를 모두 통합하는 확산 모델에 대해 설명하겠습니다. 저는 U-Net 아키텍처를 갖춘 확산 확률 모델 (Denoising Diffusion Probabilistic Model, DDPM)을 사용하되, 물리 기반 정규화 (physics-based regularization)를 포함하도록 학습 목적 함수 (training objective)를 수정했습니다:

import flax.linen as nn
import jax
from jax import random, numpy as jnp
...

이 아키텍처를 조사하는 과정에서, 물리 보강 (physics augmentation)이 미분 가능한 제약 조건 충족 레이어 (differentiable constraint satisfaction layer) 역할을 한다는 것을 발견했습니다. 표준 확산 모델 (standard diffusion model)이 가능한 대피 계획의 공간을 탐색한다면, 물리적 그래디언트 (physics gradient)는 샘플링을 물리적으로 실행 가능하고 안전한 솔루션으로 유도합니다. 이는 제약 최적화 (constrained optimization)가 작동하는 방식과 유사하지만, 생성 모델 (generative model)이 확률적 (stochastic) 측면을 처리한다는 점이 다릅니다.

훈련 및 샘플링: 실전에서의 교훈

이 하이브리드 모델을 훈련하는 것은 간단하지 않았습니다. 저는 두 가지 주요 과제에 직면했습니다.

과제 1: 다중 스케일 시간 역학 (Multi-scale Temporal Dynamics)

산불은 몇 분에서 몇 시간 단위의 시간 척도 (timescale)로 확산되는 반면, 대피는 몇 시간에서 며칠이 소요됩니다. 확산 모델의 노이즈 스케줄 (noise schedule)은 이러한 서로 다른 시간 척도를 고려해야 합니다. 저의 해결책은 대피 계획의 서로 다른 주파수 성분들이 각기 다른 비율로 손상되도록 하는 **계층적 노이즈 스케줄 (hierarchical noise schedule)**을 사용하는 것이었습니다.

def hierarchical_noise_schedule(t, num_scales=4):
    """물리 보강 확산 모델을 위한 다중 스케일 노이즈 스케줄."""
    base_beta = 0.0001 * (1 + t / 1000)
...

과제 2: 미분 가능한 물리 시뮬레이션 (Differentiable Physics Simulation)

물리 보강을 위해서는 화재 역학 시뮬레이터 (fire dynamics simulator)를 통한 그래디언트 (gradients)가 필요합니다. 표준 CFD 코드는 미분 가능하지 않습니다. 저는 JAX를 사용하여 Rothermel 모델의 미분 가능한 버전을 구현함으로써 이 문제를 해결했으며, 이를 통해 전체 시뮬레이션에 대한 자동 미분 (automatic differentiation)이 가능해졌습니다.

@jit
def differentiable_fire_step(T, F, wind, slope, dt):
    """완전 미분 가능한 화재 확산 단계."""
...

미분 가능한 물리 (differentiable physics)에 대해 학습하면서, 저는 이 접근 방식이 확산 모델이 예측된 화재 진화에 따라 대피 전략을 조정할 수 있는 **엔드 투 엔드 학습 (end-to-end learning)**을 가능하게 한다는 것을 발견했습니다. 이는 게임 체인저였습니다. 모델은 단순히 현재의 화재 위치뿐만 아니라, 향후 타오를 가능성이 있는 지역까지 피하는 법을 학습했습니다.

실제 적용 사례: 시에라 네바다 (Sierra Nevada) 테스트 케이스

저는 2020년 Creek Fire의 과거 데이터를 사용하여 캘리포니아 Sierra Nevada 지역의 실제 산불 시나리오에서 이 시스템을 테스트했습니다. 탄소 네거티브 (Carbon-negative) 인프라는 다음과 같이 구성되었습니다:

BECCS (Bioenergy with Carbon Capture and Storage)로 구동되는 12개의 전기차 충전소
탄소 포집 기능이 있는 8개의 바이오 연료 저장소 (Biofuel depots)
4개의 수소 연료 전지 (Hydrogen fuel cell) 백업 발전기

결과는 놀라웠습니다. 기존의 대피 계획과 비교했을 때 다음과 같습니다:

지표 (Metric)	기존 최적화 (Traditional Optimization)	물리 보강 확산 (Physics-Augmented Diffusion)
대피 시간 (Evacuation Time)	4.2시간	3.1시간
...

물리 보강 (Physics augmentation)을 통해 화선 (Fire front)이 이동함에 따라 모델이 대피자들의 경로를 동적으로 재설정할 수 있었으며, 탄소 네거티브 인프라 제약 조건을 통해 전기차들이 네거티브 배출 (Negative emissions)을 극대화할 수 있는 최적의 시간에 충전되도록 보장했습니다.

과제 및 해결책: 내가 배운 것들

차원의 저주 (The Curse of Dimensionality)

대피 계획에는 수천 대의 차량과 수백만 개의 잠재적 경로가 포함됩니다. 저의 초기 구현 방식은 계산적으로 다루기 힘든 (Computationally intractable) 평면적 표현 (Flat representation)을 사용했습니다. 해결책은 분자 생성 (Molecular generation)에 사용되는 **계층적 확산 모델 (Hierarchical diffusion models)**을 연구하는 데서 얻었습니다. 저는 대피 계획을 거시적 (Macroscopic, 지역적 경로 지정) 구성 요소와 미시적 (Microscopic, 국지적 도로 수준) 구성 요소로 분해하였으며, 각 요소는 고유한 확산 프로세스를 갖도록 했습니다.

도로 폐쇄 시의 물리적 불연속성 (Physics-Discontinuity at Road Closures)

화재로 인해 도로를 통과할 수 없게 되면, 물리 모델에 불연속성 (Discontinuity)이 발생합니다 (도로 용량이 0으로 떨어짐). 확산 모델은 매끄러운 점수 함수 (Smooth score functions)를 가정합니다. 저는 용량 함수에 대한 **매끄러운 근사치 (Smooth approximations)**를 사용하고 학습 과정에서 날카로움 (Sharpness)을 어닐링 (Annealing)함으로써 이 문제를 처리했습니다:

def smooth_road_closure(road_capacity, fire_intensity, sharpness=10):
    """도로 폐쇄의 매끄러운 근사치."""
    # 조절 가능한 날카로움을 가진 시그모이드 기반 폐쇄
...```

### 탄소 네거티브 인프라 제약 조건 (Carbon-Negative Infrastructure Constraints)

가장 놀라운 도전 과제는 탄소 네거티브 인프라 (carbon-negative infrastructure)가 **비볼록 최적화 지형 (non-convex optimization landscapes)**을 생성한다는 점이었습니다. 예를 들어, 피크 수요 시간 동안 BECCS (Bioenergy with Carbon Capture and Storage)로 구동되는 스테이션에서 전기차 (EV)를 충전하는 것은 순 배출량이 음수임에도 불구하고 그리드 불안정성 (grid instability)을 유발할 수 있습니다. 확산 모델 (diffusion model)의 확률적 샘플링 (stochastic sampling)은 이러한 복잡한 트레이드오프 (tradeoffs)를 탐색하는 데 이상적이라는 것이 밝혀졌습니다.

## 향후 방향: 이 기술이 나아갈 길

물리 보강 확산 모델링 (physics-augmented diffusion modeling)에 대한 저의 탐구는 몇 가지 흥미로운 경로를 열어주었습니다:

탄소 네거티브 인프라 내 산불 대피 물류 네트워크를 위한 물리 보강 확산 모델링 (Physics-Augmented Diffusion

요약

핵심 포인트