전 지구적 폭풍 해결 대기 AI 시뮬레이션의 확장
요약
STRATA는 전 지구적 폭풍을 해결하기 위해 개발된 최초의 자기회귀 AI 에뮬레이터입니다. 4.9km의 초고해상도 데이터를 사용하여 대기 역학을 시뮬레이션하며, 기존 물리 모델 대비 약 50배 높은 에너지 효율을 제공합니다.
핵심 포인트
- 4.9km 초고해상도 대기 역학 시뮬레이션 가능
- 기존 물리 모델 대비 에너지 효율 약 50배 향상
- StereoRoPE 및 국지적 3D 이웃 어텐션 기술 적용
- H100 GPU 사용 시 하루에 741일 분량 시뮬레이션 수행
킬로미터(km) 규모의 대류(convection)는 강수 극한값, 열대 조직화, 그리고 구름 피드백을 형성하지만, 대부분의 전 지구 대기 모델은 이러한 과정을 25-100km 해상도에서 근사합니다. 전 지구적 폭풍 해결 물리 모델(Global storm-resolving physics models)은 대류 시스템을 명시적으로 해결하지만, 엑사스케일(exascale) 슈퍼컴퓨터에서 시뮬레이션된 하루당 약 1MWh의 비용이 발생하는 등 장기 시뮬레이션을 제한하는 비용 문제가 있습니다. 우리는 전 지구적 폭풍 해결 대기 역학을 위한 최초의 자기회귀(autoregressive) AI 에뮬레이터인 STRATA (Storm-resolving Tile-based autoRegressive Atmosphere Transformer Architecture)를 소개합니다. STRATA는 전 지구적 AI 에뮬레이션에 사용된 데이터셋 중 역대 최고 해상도인 4.9km 해상도의 SCREAM 물리 모델 출력 데이터(~2,500만 그리드 셀) 17일분(10분 간격 샘플링)을 사용하여 학습되었습니다. 우리의 핵심 전제는 10분 단위의 시간 척도에서 대기 역학이 주로 국지적(local)이라는 것이며, 따라서 작은 공간 타일(tile) 단위로 학습함으로써 부족한 전 지구적 시간 샘플을 풍부한 국지적 공간 샘플로 교환하고, 중첩 타일 블렌딩(overlapping-tile blending)을 통해 전 지구적 롤아웃(rollout)을 가능하게 합니다. STRATA는 3D 패치 임베딩(patch embedding)과 국지적 3D 이웃 어텐션(local 3D neighborhood attention), 그리드 불변 인코딩을 위한 새로운 정거사 로터리 위치 임베딩(Stereographic Rotary Position Embedding, StereoRoPE), 그리고 패치 규모의 롤아웃 아티팩트(artifact)를 억제하는 픽셀 공간 디에일리어싱 디코더(pixel-space de-aliasing decoder)를 결합합니다. iso-FLOP 스케일링 연구에 따르면, km-scale 에뮬레이션은 대류 규모 역학의 높은 정보 밀도와 일치하게 저해상도 AI 기상 모델보다 그리드 포인트당 약 10배 더 많은 FLOPs를 요구합니다. 단 17일간의 데이터로 학습된 STRATA는 다양한 체제(regime)에 걸쳐 현실적인 km-scale 역학을 갖춘 안정적인 24시간 전 지구적 롤아웃을 생성하지만, 예측 시간(lead time)이 길어짐에 따라 대규모 편향(bias)이 발생합니다. STRATA는 메가와트시(MWh)당 48일의 시뮬레이션을 달성하며, 이는 SCREAM 물리 모델보다 에너지 효율이 약 50배 더 높습니다. 또한 512개의 H100 GPU를 사용할 경우 실제 시간(wall-clock) 하루당 741일의 시뮬레이션을 수행합니다. 코드와 데이터셋은 공개적으로 사용할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기