전 지구적 폭풍 해결 대기 AI 시뮬레이션의 확장

킬로미터(km) 규모의 대류(convection)는 강수 극한값, 열대 조직화, 그리고 구름 피드백을 형성하지만, 대부분의 전 지구 대기 모델은 이러한 과정을 25-100km 해상도에서 근사합니다. 전 지구적 폭풍 해결 물리 모델(Global storm-resolving physics models)은 대류 시스템을 명시적으로 해결하지만, 엑사스케일(exascale) 슈퍼컴퓨터에서 시뮬레이션된 하루당 약 1MWh의 비용이 발생하는 등 장기 시뮬레이션을 제한하는 비용 문제가 있습니다. 우리는 전 지구적 폭풍 해결 대기 역학을 위한 최초의 자기회귀(autoregressive) AI 에뮬레이터인 STRATA (Storm-resolving Tile-based autoRegressive Atmosphere Transformer Architecture)를 소개합니다. STRATA는 전 지구적 AI 에뮬레이션에 사용된 데이터셋 중 역대 최고 해상도인 4.9km 해상도의 SCREAM 물리 모델 출력 데이터(~2,500만 그리드 셀) 17일분(10분 간격 샘플링)을 사용하여 학습되었습니다. 우리의 핵심 전제는 10분 단위의 시간 척도에서 대기 역학이 주로 국지적(local)이라는 것이며, 따라서 작은 공간 타일(tile) 단위로 학습함으로써 부족한 전 지구적 시간 샘플을 풍부한 국지적 공간 샘플로 교환하고, 중첩 타일 블렌딩(overlapping-tile blending)을 통해 전 지구적 롤아웃(rollout)을 가능하게 합니다. STRATA는 3D 패치 임베딩(patch embedding)과 국지적 3D 이웃 어텐션(local 3D neighborhood attention), 그리드 불변 인코딩을 위한 새로운 정거사 로터리 위치 임베딩(Stereographic Rotary Position Embedding, StereoRoPE), 그리고 패치 규모의 롤아웃 아티팩트(artifact)를 억제하는 픽셀 공간 디에일리어싱 디코더(pixel-space de-aliasing decoder)를 결합합니다. iso-FLOP 스케일링 연구에 따르면, km-scale 에뮬레이션은 대류 규모 역학의 높은 정보 밀도와 일치하게 저해상도 AI 기상 모델보다 그리드 포인트당 약 10배 더 많은 FLOPs를 요구합니다. 단 17일간의 데이터로 학습된 STRATA는 다양한 체제(regime)에 걸쳐 현실적인 km-scale 역학을 갖춘 안정적인 24시간 전 지구적 롤아웃을 생성하지만, 예측 시간(lead time)이 길어짐에 따라 대규모 편향(bias)이 발생합니다. STRATA는 메가와트시(MWh)당 48일의 시뮬레이션을 달성하며, 이는 SCREAM 물리 모델보다 에너지 효율이 약 50배 더 높습니다. 또한 512개의 H100 GPU를 사용할 경우 실제 시간(wall-clock) 하루당 741일의 시뮬레이션을 수행합니다. 코드와 데이터셋은 공개적으로 사용할 수 있습니다.

Insights

전 지구적 폭풍 해결 대기 AI 시뮬레이션의 확장

요약

핵심 포인트

댓글

AI 파일럿이 프로덕션 단계로 넘어가기 전에 중단되는 이유

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들

모델 리스트 하드코딩 중단하기: 토큰 낭비를 40% 줄이는 탐색 기반 MCP 사용법

Anthropic의 오랫동안 중단되었던 Fable 5 서비스 재개 승인

LLM을 대규모로 배포할 때 아무도 말해주지 않는 것들

모델 리스트 하드코딩 중단하기: 토큰 낭비를 40% 줄이는 탐색 기반 MCP 사용법