물리 정보 신경망 (PINNs)의 양호한 조건 학습을 위한 최적화 프레임워크

물리 정보 신경망 (Physics-informed neural networks, PINNs)은 편미분 방정식 (partial differential equations)을 해결하기 위한 유망한 경로로 등장했지만, 고전적인 솔버 (solvers)의 정밀도에 도달하는 데 어려움을 겪어 왔습니다. 그 장애물은 심각하게 조건이 나쁜 (ill-conditioned) 손실 지형 (loss landscape)으로 인해 최적화 (optimisation)의 문제인 것으로 점점 더 명확해지고 있습니다. 우리는 이러한 ill-conditioning 문제에 맞서 전례 없는 정확도와 속도를 확보하는 확장 가능한 2차 최적화 (second-order optimisation) 프레임워크인 $\textbf{DSGNAR}$: Doubly-Sketched Gauss-Newton with Adaptive Ratio를 제시합니다. $\textbf{DSGNAR}$은 이중 스케치 가우스-뉴턴 (doubly-sketched Gauss-Newton) 모델을 정규화 (regularisation)와 단계 길이 (step length)를 모두 세심하게 제어하는 새로운 전략과 결합합니다. 비선형 (nonlinear), 카오스 (chaotic), 다중 스케일 (multi-scale), 고차원 (high-dimensional) 및 Navier-Stokes에 이르는 일련의 문제들에 대해, 이 프레임워크는 기존의 기술 (state of the art)을 크게 개선했습니다. 즉, 배정밀도 (double precision)에서 $3\times10^{-16}$만큼 낮은 상대 $\ell_2$ 오차를 달성할 수 있고, 표준적인 Burgers' equation에서 기존 결과를 5자릿수(five orders of magnitude)만큼 개선하며, 고차원 Poisson 문제에서는 무려 8자릿수만큼 개선하는 동시에 현저히 빠른 속도를 유지합니다. 나아가 우리는 단정밀도 (single precision)에서도 반올림 오차 (round-off error)의 한계에 도달하는 솔루션을 매우 빠르게 얻을 수 있음을 보여줍니다: Burgers' equation의 경우 10초 이내에 $\ell_2^{\text{rel}} = 4.75 \times 10^{-7}$에 도달합니다. 또한 이 프레임워크는 아키텍처 (architecture), 산술 정밀도 (arithmetic precision) 및 초기 하이퍼파라미터 (hyperparameters)의 선택에 대해서도 견고합니다. 코드는 https://www.github.com/wephy/physics-informed-neural-networks 에서 확인할 수 있습니다.

Insights

물리 정보 신경망 (PINNs)의 양호한 조건 학습을 위한 최적화 프레임워크

요약

핵심 포인트

댓글

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에

Claude Code에서 Grok으로 전환하기 – 동일한 인터페이스, 다른 모델

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에

Claude Code에서 Grok으로 전환하기 – 동일한 인터페이스, 다른 모델