본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 18. 20:02

불확실성 전파를 위한 신경망 대리 모델의 성능에 관한 수치적 연구

요약

본 연구는 물리 모델링의 경계값 문제를 해결하기 위한 신경망 대리 모델이 확률적 분포의 꼬리(tails) 부분을 얼마나 정확하게 포착하는지 수치적으로 분석합니다. 열전도 방정식을 활용하여 데이터 기반 및 물리 정보 기반 손실 함수를 적용한 결과, 이상치 샘플에 대한 외삽 성능이 모델의 성능을 결정짓는 핵심 요소임을 밝혀냈습니다. 특히 약형 잔차 손실(weak form residual loss)을 사용한 완전 연결 신경망이 외삽된 입력에 대해 가장 우수한 예측 정확도를 보였습니다.

핵심 포인트

  • 기존 연구가 간과했던 확률 분포의 꼬리(tails) 부분에 대한 신경망 대리 모델의 성능을 집중 조사함
  • 최악의 경우 예측 오차는 평균장 오차보다 한 자릿수(an order of magnitude) 더 크게 나타남
  • 이상치 샘플에서의 높은 오차는 모델이 훈련 데이터 범위를 벗어나는 외삽(extrapolation)을 수행할 때 발생함
  • 약형 잔차 손실(weak form residual loss)을 적용한 완전 연결 신경망이 외삽 성능 및 예측 정확도 면에서 가장 우수함

신경망 대리 모델 (Neural network surrogate models)은 물리 모델링 (physical modeling)에서 마주하는 다양한 경계값 문제 (boundary value problems)의 해 영역 (solution fields)을 모델링하는 유망한 접근 방식으로 부상했습니다. 확률적 문제 (Stochastic problems)는 매개변수 분석 (parametric analysis)을 수행할 때 전통적인 수치 해석기 (numerical solvers)를 통한 비용이 많이 드는 순방향 모델 (forward models)의 반복적인 평가를 크게 줄일 수 있는 잠재력 때문에 특히 높은 관심을 받는 분야입니다. 그러나 기존 문헌의 많은 연구는 주로 결정론적 샘플 (deterministic samples)이나 평균장 해 (mean field solutions)를 표현하는 신경망 대리 모델의 능력에 초점을 맞추고 있으며, 분포의 꼬리 (tails of the distribution) 부분에서의 대리 모델 성능은 대체로 간과하고 있습니다. 본 연구는 분포의 꼬리 부분에 중점을 두면서, 전체 확률 공간 (probability space)에 걸쳐 해 영역의 전체 분포를 포착하는 신경망 대리 모델의 능력을 상세히 조사합니다. 열전도 방정식 (heat conduction equation)을 매우 확률적인 소스 항 (source term)과 함께 사용하여 열 해 영역 (thermal solution field)에 극도로 큰 변동을 유도함으로써 정형적인 문제 (canonical problem)로 활용합니다. 데이터 기반 (data-driven) 및 물리 정보 기반 (physics-informed) 손실 함수 (loss functions)를 모두 사용하여, 클래식한 피드포워드 완전 연결 네트워크 (feed-forward fully connected network)와 딥 오퍼레이터 네트워크 (Deep Operator Network) 아키텍처 간의 비교를 수행합니다. 결과에 따르면 최악의 경우 예측 오차 (worst-case prediction errors)는 평균장 오차 (mean field error)보다 한 자릿수(an order of magnitude) 더 크게 나타나며, 이는 이상치 샘플 (outlier samples)의 중요성을 강조합니다. 극단적인 샘플과 관련된 큰 오차는 네트워크가 훈련 데이터 (training data)의 범위를 벗어나 외삽 (extrapolate)해야 하기 때문에 발생합니다. 이러한 샘플을 식별하는 방법과 그 오차를 고려하기 위한 잠재적 접근 방식에 대한 논의를 함께 제시합니다. 고려된 모델 중, 약형 잔차 손실 (weak form residual loss)을 사용하여 훈련된 완전 연결 신경망 (fully connected neural network)이 이러한 외삽된 입력 (extrapolated inputs)을 처리하는 데 가장 우수한 성능을 보였으며, 수치적으로 생성된 데이터셋에 대해 가장 높은 예측 정확도를 달성했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0