arXiv논문2026. 06. 26. 11:22

공기역학적 예측을 위한 Kolmogorov Arnold networks (KAN): MLPs 및 GNNs와의 비교

요약

본 연구는 새로운 신경망 아키텍처인 Kolmogorov-Arnold networks(KAN)를 유체 역학 대리 모델링에 적용하여 MLP 및 GNN과 성능을 비교합니다. KAN은 낮은 복잡도로 빠른 훈련이 가능하지만, 성능이 하이퍼파라미터에 민감하고 훈련 불안정성을 보일 수 있음을 확인했습니다.

핵심 포인트

KAN은 활성화 함수를 학습 가능한 파라미터로 조정하는 새로운 아키텍처임
공기역학적 압력 분포 예측에서 KAN은 우수한 보간 성능을 보임
KAN의 성능은 적절한 MLP보다는 미세하게 낮으나 훈련 속도는 더 빠름
GNN은 가장 높은 성능을 보이지만 훈련 시간이 더 오래 걸림
KAN은 하이퍼파라미터 최적화와 훈련 안정성에 대한 주의가 필요함

Kolmogorov Arnold networks (KAN)는 최근 (심층) 신경망 아키텍처로서 도입되었습니다. 이 아키텍처는 심층 다층 퍼셉트론 (MLPs)과 같은 전통적인 아키텍처의 핵심인 아핀 변환 (affine transformations) 계수 대신, 학습 가능한 파라미터가 활성화 함수 (activation functions)를 조정한다는 특징이 있습니다. 이 아키텍처는 Kolmogorov-Arnold 정리에 기반하며, 이를 통해 보편적 근사 (universal approximation) 속성을 부여받습니다. KAN의 등장은 흥분 속에 받아들여졌으나, 기호 회귀 (symbolic regression), 범용 머신러닝 (generic-purpose machine learning), 자연어 처리 (natural language processing) 또는 컴퓨터 비전 (computer vision)과 같은 고전적인 분야에서 KAN이 심층 다층 퍼셉트론 (MLPs)보다 우월할 수 있는지에 대해서는 현재 논쟁이 진행 중입니다. 본 연구에서는 유체 역학 대리 모델링 (fluid dynamics surrogate modelling) 영역에서 KAN의 성능을 평가하고, MLPs 및 그래프 신경망 (GNNs)과의 미묘한 차이를 비교합니다. 이를 위해 우리는 공기역학의 표준 과제인 아음속 및 천음속 에어포일 (airfoils) 상의 표면 압력 분포를 예측하는 과제를 고려합니다. 우리의 결과에 따르면, KAN 모델은 전체 압력 계수 (pressure coefficients)를 예측하는 데 좋은 성능을 보이며 마하 수 (Mach numbers)와 받음각 (angles of attack)에 걸쳐 보간 (interpolate)할 수 있음을 보여줍니다. 그러나 그 성능은 적절히 훈련된 MLP와 비교할 만한 수준이며 — 미세하게 열등합니다 — GNN은 더 긴 훈련 시간을 대가로 최상의 성능을 달성합니다. 최적의 KAN 모델은 일반적으로 MLP 및 GNN보다 복잡도가 훨씬 낮아 — 따라서 더 빠른 훈련이 가능하지만 — KAN은 훈련 불안정성 (training instabilities)을 겪으며, 그 성능이 적절한 하이퍼파라미터 최적화 (hyperparameter optimisation)에 크게 의존한다는 것을 발견했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

공기역학적 예측을 위한 Kolmogorov Arnold networks (KAN): MLPs 및 GNNs와의 비교

요약

핵심 포인트

댓글