본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 07:27

연속적인 연산자 학습을 위한 In-Context Operator 활용 (Chain of Operators)

요약

신경 연산자의 일반화 성능 한계를 극복하기 위해 In-Context Operator(ICON)를 활용한 새로운 프레임워크인 Chain of Operators(CHOP)를 제안합니다. CHOP는 파라미터 업데이트 없이 고정된 ICON과 기본 변환의 체인을 구축하여 OOD 연산자 작업에서도 높은 성능을 보여줍니다.

핵심 포인트

  • ICON의 분포 밖(OOD) 연산자 일반화 문제 해결
  • 파라미터 업데이트 없는 고정된 ICON 활용 프레임워크 제안
  • 명시적 기본 변환과 ICON을 결합한 연산자 체인 구축
  • 스칼라 보존 법칙 및 평균장 제어 문제에서 추론 오차 감소 확인
  • 체인 구성 요소의 해석 가능성 및 닫힌 형식 유지

신경 연산자(Neural operators)는 함수 공간 간의 매핑을 근사하지만, 다른 연산자에 대해서는 일반화 성능이 떨어지는 경우가 많고 보통 미세 조정(fine-tuning)이나 재학습이 필요합니다. In-Context Operator Networks (ICON)는 모델에 수치적 컨텍스트를 프롬프팅하여 모델이 프롬프트로부터 특정 연산자를 학습하고 미세 조정 없이도 다양한 연산자에 적응하도록 함으로써 이 문제를 해결합니다. 하지만 ICON은 여전히 분포 밖(out-of-distribution, OOD)의 연산자 작업에 일반화하는 데 실패할 수 있습니다. 대규모 언어 모델(LLMs)의 하네스 엔지니어링 성공에서 영감을 받아, 우리는 Chain of Operators (CHOP)를 소개합니다. CHOP는 파라미터를 업데이트하지 않고도 고정된 ICON을 OOD 연산자 작업에 활용하는 프레임워크입니다. 구체적으로, CHOP는 명시적인 기본 변환(elementary transformations)과 고정된 ICON으로 구성된 연산자 체인(chain of operators)을 구축합니다. 스칼라 보존 법칙 및 평균장 제어 문제에 대한 실험 결과, CHOP가 직접적인 ICON 평가 대비 상대적 추론 오차를 줄이는 것을 보여주었으며, 동시에 체인의 각 연산자는 해석 가능하고 닫힌 형식(closed form)으로 유지됩니다. 한 PDE 계열에서 구성된 체인은 다른 계열로도 일반화될 수 있으며, 이는 하네스 시스템 전반에 걸쳐 공유되는 메커니즘이 있음을 나타냅니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0