Stiefel 다양체에서의 Newton-Schulz 기반 2 차 방법
요약
본 논문은 스티펠 다양체(Stiefel manifold) 위에서 리만 다양체 방법 대신 사용할 수 있는 2차 수렴의 비리트랙션(retraction-free) 최적화 방법을 제안합니다. 이 방법은 목적 함수를 줄이는 접선 성분과, 제약 조건 위로 돌아오게 하는 법선 성분의 합으로 업데이트됩니다. 특히, 법선 성분을 계산하기 위해 직교화를 위한 고정점 반복인 뉴턴-슐츠(Newton-Schulz) 방법을 사용하며, 이를 통해 기존 방법들보다 우수한 성능을 보였습니다.
핵심 포인트
- 스티펠 다양체 최적화에 대한 새로운 2차 수렴 비리트랙션 접근법을 제시함.
- 업데이트 과정은 목적 함수 감소를 위한 접선 성분과, 제약 조건 위로의 복귀를 위한 법선 성분의 조합으로 구성됨.
- 직교화를 수행하는 법선 성분 계산에 뉴턴-슐츠(Newton-Schulz) 고정점 반복을 활용함.
- 제안된 방법은 직교 프로크루스테스 문제, 주성분 분석 등 여러 실제 데이터 문제에서 기존 방법들보다 우수한 성능을 입증함.
Retraction-free approaches offer attractive low-cost alternatives to Riemannian methods on the Stiefel manifold, but they are often first-order, which may limit the efficiency under high-accuracy requirements. To this end, we propose a second-order method landing on the Stiefel manifold without invoking retractions, which is proved to enjoy local quadratic (or superlinear for its inexact variant) convergence. The update consists of the sum of (i) a component tangent to the level set of the constraint-defining function that aims to reduce the objective and (ii) a component normal to the same level set that reduces the infeasibility. Specifically, we construct the normal component via Newton-Schulz, a fixed-point iteration for orthogonalization. Moreover, we establish a geometric connection between the Newton-Schulz iteration and Stiefel manifolds, in which Newton-Schulz moves along the normal space. For the tangent component, we formulate a modified Newton equation that incorporates Newton-Schulz. Numerical experiments on the orthogonal Procrustes problem, principal component analysis, and real-data independent component analysis illustrate that the proposed method performs better than the existing methods.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기