동질적 심층 네트워크에서의 지속 학습 수렴성
요약
동질적 심층 네트워크에서의 약한 규제화된 지속 분류를 태스크 마진 집합으로의 순차적 투영으로 정의하고 분석합니다. 기존의 정적 또는 선형 모델 분석을 일반화하며, 비볼록 투영 이론을 통해 국소 선형 수렴성을 보장하는 정칙성 특성을 규명합니다.
핵심 포인트
- 동질적 모델의 지속 분류를 순차적 투영 과정으로 규정
- 비선형 파라미터 모델에서의 전역 수렴 실패 가능성 입증
- 비볼록 투영 이론을 활용한 국소 선형 수렴성 보장
- 지속적 회귀 분석으로의 프레임워크 확장
우리는 동질적 모델 (homogeneous models)에서의 약한 규제화된 지속 분류 (weakly regularized continual classification)를 태스크 마진 집합 (task margin sets)으로의 순차적 투영 (sequential projections)으로 규정합니다. 이 결과는 정적 (stationary, 단일 태스크) 심층 모델 또는 지속적 선형 모델 (continual linear models)로 제한되었던 이전의 분석들을 일반화합니다. 우리는 데이터에 대해서는 선형적이지만 파라미터에 대해서는 비선형적인 단순한 모델의 경우에도 전역 수렴 (global convergence)이 일반적으로 실패함을 보여줍니다. 그럼에도 불구하고, 비볼록 투영 이론 (nonconvex projection theory)의 결과들을 활용하여, 우리는 무작위 및 순환적 태스크 시퀀스 (random and cyclic task sequences) 하에서 국소 선형 수렴 (local linear convergence)을 보장하는 동질적 심층 네트워크의 정칙성 특성 (regularity properties)을 식별합니다. 마지막으로, 우리는 분석을 지속적 회귀 (continual regression)로 확장하여 동질적 모델을 위한 프레임워크를 통합합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기