신경 특징 학습을 위한 푸리에 프리컨디셔닝 (Fourier Preconditioning)

상호 정보량 (Mutual Information, MI)에서 영감을 얻은 특징 학습 (feature learning) 기술은 비선형 의존 구조를 유지하는 저차원 임베딩 (embeddings)을 생성할 수 있지만, MI의 직접적인 추정은 데이터가 적은 환경 (low-data regime)에서 노이즈가 심한 확률 분포 추정 문제로 인해 어려움을 겪습니다. 2차 통계량 (second-order statistics)으로부터 계산되는 H-Score 목적 함수는 특징 추출 네트워크 (feature extraction networks)를 학습시키기 위한 실용적인 프록시 지표 (proxy metric)를 제공합니다. 본 논문에서는 제한되지 않은 함수 설정 (unrestricted functional setting)에서 H-Score가 가역 변환 (invertible transformations)에 대해 불변임을 증명하지만, 제약된 근사 클래스 (constrained approximation classes) 하에서는 입력 기저 회전 (input basis rotations)에 민감해진다는 것을 보여줍니다. 결과적으로, 우리는 H-Score 네트워크를 위한 유니터리 프리컨디셔닝 (unitary preconditioning)을 연구하며, 적절한 기저 회전을 선택하는 것이 예측 의존성을 더 적은 수의 지배적인 모드 (dominant modes)로 집중시킴으로써 유한 너비 절단 오차 (finite-width truncation error)를 줄인다는 것을 보여줍니다. 우리는 근사적으로 정상 상태 프로세스 (approximately stationary processes)에 대해 데이터 독립적이고 비용이 낮은 효과적인 프리컨디셔너 (preconditioner)로 고속 푸리에 변환 (Fast Fourier Transform, FFT)을 식별하였으며, 이 경우 스펙트럼 구조가 교차 공분산 특이값 스펙트럼 (cross-covariance singular value spectrum)의 집중을 유도합니다. 우리는 네트워크 학습 전에 기저의 적합성을 정량화하고 다운스트림 추론 이득 (downstream inference gains)을 예측하기 위해 스펙트럼 엔트로피 (spectral entropy)와 누적 의존 에너지 (cumulative dependence energy)에 기반한 학습 불필요 (training-free) 지표를 도입합니다. 8개의 다변량 데이터셋에 대한 실험을 통해 FFT 프리컨디셔닝이 자원이 제한된 환경에서 특히 유용하며, 최대 50%의 정규화 평균 제곱 오차 (Normalized Mean Squared Error, NMSE) 감소를 달성함을 입증합니다. 또한 제안된 지표는 관찰된 성능 향상과 상관관계가 있으며, 스펙트럼 프리컨디셔닝이 해로운 경우를 정확하게 식별합니다.

Insights

신경 특징 학습을 위한 푸리에 프리컨디셔닝 (Fourier Preconditioning)

요약

핵심 포인트

댓글

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에

Claude Code에서 Grok으로 전환하기 – 동일한 인터페이스, 다른 모델

[audio.cpp] GGML의 소리 — C++/GGML 네이티브 ACE-Step, Stable Audio, HeartMuLa

AI 에이전트(Claude Code)를 1년 동안 '사원'으로서 실무에 사용하며 알게 된 것 ―― 자사 사이트를 12.89초에서 2.03초로

Claude Code가 파일을 다시 읽고 명령 출력을 확인하며 낭비하는 토큰 양을 일주일 동안 측정해 보았습니다. 약 1,050만 개에

Claude Code에서 Grok으로 전환하기 – 동일한 인터페이스, 다른 모델