arXiv논문2026. 06. 02. 11:48

다상 이동 경계 문제로서의 지속 학습 (Continual Learning)

요약

Stefan-CL은 물리학의 상변화 원리를 활용하여 지속 학습의 안정성-가소성 딜레마를 해결하는 새로운 연구입니다. 지식을 고체와 액체 상태로 정의하고 잠열 조절을 통해 망각을 최소화하며, 데이터 저장 없이도 높은 성능을 유지합니다.

핵심 포인트

물리학의 상변화 개념을 적용한 지속 학습 방법론
안정성-가소성 딜레마를 해결하여 망각 현상 최소화
원본 데이터 없이도 베이스라인 모델 수준의 성능 달성
잠열 조절을 통한 지식 경계의 동적 제어

지속 학습 (Continual learning)은 과거의 지식을 유지하는 것과 새로운 태스크를 흡수하는 것 사이의 균형을 맞추는 데 어려움을 겪습니다. Stefan-CL은 용융 (melting)의 물리학을 통해 이 안정성-가소성 딜레마 (stability-plasticity dilemma)를 우아하게 해결합니다. 이 방식은 공고화된 지식을 보호된 "고체 (solid)"로, 사용되지 않는 용량을 적응 가능한 "액체 (liquid)"로 정의합니다. 네트워크가 학습함에 따라 이 경계는 "잠열 (latent heat)" 조절 다이얼에 의해 제어되며 확장됩니다. 학습된 내부를 수학적으로 동결함으로써, Stefan-CL은 망각을 거의 제로에 가깝게 줄이며, 원본 데이터를 저장하지 않고도 메모리 집약적인 베이스라인 (baselines) 모델들과 대등한 성능을 보여줍니다. 이는 AI를 위한 아름답고 물리학에 기반한 경로를 개척합니다.

AI 자동 생성 콘텐츠

원문 바로가기

다상 이동 경계 문제로서의 지속 학습 (Continual Learning)

요약

핵심 포인트

댓글