본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 30. 16:43

FloatSOM: GPU 가속화, 분산 처리, 토폴로지 유연한 자기 조직화 맵

요약

FloatSOM은 GPU 가속화, 아웃 오브 메모리 스트리밍 지원, 그리고 정규 격자를 넘어선 유연한 토폴로지를 제공하는 확장 가능한 자기 조직화 맵(SOM) 프레임워크입니다. 이 프레임워크는 대규모 데이터셋의 메모리 한계를 극복하고 고처리량 분산 처리를 통해 뛰어난 성능을 유지합니다. 특히, 새로운 토폴로지 인식 하이퍼파라미터 미세 조정과 결합하여 기존 최첨단 SOM 베이스라인보다 낮은 양자화 에러를 달성함을 입증했습니다.

핵심 포인트

  • FloatSOM은 대규모 데이터셋 처리를 위해 아웃 오브 메모리 디스크 기반 스트리밍 기능을 지원합니다.
  • 다중 GPU 실행 및 고처리량 분산 컴퓨팅을 통해 수십억 개의 샘플과 대형 네트워크를 효율적으로 학습시킬 수 있습니다.
  • 정규 격자를 넘어선 유연한 토폴로지를 지원하여 SOM의 표현력을 확장했습니다.
  • 새로운 토폴로지 인식 하이퍼파라미터 미세 조정 덕분에 기존 대비 낮은 양자화 에러를 달성합니다.

GPU 가속화된 자기 조직화 맵 (Self-Organizing Map, SOM) 구현체는 대규모 SOM 분석을 위한 가장 경쟁력 있는 옵션 중 하나이나, 데이터셋 크기의 증가로 인해 워크로드가 더 이상 장치 메모리 한계 내에 깔끔하게 들어가지 않게 되어 실용적 사용에 점점 더 큰 도전을 받고 있습니다. 우리는 다중 GPU 실행, 아웃 오브 메모리 디스크 기반 스트리밍 지원, 그리고 정규 격자를 넘어선 새로운 토폴로지 (topologies) 를 지원하는 확장 가능한 학습 및 배포를 위한 SOM 프레임워크인 FloatSOM 을 소개합니다. 우리는 14 개의 합성 및 실제 벤치마크 데이터셋과 함께 제어된 속도 스케일링 벤치마크에서 FloatSOM 을 평가하였으며, 이러한 개선된 토폴로지가 토폴로지 인식 하이퍼파라미터 미세 조정 (topology-aware hyperparameter fine-tuning) 과 결합될 때 현재 최첨단 SOM 베이스라인보다 낮은 양자화 에러 (quantization error) 를 달성함을 보여줍니다. FloatSOM 은 또한 고처리량 분산 실행을 통해 대규모에서도 이 성능을 유지합니다; 가장 큰 벤치마크에서 8 개의 GPU 와 두 개의 별도의 고성능 컴퓨팅 노드 (high-performance-computing nodes) 에서 1,000,000,000 개의 샘플과 50 개 특징을 가진 1024 노드의 SOM 네트워크를 6.16 분 만에 학습시켰습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0