본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 12:56

FiLark: 분산 음향 센싱(DAS)에서의 엔드 투 엔드 탐색, 주석 달기 및 알고리즘 통합을 위한 스트리밍 우선 소프트웨어 프레임워크

요약

FiLark는 분산 음향 센싱(DAS)의 방대한 데이터 스트림을 효율적으로 처리하기 위해 설계된 스트리밍 우선 Python 프레임워크입니다. 이 프레임워크는 데이터 탐색, 실시간 주석 달기, 신호 처리 및 알고리즘 모니터링을 하나의 통합된 워크플로로 제공하여 오프라인 처리의 한계를 극복합니다.

핵심 포인트

  • 스트리밍 우선 원칙을 적용하여 연속적인 다중 파일 녹화를 하나의 통합된 데이터 스트림으로 추상화함
  • OpenGL 기반 링 버퍼 렌더러를 통해 일정한 메모리 사용량으로 대규모 데이터를 대화형으로 시각화 가능
  • 오프라인 전처리 없이 연속 데이터 스트림 내에서 직접 이벤트 레이블링을 수행하여 머신러닝 데이터셋 생성 지원
  • CPU 및 PyTorch 기반 GPU 가속을 지원하는 신호 처리 라이브러리와 상태 유지 청크 실행 방식 제공
  • 대화형으로 개발된 워크플로를 수정 없이 프로덕션 파이프라인으로 즉시 확장 가능

분산 음향 센싱 (Distributed acoustic sensing, DAS) 시스템은 기존의 배치 지향적 (batch-oriented) 분석 프레임워크의 능력을 초과하는 속도로 연속적이고 초고채널 수의 데이터 스트림을 생성합니다. 그 결과, 장기간 녹화 데이터의 대화형 탐색, 확장 가능한 이벤트 주석 달기 (annotation), 그리고 실시간 알고리즘 인 더 루프 (algorithm-in-the-loop) 모니터링과 같은 필수적인 작업들이 수동으로 선택된 데이터 세그먼트와 오프라인 처리 중심의 워크플로에 의해 불충분하게 지원되는 상태로 남아 있습니다. 본 논문은 DAS를 위해 데이터 액세스, 신호 처리 (signal processing), 시각화 (visualization) 및 모니터링 전반에 걸쳐 extit{스트리밍 우선 (streaming-first)} 원칙을 균일하게 적용하는 Python 프레임워크인 FiLark (Fiber Lark)를 제시합니다. FiLark는 수동으로 선택된 데이터 세그먼트에서 작동하는 대신, 연속적인 다중 파일 녹화를 포함한 모든 DAS 소스를 통합된 스트림으로 제시하며, 해당 추상화를 중심으로 모든 시스템 구성 요소를 구축합니다. OpenGL 기반의 링 버퍼 (ring-buffer) 렌더러는 일정한 메모리 사용량으로 임의의 길이의 녹화 데이터를 대화형으로 탐색하고 시각화할 수 있게 합니다. 통합된 주석 인터페이스는 연속적인 데이터 스트림 내에서 직접 이벤트 레이블링을 지원하여, 오프라인 전처리 없이도 재현 가능한 머신러닝 (machine-learning) 준비용 레이블 데이터셋 생성을 용이하게 합니다. 신호 처리 라이브러리는 시간적, 공간적, 스펙트럼 및 분해 기반 연산자를 포함하며, CPU 구현체와 PyTorch를 통한 GPU 가속 변형을 모두 제공합니다. 이와 더불어 세그먼트 경계 전반에서 처리 연속성과 애플리케이션 의미론을 보존하는 상태 유지 청크 실행 (stateful chunked execution) 방식을 지원합니다. 표준화된 모니터 인터페이스는 스트리밍 탐지기 (detectors)와 학습 기반 모델을 시각화 워크플로에 추가로 통합합니다. 모든 계층에 걸쳐 공통된 스트리밍 추상화를 공유함으로써, FiLark는 대화형으로 개발된 처리 구성 및 워크플로가 수정 없이 확장 가능한 프로덕션 파이프라인으로 직접 전달될 수 있도록 합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG (Machine Learning)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0