본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 11:50

효율적인 오디오 이벤트 탐지를 위한 뉴로모픽 트리거 (Neuromorphic Trigger)

요약

스파이킹 신경망(SNN)을 활용하여 효율적인 오디오 이벤트 탐지를 수행하는 뉴로모픽 트리거를 제안합니다. 이 트리거는 저비용 프런트엔드로서 유의미한 오디오 세그먼트만 상위 모델로 전달하여 연산 효율을 극대화합니다.

핵심 포인트

  • SNN 기반의 경량화된 뉴로모픽 트리거 제안
  • 이상 음향 탐지(ASD)에서 높은 F1 점수(0.97) 달성
  • 음향 이벤트 탐지(SED) 시 에러율 감소 및 FLOPs 대폭 절감
  • 실시간 및 자원 제한적 시스템을 위한 에너지 효율적 솔루션

연속적인 오디오 스트림을 효율적으로 처리하는 것은 실시간 및 자원 제한적 시스템(resource-constrained systems)을 위한 핵심 과제로 남아 있습니다. 본 논문은 하위 모델(downstream models)로의 입력을 선택적으로 게이팅(gating)하는 스파이킹 신경망 (Spiking Neural Network, SNN)에 기반한 오디오 이벤트 탐지용 뉴로모픽 트리거 (neuromorphic trigger)를 소개합니다. 제안된 트리거는 저비용 프런트엔드 (front-end) 역할을 수행하여, 두드러진 오디오 세그먼트를 식별하고 분류 (classification)와 같은 작업을 수행하는 더 연산 집약적인 모델로 이러한 세그먼트만을 전달합니다. 이 트리거는 경량화된 완전 연결 SNN (fully connected SNN)으로 구현되었으며, 두 가지 대표적인 작업인 이상 음향 탐지 (Anomalous Sound Detection, ASD) 및 음향 이벤트 탐지 (Sound Event Detection, SED)에서 평가되었습니다. ASD의 경우, 트리거는 클래스 불가지론적 (class-agnostic) 형태의 URBAN-SED 데이터셋에서 1초 세그먼트 기반 F1 점수 0.97을 달성하여 관련 오디오 영역을 식별하는 데 있어 높은 신뢰성을 입증했습니다. SED의 경우, 트리거를 DCASE 2017 Challenge Task 2 데이터셋의 Dang 분류기 (classifier)와 결합했을 때, 이벤트 기반 에러율 (event-based error rate)의 하한선을 0.41에서 0.25로 낮추는 동시에 FLOPs를 잠재적으로 $42.6 imes$ 감소시켰습니다. 이러한 결과는 뉴로모픽 트리거가 실시간, 에너지 효율적인 프런트엔드 필터로서 상당한 연산 비용 절감을 가능하게 하는 잠재력을 가지고 있음을 강조합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0