본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 12. 18:47

곤충 노래 해독: 다중 작업 준지도 오르토프테라 생체음향 분류기

요약

본 연구는 오르토프테라(Orthoptera) 생체음향 분류를 위해 PULSE라는 준지도, 다중 작업 프레임워크를 제안합니다. 이 프레임워크는 약지도 학습, 자기 지도 학습, 지식 증류를 결합하여 기존 자동화 도구의 한계를 극복했습니다. 그 결과, 일반 모델 대비 높은 성능을 달성했으며, 능동 학습 추가 시 더욱 향상된 결과를 보였습니다.

핵심 포인트

  • PULSE 프레임워크는 준지도 및 다중 작업 방식을 사용합니다.
  • 약지도 분류와 자기 지도 학습을 결합하여 전이성을 높였습니다.
  • 도메인 적응형 모델이 일반 모델보다 우수한 성능을 입증했습니다.
  • 능동 학습 추가를 통해 F1 점수와 AUC가 크게 향상되었습니다.

수동 음향 모니터링(Passive acoustic monitoring)은 생태학적 추론에 큰 잠재력을 가지고 있지만, 기존의 자동화 도구들은 일반적으로 좁게 학습되었고 전이성이 부족합니다. 우리는 이러한 한계점에 대응하여 PULSE라는 준지도(semi-supervised), 다중 작업 프레임워크를 오르토프테라(Orthoptera) 생체음향학에 적용했습니다. 이 프레임워크는 약지도 종 분류(weakly-supervised species classification), 레이블이 없는 현장 음성 데이터에 대한 자기 지도 학습(self-supervised learning), 그리고 범용 생체음향 모델로부터의 지식 증류(knowledge distillation)를 결합합니다. 우리의 도메인 적응형 전문 모델은 모든 지표에서 최첨단 일반 모델을 능가하는 성능을 보였습니다 (macro F1: 0.21 vs. 0.07; AUC: 0.74 vs. 0.45; AP: 0.32 vs. 0.19). 여기에 능동 학습(active learning)을 추가하자 F1은 0.34로, AUC는 0.84로 더욱 향상되었습니다. 분류를 넘어, 학습된 임베딩(embeddings)은 생태학적으로 의미 있는 구조를 인코딩하며, 이는 생태학적 발견을 위한 대화형 시각화 도구를 통해 노출됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0