본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 11. 19:14

호흡음 분류를 위한 품질 적응형 각도 마진 학습

요약

본 논문은 클래스 내 응집성과 클래스 간 분리성을 강화하는 품질 적응형 각도 마진 학습 프레임워크 QLung을 제안합니다. 이 프레임워크는 오디오 녹음 품질에 따라 각도 마진을 동적으로 조정하며, 특히 아웃-오브-디스트리뷰션(OOD) 환경에서 뛰어난 성능을 입증했습니다.

핵심 포인트

  • QLung은 응집성 및 분리성을 강화하는 적응형 각도 마진 학습 프레임워크입니다.
  • 녹음 품질에 따른 비참조 오디오 품질 마진을 도입하여 일반화 성능을 높였습니다.
  • ICBHI 데이터셋에서 2.46%의 인-분포 성능 향상을 보였습니다.
  • SPRSound 데이터셋에서 기존 SOTA 대비 가장 강력한 OOD 성능을 달성했습니다.

우리는 클래스 내 응집성(intra-class compactness)과 클래스 간 분리성(inter-class separability)을 강제하여 특징 일반화 성능을 향상시키는 품질 적응형 각도 마진 학습 프레임워크를 제시합니다. QLung이라 명명된 저희 프레임워크는 스펙트럼 엔트로피와 제곱평균제곱근 에너지로부터 파생된 비참조(no-reference) 오디오 품질 마진을 도입하여, 녹음 품질에 따라 각도 마진을 적응적으로 조정합니다. 이를 위해 심각한 클래스 불균형 상황에서도 학습을 안정화시키는 로그 스케일링된 각도 마진을 제안합니다. 또한 특징과 클래스 가중치를 정규화하는 각도 분류기(angular classifier)를 사용하여, 마진 페널티가 단위 초구(unit hypersphere) 상에 일관되게 적용되도록 합니다. 저희 접근 방식은 ICBHI 데이터셋에서 크로스 엔트로피 기준선 대비 2.46%의 인-분포 성능 향상을 보였으며, 가장 중요한 점은 SPRSound 데이터셋에서 기존 최첨단 방법들보다 가장 강력한 아웃-오브-디스트리뷰션(out-of-distribution) 성능을 달성했다는 것입니다. 코드는 https://github.com/RSC-Toolkit/QLung에서 이용 가능합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0