Trier Social Stress Test에서의 음성을 통한 스트레스 자동 탐지
요약
Trier Social Stress Test(TSST) 데이터를 활용하여 음성에서 스트레스를 자동으로 탐지하는 연구를 소개합니다. 머신러닝 모델과 화자 분할 기술을 통해 스트레스 상황을 구분하고 생리적·정서적 반응을 예측하는 파이프라인을 제안합니다.
핵심 포인트
- 음성 데이터를 통한 비침습적 스트레스 탐지 방법론 제시
- 머신러닝 기반의 스트레스 상황 및 정서적 반응 예측
- 음향-운율적 특징을 통한 생리적 스트레스 반응 예측 가능성 입증
- 특징 중요도 분석을 통한 핵심 예측 변수 식별
음성에서 스트레스를 자동으로 탐지하는 것은 행동 연구(behavioral research) 또는 임상 평가(clinical assessment)와 관련된 통찰을 얻을 수 있는 비침습적인(unobtrusive) 방법을 제공합니다. 본 연구는 스트레스 상황과 비스트레스 상황을 자동으로 구분하고, 생리적(physiological) 및 정서적(affective) 스트레스 반응을 예측하는 것을 조사합니다. 음성 데이터는 Trier Social Stress Test (TSST)를 완료하거나 비스트레스 대조군 조건을 수행한 50명의 참가자로부터 수집되었습니다. 화자 분할(speaker diarization)과 머신러닝 (machine learning) 모델을 포함하는 처리 파이프라인(processing pipeline)을 통해, 우리는 평균 기준치(mean baseline)를 크게 상회하는 스트레스 탐지 성능을 달성했습니다. 또한, 관련 생리적 및 정서적 스트레스 반응은 음향-운율적(acoustic-prosodic) 특징으로부터 부분적으로 예측 가능했습니다. 특징 중요도(Feature-importance) 분석을 통해 모델 성능에 기여하는 가장 정보력이 높은 예측 변수들을 식별했습니다. 이러한 연구 결과는 음성이 인간 스트레스 반응의 다차원적인 측면을 나타내는 의미 있고 비침습적인 지표 역할을 할 수 있음을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기