본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 07:24

로봇의 생체 신호 감지를 위한 조명 변화에 강건한 카메라 기반 심박수 추정

요약

조명 변화가 심한 환경에서도 로봇이 비접촉식으로 심박수를 정확히 측정할 수 있는 새로운 시공간 트랜스포머 프레임워크를 제안합니다. 3D 얼굴 정렬과 조명 증강 기술을 통해 기존 모델 대비 심박수 오차를 93.6% 감소시키는 성과를 거두었습니다.

핵심 포인트

  • 조명 변화에 강건한 rPPG 기반 비접촉식 심박수 추정 기술 제안
  • PRNet 기반 3D 얼굴 정렬 및 클립 수준 조명 증강 기술 통합
  • 심박수 MAE를 기존 대비 93.6% 감소시키며 높은 정확도 달성
  • 시공간 트랜스포머와 하이브리드 시간-주파수 감독 방식 활용

일상적인 환경에서 인간과 상호작용하는 서비스, 사회적 및 보조 로봇에게 생체 인식(Physiological awareness)은 매우 중요합니다. 원격 광혈류 측정(rPPG, Remote photoplethysmography)은 RGB 카메라를 통해 비접촉식 심박수(HR, Heart-Rate) 추정을 가능하게 하며, 이는 로봇 탑재 비전 시스템을 위한 유망한 감지 양식(Sensing modality)이 됩니다. 그러나 조명 변화(Illumination variation)는 강건한 배포를 가로막는 주요 장벽으로 남아 있습니다. 본 논문은 다양한 조명 조건이 포함된 새로운 데이터셋을 활용하여 원격 심박수 추정을 수행하는 엔드 투 엔드(End-to-end) 시공간 트랜스포머(Spatial-temporal transformer) 프레임워크를 제시합니다. 우리의 추정기(Estimator)는 PRNet 기반의 3D 얼굴 정렬(3D face alignment), 클립 수준의 조명 증강(Clip-level illumination augmentation), 잔차 시간 표준화 모듈(Residual Temporal Standardization Module), 그리고 제어된 하이브리드 시간-주파수 감독(Controlled hybrid temporal-frequency supervision)을 통합합니다. 학습 목표는 Soft-Shifted Pearson 파형 손실(Waveform loss)과 스펙트럼 Kullback-Leibler 발산 손실(Spectral Kullback-Leibler divergence loss)을 결합하며, 여기서 조정된 가중치($\mathbf\beta$)가 주파수 영역의 심박수 가이드 기여도를 제어합니다. 세 가지 조명 수준을 포함하는 정적 전레벨 혼합 프로토콜(Static all-level mix protocol)에 대한 실험 결과, $\mathbf\beta=5$가 테스트된 베타 설정 중 가장 강력한 결과를 제공함을 보여주었으며, 최적 실행 시 심박수 평균 절대 오차(MAE, Mean Absolute Error) 0.79 bpm 및 심박수 상관관계(HR correlation) 0.982를 달성했습니다. 우리의 데이터셋에서 평가된 PhysFormer 베이스라인과 비교했을 때, 우리의 추정기는 심박수 MAE를 93.6% 감소시키는 동시에 심박수 상관관계를 0.088에서 0.982로 증가시켜, 조명이 변하는 상황에서도 사용 가능하게 만듭니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0