카메라 트랩 AI의 민주화: 영국 포유류 탐지를 위한 오픈 소스 모델
요약
영국 포유류 및 조류 탐지를 위한 31개 클래스의 오픈 소스 객체 탐지 모델을 공개합니다. 48,165개의 라벨링된 데이터를 활용한 YOLO26x 기반 모델로, 높은 mAP와 정밀도를 기록하며 생태학자들의 데이터 활용 장벽을 낮추는 것을 목표로 합니다.
핵심 포인트
- 영국 생태계에 특화된 31개 클래스 오픈 소스 모델 공개
- YOLO26x 기반으로 mAP 0.984(IoU 0.5 기준) 달성
- 비전문가 사용을 위해 ONNX 형식의 가중치 제공
- 상업적 플랫폼의 독점을 방지하고 생태학적 데이터 민주화 추구
카메라 트랩 (Camera traps)은 생물 다양성 모니터링의 초석이 되었지만, 방대한 양의 이미지를 유용한 생태학적 데이터로 변환하는 인공지능 (AI)은 종종 상업적 플랫폼에 갇혀 있거나 영국 제도의 동물상과 일치하지 않는 동물들로 학습되어 있습니다. 장벽을 제거하고 활용도를 높이기 위한 시도로, 우리는 31개 클래스(28종의 흔한 영국 포유류 및 조류 종, 그리고 인간, 보정용 폴, 차량을 위한 유틸리티 클래스 포함)를 위한 오픈 소스 객체 탐지 (Object detection) 모델을 공개합니다. 이 모델은 Conservation AI와 그 후속 모델인 Trap Tracker를 통해 10년 동안의 운영 배치를 거쳐 여러 지역에서 수집된 48,165개의 라벨링된 인스턴스로 구성된 큐레이션된 데이터셋으로부터 추출되었습니다. 80/10/10 클래스 층화 분할 (Class-stratified split) 방식으로 학습 및 테스트된 YOLO26x 탐지기인 이 모델은, 홀드아웃 검증 세트 (Held-out validation set)에서 IoU (Intersection over Union) 0.5 기준 0.984의 mAP (mean Average Precision) (IoU 0.5-0.95 기준 0.956)를 달성하였으며, 정밀도 (Precision) 0.988, 재현율 (Recall) 0.965를 기록했습니다. 학습에 사용되지 않은 홀드아웃 테스트 분할 (Held-out test split)에서는 31개 클래스 전반에 걸쳐 종당 평균 신뢰도 (Mean per-species confidence)가 0.96에서 0.99 사이로 나타났으며, 미검출률 (False-negative rate)은 0.17%로 어려운 야간, 원거리 또는 가려진 이미지에 집중되었습니다. 이러한 지표는 학습과 동일한 사이트 및 카메라 풀의 데이터에서 도출된 것이므로, 완전히 새로운 사이트에서의 성능은 향후 과제로 남겨둡니다. 우리는 머신러닝 (Machine-learning) 경험이 없는 생태학자들을 명확한 대상으로 하여, 로컬 데스크톱 및 실시간 카메라 지원이 가능한 ONNX 형식의 학습된 가중치 (Weights)를 비상업적 라이선스 하에 공개합니다. 이번 출시는 지난 10년 동안 개발된 다수의 유료 모델에 대한 의도적인 대항마입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기