MMVIAD: 산업 이상 감지를 위한 다중 시점 다중 작업 비디오 이해

산업 이상 감지(Industrial anomaly detection)는 제조 품질 관리에서 매우 중요하지만, 기존 데이터셋들은 주로 정적 이미지나 희소한 뷰에 초점을 맞추고 있어 실제 산업 시나리오의 연속적인 검사 과정을 완전히 반영하지 못합니다. 저희는 산업 이상 감지를 위한 최초의 연속 다중 시점 비디오 데이터셋이자 다중 작업 평가를 위한 벤치마크인 MMVIAD (Multi-view Multi-task Video Industrial Anomaly Detection)를 소개합니다. MMVIAD는 약 120도의 카메라 움직임을 가진 객체 중심의 2초 검사 클립으로 구성되어 있으며, 48개 객체 카테고리, 14개 환경, 그리고 6가지 구조적 이상 유형을 다룹니다. 이는 이상 감지(anomaly detection), 결함(defect) 등의 작업을 지원합니다.

MMVIAD-Unseen에서 VISTA는 기본 모델의 네 가지 작업 평균 점수를 45.0점에서 57.5점으로 향상시켜 GPT-5.4를 능가합니다. 소스 코드는 https://github.com/Georgekeepmoving/MMVIAD에서 확인할 수 있습니다.

Insights

MMVIAD: 산업 이상 감지를 위한 다중 시점 다중 작업 비디오 이해

요약

핵심 포인트

댓글

AI를 활용한 의료 기기 소프트웨어 구축은 코딩 문제가 아니라 컴플라이언스(Compliance) 문제입니다

MCP 2026-07-28 사양이 확정되었습니다 - 단 한 번의 명령으로 서버를 점검하세요!

워싱턴의 Anthropic 금지 조치가 이번 달 계약업체들에게 영향을 미칩니다

AI를 활용한 의료 기기 소프트웨어 구축은 코딩 문제가 아니라 컴플라이언스(Compliance) 문제입니다

MCP 2026-07-28 사양이 확정되었습니다 - 단 한 번의 명령으로 서버를 점검하세요!

워싱턴의 Anthropic 금지 조치가 이번 달 계약업체들에게 영향을 미칩니다