본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 12:07

페르소나 스캐폴딩 기반 적대적 사고 사슬 (Adversarial Chain-of-Thought) VLM 검증을 통한 수동적 건설 현장 안전

요약

본 논문은 건설 현장의 수동적 안전 모니터링 파이프라인을 제시하며, POV 바디캠 및 고정식 카메라 비디오를 처리합니다. 이 시스템은 YOLO11과 SAM 3로 PPE 및 위험 탐지를 수행하고, Qwen3-VL-8B-Instruct에 페르소나 스캐폴딩 기반의 적대적 사고 사슬(adversarial chain-of-thought) 프로토콜을 적용하여 규정 준수 검증 및 환각 제어를 강화합니다. 특히 방법론적 배우 프레임워크를 활용한 3단계 프롬프트 설계는 기존 단일 패스 방식 대비 정밀도를 크게 향상시켰습니다.

핵심 포인트

  • 건설 현장의 안전 모니터링을 위한 비디오 처리 파이프라인을 구축했습니다.
  • YOLO11, SAM 3와 Qwen3-VL-8B-Instruct를 결합하여 다단계 검증 시스템을 구현했습니다.
  • 페르소나 스캐폴딩 기반의 적대적 사고 사슬(adversarial chain-of-thought) 프로토콜이 규정 준수 및 환각 제어에 효과적입니다.
  • 3단계 프롬프트 설계는 단일 패스 방식 대비 정밀도를 12% 향상시키는 주요 기여를 했습니다.
  • OSHA 표준 매핑, REBA 기반 인체공학적 위험 점수 산출 등 실질적인 안전 보고서 생성이 가능합니다.

건설업은 미국에서 여전히 가장 치명적인 산업 분야로, 2023년에는 1,055건의 사망 노동자 부상이 기록되었으며 이 중 대다수는 예방 가능한 사고였습니다. 기존의 모니터링 방식은 비용이 많이 들거나, 실시간 인간 운영자가 필요하거나, 혹은 매우 좁은 범위의 위반 사항만을 다룹니다. 본 논문은 POV(1인칭 시점) 바디캠 및 고정식 벽면 장착 카메라의 비디오를 처리하는 3단계 아키텍처를 통해, 교대 근무 종료 후 수행되는 수동적(passive) 건설 안전 모니터링 파이프라인을 제시합니다: (1) 주요 PPE(개인 보호 장구) 및 위험 탐지를 위해 미세 조정(fine-tuned)된 YOLO11, (2) 세그멘테이션(segmentation) 정교화 및 작업자 중복 제거를 위한 SAM 3, (3) 규정 준수 검증 및 환각(hallucination) 제어를 위해 방법론적 프롬프트와 페르소나 스캐폴딩(persona-scaffolded)이 적용된 3회차 적대적 사고 사슬(adversarial chain-of-thought) 프로토콜을 사용하는 Qwen3-VL-8B-Instruct입니다. 주요 기여점은 3단계 프롬프트 설계에 있습니다: 방법론적 배우(method-actor) 프레임워크를 따르는 전문적인 페르소나 배경 설정은 12개의 비디오로 구성된 Ironsite 개발 코퍼스에 대한 3인의 저자 비공식 검토 결과, 단일 패스 프롬프팅(single-pass prompting) 대비 관찰된 정밀도(precision)를 12% 향상시켰으며, 특히 환각이 발생하기 쉬운 위반 카테고리에서 가장 큰 이득을 보였습니다. 구조적 메시지 격리(Structural message isolation)는 생성기(generator), 판별기(discriminator), 그리고 인간의 관찰 대 자동 탐지 신뢰도에 대한 사전 지식(priors)을 인코딩한 비대칭 규칙에 의해 제어되는 조정 단계(reconciliation pass) 사이의 관찰 독립성을 강제합니다. 이 시스템은 위반 사항을 OSHA(미국 직업안전보건청) 표준에 매핑하고, 포즈 키포인트(pose keypoints)로부터 REBA(Rapid Entire Body Assessment)에서 영감을 얻은 인체공학적 위험 점수를 산출하며, 타임스탬프가 찍힌 증거와 함께 작업자별 안전 보고서를 생성합니다. 향후 재현을 위해 평가 하네스(evaluation harness)가 공개됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0