arXiv논문2026. 05. 01. 13:13

시각 재교정 및 엔티티 재구성을 통한 훈련 불요 터널 결함 검사 및 공학적 해석

요약

본 논문은 터널 검사 분야의 어려움을 해결하기 위해 'TunnelMIND'라는 훈련 불요(training-free) 프레임워크를 제안합니다. 기존 모델들이 제공하는 거친 결함 제안을 넘어, TunnelMIND는 시각적 일관성 재교정 과정을 통해 신뢰도 높은 결함 위치 정보를 얻습니다. 최종적으로 이 정보는 범주, 위치, 기하학 등 구조화된 엔티티로 재구성되어 공학 보고서 작성 및 전문가 검색 기반 설명에 활용될 수 있습니다.

핵심 포인트

TunnelMIND는 터널 검사를 위한 훈련 불요(training-free) 프레임워크를 제시합니다.
기존 모델의 한계였던 거친 결함 제안을 시각적 일관성 재교정으로 개선하여 신뢰도를 높였습니다.
결함 마스크는 단순한 출력을 넘어, 범주, 위치, 기하학 등 구조화된 엔티티로 재구성됩니다.
이러한 구조화된 증거는 공학자가 읽을 수 있는 보고서 생성 및 검색 기반 설명에 직접 활용될 수 있습니다.

터널 검사는 결함 위치 파악, 측정, 중도 등급 분류, 그리고 공학 문서화를 지원할 수 있는 출력을 필요로 합니다. 기존 훈련 불요 (training-free) 기반 모델 파이프라인은 대개 거친 오픈보카бу러리 제안 (coarse open-vocabulary proposals) 에서 멈추는데, 이는 간섭이 심한 터널 장면에서 직접 사용하기 어렵습니다. 우리는 TunnelMIND 라는 훈련 불요 프레임워크를 제안합니다. 구체적으로, 언어에 의한 결함 제안은 최종 출력으로 취급되지 않으며, 대신 추론 시점에 밀도 높은 시각적 일관성 (dense visual consistency) 을 통해 그 공간적 지지가 재교정됩니다. 이를 통해 터널 특유의 어려운 음영 (hard negatives) 하에서 거친 의미 앵커는 더 신뢰할 수 있는 프롬프트로 변환될 수 있습니다. 생성된 마스크는 이후 범주, 위치, 기하학, 중도, 컨텍스트 속성을 갖는 구조화된 결함 엔티티로 재구성되며, 이는 전문가 지식 제약 하에서 검색 기반 설명 (retrieval-grounded explanation) 과 공학자가 읽을 수 있는 보고서 생성으로 매핑됩니다. 가시광선, GPR, 도로 결함 작업에서 TunnelMIND 는 각각 0.68, 0.78, 0.72 의 F1 점수를 달성했습니다. 전반적으로 TunnelMIND 는 훈련 불요 터널 검사가 거친 위치 파악을 넘어 공학 평가를 위한 구조화된 결함 증거로 나아갈 수 있음을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

시각 재교정 및 엔티티 재구성을 통한 훈련 불요 터널 결함 검사 및 공학적 해석

요약

핵심 포인트

댓글