UAV 이미지를 고려하여 LLM 에이전트로 최적화된 새로운 YOLO26-MoE 기반 애자 결함 탐지
요약
UAV 영상을 활용한 전력선 애자 결함 탐지를 위해 YOLO26의 고해상도 분기에 Sparse Mixture-of-Experts(MoE) 모듈을 결합한 YOLO26-MoE 아키텍처를 제안합니다. 이 모델은 LLM 에이전트를 활용하여 하이퍼파라미터 최적화를 수행하였으며, 기존 YOLO 모델들을 능가하는 높은 mAP 성능을 달성했습니다.
핵심 포인트
- YOLO26의 고해상도 분기에 Sparse MoE 모듈을 통합하여 미세하고 다양한 결함 패턴에 대한 적응형 특징 정제 구현
- LLM 에이전트를 활용한 하이퍼파라미터 최적화 및 학습 프로세스 자동화
- 0.9900 mAP@0.5 및 0.9515 mAP@0.5:0.95를 기록하며 최신 YOLO 모델 대비 우수한 성능 입증
- UAV 기반의 복잡한 배경 및 다양한 촬영 조건에서도 신뢰할 수 있는 결함 탐지 솔루션 제공
전력선 애자(insulator) 점검은 그리드(grid)의 신뢰성을 보장하고, 손상되거나 저하된 절연 부품으로 인한 고장을 방지하는 데 필수적입니다. 최근 몇 년 동안 무인 항공기(UAV)와 딥러닝(deep learning) 기반 비전 시스템의 결합은 이 과정을 자동화하기 위한 효과적인 솔루션으로 부상했습니다. 그러나 작은 결함 영역, 이질적인 결함 패턴, 복잡한 배경 및 다양한 촬영 조건으로 인해 애자 결함 탐지는 여전히 어려운 과제로 남아 있습니다. 이러한 문제를 해결하기 위해, 본 논문은 YOLO26 탐지기의 고해상도 분기(high-resolution branch)에 희소 전문가 혼합(sparse Mixture-of-Experts (MoE)) 모듈을 통합한 새로운 객체 탐지 아키텍처인 최적화된 YOLO26-MoE를 제안합니다. 제안된 수정 사항은 1단계 탐지(one-stage detection) 프레임워크의 효율성을 유지하면서도 미세하고 다양한 결함 패턴에 대한 적응형 특징 정제(adaptive feature refinement)를 가능하게 합니다. 하이퍼파라미터 최적화(Hyperparameter optimization), 최종 학습 및 평가는 도구 보강형 대규모 언어 모델(Large Language Model (LLM)) 에이전트를 통해 조정되었습니다. 제안된 모델은 0.9900 mAP@0.5 및 0.9515 mAP@0.5:0.95를 달성하여 최신 YOLO 버전들을 능가했습니다. 이러한 결과는 제안된 모델이 UAV 기반 애자 결함 탐지를 위한 효과적이고 신뢰할 수 있는 솔루션을 제공함을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기