식량-물 넥서스(Food-Water Nexus)를 위한 휴경지 탐지용 Prithvi-EO 적응: 지리공간 파운데이션 모델(Geospatial
요약
지리공간 파운데이션 모델인 Prithvi-EO를 활용하여 휴경지를 정밀하게 탐지하는 새로운 연구를 소개합니다. PEFT 방식과 ViT-Adapter를 결합하여 계산 효율성을 높이면서도 다중 스케일 특징 추출 성능을 극대화했습니다.
핵심 포인트
- Prithvi-EO 모델의 단일 스케일 한계를 극복하기 위한 PEFT 및 어댑터 설계
- Lite ViT-Adapter와 DIoU 손실 함수를 결합하여 mAP@50 0.9479 달성
- 기존 앵커 기반 방식 대비 최대 25.70%의 성능 향상 입증
- 경량화된 공간 사전 정보 융합을 통한 국부적 휴경 패턴 포착 최적화
휴경(fallowing)이 윤작 및 수자원 보존에서 수행하는 역할을 고려할 때, 휴경지의 공간적 분포를 이해하는 것은 식량-물(Food-Water, FW) 넥서스를 최적화하는 데 중요합니다. 휴경지는 USDA 경작지 데이터 레이어(Cropland Data Layer, CDL)에서 정확도가 낮은 클래스입니다. 지리공간 파운데이션 모델(Geospatial Foundation Model, GFM)인 Prithvi-EO는 컴퓨터 비전 작업 전반에 걸쳐 강력한 전이 가능성을 보여주었습니다. 그러나 이 모델의 Vision Transformer (ViT) 백본은 단일 공간 스케일에서 특징(feature)을 생성하며, 이는 객체 탐지 헤드(object detection heads)에 필요한 다중 스케일 특징(multi-scale features)에 적합하지 않습니다. 기존 방식들은 단일 스트라이드 토큰(single stride tokens)의 스케일링을 통해 다중 스케일 피라미드를 합성하여 공간적 이질성(spatial heterogeneity)을 희생하며, 전체 백본 미세 조정(full backbone fine-tuning)은 GFM에 있어 계산 비용이 매우 높습니다. 우리는 두 가지 매개변수 효율적 미세 조정(Parameter-Efficient Fine-Tuning, PEFT) 방식인 저차원 적응(Low-Rank Adaptation, LoRA)과 하이브리드 PEFT를 결합하고, 세 가지 넥(neck) 설계인 pseudo multi-scale, Lite ViT-Adapter, Full ViT-Adapter를 결합한 휴경지 탐지 파이프라인을 평가합니다. 우리의 최적 구성인 one-stage head를 결합한 Lite ViT-Adapter는 DIoU 손실(loss)을 사용하여 mAP@50 0.9479를 달성하였으며, 이는 불규칙한 휴경지 탐지를 위한 중심 인식 지역화(center-aware localization)의 효과를 시사합니다. LoRA를 적용한 ViT-Adapter 기반의 free one-stage 탐지는 어댑터가 없는 앵커 기반(anchor-based) 방식보다 6.42% 향상되었으며, 최적 구성은 베이스라인인 어댑터 없는 앵커 기반 방식을 25.70% 향상시켰습니다. 이러한 결과는 경량화된 공간 사전 정보 융합(spatial prior fusion)과 선택적 백본 해제(selective backbone unfreezing)를 통해 Prithvi-EO가 국부적인 휴경 패턴을 더 효과적으로 포착할 수 있음을 입증하며, 재구성된 단일 스트라이드 ViT 토큰에 의존하는 방식보다 우수한 성능을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기