본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 08. 13:12

시각적 필사본 특징을 이용한 역사적 필사본의 확률적 연대 측정

요약

본 논문은 시각적 특징만을 사용하여 역사적 필사본 페이지의 연대를 확률적으로 추정하는 접근 방식을 제안합니다. 기존 연구들이 수 세기 단위로 분류하는 것과 달리, 본 모델은 연속적인 연도 축에 걸쳐 증거 기반 딥 회귀 문제(evidential deep regression)를 정의하여 예측 분포 전체를 출력합니다. EfficientNet-B2 백본과 Normal-Inverse-Gamma (NIG) 출력 헤드를 결합한 이 아키텍처는 단일 순방향 패스에서 분해된 우연성 및 인식론적 불확실성을 제공하며, 기존 방법들보다 훨씬 낮은 비용으로 높은 정확도와 최상의 보정 성능(PICP=92.6%)을 달성했습니다.

핵심 포인트

  • 필사본 연대 추정을 연속적인 회귀 문제로 접근하여 세부적인 예측 분포를 얻음.
  • EfficientNet-B2 백본과 NIG 출력 헤드를 사용하여 단일 패스에서 우연성(aleatoric) 및 인식론적(epistemic) 불확실성을 분해함.
  • 제안된 모델은 기존 방법 대비 낮은 추론 비용으로 최고의 보정 성능(PICP=92.6%)을 달성하며, MAE 5.4년의 높은 정확도를 보여줌.
  • 불확실성 분석 결과, 우연성 불확실성이 연대 추정 오차의 주요 예측 변수임을 입증함.
  • 페이지 수준 집계 시 평균 절대 오차(MAE)를 4.5년까지 낮출 수 있음.

우리는 시각적 특징만을 이용하여 역사적 필사본 페이지를 연대 측정하는 확률론적 접근 방식을 도입합니다. 기존 문헌에서처럼 수 세기를 클래스로 집계하는 대신, 우리는 연대 측정을 연속적인 연도 축(continuous year axis)에 대한 증거 기반 심층 회귀 문제(evidential deep regression problem)로 설정하여, 신경망이 단일 순방향 계산(single forward pass)을 통해 분해된 우연성 불확실성(aleatoric uncertainty)과 인식론적 불확실성(epistemic uncertainty)을 갖춘 전체 예측 분포를 출력하도록 합니다. 우리의 아키텍처는 EfficientNet-B2 백본에 Normal-Inverse-Gamma (NIG) 출력 헤드를 결합했으며, 이는 공동 음의 로그 우도 및 증거 정규화 목적 함수(joint negative-log-likelihood and evidence-regularization objective)로 훈련되었습니다. DIVA-HisDB 벤치마크(150 페이지, 중세 코덱스 3종, 151,936 패치)에서 우리의 모델은 테스트 MAE가 5.4년으로 측정되어, 50년의 세기 레이블 지도 감독(century-label supervision granularity)보다 훨씬 낮은 수치를 기록했으며, 패치의 93%가 5년 이내, 97%가 10년 이내에 포함되었습니다. 우리의 접근 방식은 단일 순방향 계산으로 extbf{PICP=92.6%}를 달성하여 비교된 모든 방법 중 최고의 보정(calibration) 성능을 보여주었으며, 이는 MC Dropout (PICP=88.2%, 50회 실행) 및 Deep Ensembles (PICP=79.7%, 5개 모델)보다 $5 imes$ 낮은 추론 비용으로 우수합니다. 불확실성 분해는 우연성 불확실성이 연대 측정 오차의 강력한 예측 변수(Spearman $
ho$=0.729)임을 보여주며, 가장 확실한 상위 20% 패치에 대한 선택적 예측만으로 extbf{0.5년 MAE}를 제공할 수 있습니다. 또한, 이미지 열화가 악화됨에 따라 예측된 불확실성이 증가하는 것을 보였고, 공간 분해 지도(spatial decomposition maps)는 어떤 필기 영역이 우연성 불확실성을 유발하는지 설명하며, 페이지 수준 집계(page-level aggregation)를 통해 MAE를 4.5년으로 줄이고 불확실성과 페이지 수준 오차 간에 $
ho$=0.905의 상관관계를 보였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0