본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 17:42

SEMIR: 그래프 기반 시각 분할을 위한 의미론적 미세 구조 유도 표현 학습

요약

SEMIR(Semantic Minor-Induced Representation Learning)은 대규모 이미지에서 작고 희소한 구조체를 분할하는 문제를 해결하기 위해 고안된 새로운 표현 학습 프레임워크입니다. 이 프레임워크는 기본 격자 그래프에 의존하지 않고, 작업 적응형이며 위상 보존적인 잠재 그래프 표현을 학습하여 복잡한 시각 데이터를 간결하게 변환합니다. BraTS 2021, KiTS23, LiTS와 같은 종양 분할 데이터셋에서 SEMIR는 실용적인 구동 시간 내에 소수 구조체의 Dice 점수를 크게 향상시키는 성능을 입증했습니다.

핵심 포인트

  • SEMIR은 대규모 이미지의 희소하고 작은 구조체 분할 문제를 해결하는 새로운 표현 학습 프레임워크이다.
  • 기존 방법론이 겪는 격자 제한 및 클래스 불균형 문제를 극복하기 위해, SEMIR은 기본 그리드에서 추론을 분리한다.
  • SEMIR는 작업에 적응하고 위상 보존적인 잠재 그래프 표현을 학습하여 복잡한 구조를 간결하게 변환하는 것이 핵심이다.
  • BraTS 2021, KiTS23, LiTS와 같은 종양 분할 데이터셋에서 높은 성능과 실용적인 구동 시간을 동시에 달성했다.

대규모 이미지에서 작고 희소한 구조를 분할하는 것은 근본적으로 복셀(voxel)-레벨의 격자 제한 계산과 극심한 클래스 불균형에 의해 제약됩니다. 밀집된 풀 해상도 추론은 성능이 떨어지기 때문에 대부분의 파이프라인은 고정된 영역화(regionization)나 다운샘플링에 의존하게 되며, 이는 계산 비용을 이미지 해상도에 연결하고 소수 구조가 가장 유용한 경계 증거를 약화시킵니다. 우리는 추론을 기본 격자에서 분리하는 표현 프레임워크인 SEMIR (Semantic Minor-Induced Representation Learning)을 소개합니다. 이 프레임워크는 정확한 디코딩(decoding)을 통해 작업에 적응하고 위상 보존적인 잠재 그래프 표현을 학습함으로써, 근본적인 그리드 그래프를 간결한 형태로 변환합니다.

우리는 구조적 변동성과 분포 불확실성이 높은 타겟을 가진 세 가지 종양 분할 데이터셋인 BraTS 2021, KiTS23, 그리고 LiTS에서 SEMIR의 성능을 검증했습니다. 그 결과, SEMIR는 실용적인 구동 시간(runtime)에서 소수 구조체(minority-structure) Dice 점수의 일관된 향상을 보였습니다. 더 나아가, SEMIR는 고해상도 구조적 시각 데이터에 대해 작업 적응형(task-adapted), 위상 보존적 잠재 표현을 정확하게 디코딩할 수 있는 프레임워크를 구축합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0