VectorArk: 둥근 다각형 표현을 이용한 실용적인 이미지 벡터화 학습
요약
VectorArk는 실제 환경의 이미지에서도 견고한 벡터화를 수행하는 새로운 VLM 기반 모델입니다. 둥근 다각형 표현 방식을 통해 시각적으로 매끄러운 프리미티브를 생성하며, 열화 모델을 도입하여 다양한 입력값에 대한 일반화 성능을 높였습니다.
핵심 포인트
- 실제 환경 이미지에 특화된 VLM 기반 벡터화 모델 제안
- 둥근 다각형 표현을 통한 시각적 완성도 향상
- 열화 모델을 통한 다양한 입력 데이터에 대한 견고함 확보
- 기존 방식 대비 우수한 기하학적 완전성 및 아티팩트 억제
최근 시각-언어 모델 (VLM) 기반의 접근 방식들은 이미지 벡터화 (Image Vectorization) 작업에서 인상적인 결과를 달성했습니다. 하지만 이러한 방식들은 일반적으로 깨끗한 SVG를 고해상도로 래스터화 (Rasterized)한 후 다시 벡터화하는 합성 벤치마크 (Synthetic Benchmarks)에서 평가됩니다. 그 결과, 이러한 방법들은 알려지지 않은 래스터화 방식을 사용한 이미지나 텍스트-투-이미지 (Text-to-image) 모델에 의해 생성된 이미지와 같은 실제 환경 (Real-world scenarios)에는 일반화가 잘 되지 않습니다. 우리는 견고하고 실용적인 이미지 벡터화를 위해 설계된 새로운 VLM 기반 모델인 VectorArk를 소개합니다. VectorArk는 학습 과정을 단순화하면서도 자연스럽게 매끄럽고 시각적으로 매력적인 프리미티브 (Primitives)를 생성하는 새로운 둥근 다각형 (Rounded polygon) 표현 방식을 채택합니다. 또한 우리는 다양하고 불완전한 입력값에 대해 견고함을 향상시키는 열화 모델 (Degradation model)을 제안합니다. 우리의 실험 결과에 따르면, 이전 방법들과 대조적으로 VectorArk는 여러 데이터셋에 걸쳐 우수한 기하학적 완전성 (Geometric completeness)과 아티팩트 억제 (Artifact suppression)를 달성하였으며, 종합적인 어블레이션 (Ablations) 연구를 통해 각 구성 요소의 기여도를 검증하였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기