본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 10:55

PaintCopilot: 자율적 예술적 지속으로서의 회화를 모델링하기

요약

PaintCopilot은 목표 이미지를 미리 설정하는 대신, 캔버스의 상태와 이전 붓터치 이력을 바탕으로 다음 붓터치를 예측하는 자기회귀 방식의 공동 창작 페인팅 어시스턴트입니다. ViT 기반의 Target Predictor, Flow Matching 기반의 Next Stroke Predictor, VAE 기반의 Region Sampler라는 세 가지 모델을 통해 예술적 역학을 학습하고 구현합니다. 이를 통해 예술가와 AI가 창작 과정에서 제어권을 유연하게 주고받으며 협업할 수 있는 워크플로우를 제공합니다.

핵심 포인트

  • 기존의 픽셀 재구성 방식에서 벗어나 LLM과 유사한 자기회귀적 예술적 행동 모델링 도입
  • Target Predictor, Next Stroke Predictor, Region Sampler로 구성된 세 가지 상호 보완적 모델 프레임워크
  • Flow Matching 기술을 활용하여 시간적으로 일관된 붓터치 생성 가능
  • Optimize History, Stroke Completion 등 네 가지 상호작용 워크플로우 지원
  • 예술가와 AI 간의 지속적이고 유연한 제어권 교대를 통한 공동 창작 환경 구축

우리는 목표 이미지를 요구하지 않고, 진화하는 캔버스 상태와 이전 붓터치 이력(brushstroke history)을 조건으로 하여 회화를 개방형 자기회귀(autoregressive) 예술적 행동으로 모델링하는 공동 창작 신경망 페인팅 어시스턴트인 PaintCopilot을 선보입니다. 회화를 미리 정의된 참조를 향한 픽셀 재구성(pixel reconstruction)으로 프레임화하는 기존의 신경망 페인팅 방식과 달리, PaintCopilot은 대규모 언어 모델(Large Language Models, LLM)이 이전 문맥으로부터 텍스트 시퀀스를 이어가는 것과 유사하게, 학습된 예술적 역학(artistic dynamics)으로부터 미래의 붓터치를 직접 예측합니다. 이 프레임워크는 세 가지 상호 보완적인 모델을 제안합니다: 부분적인 캔버스 관찰로부터 예술가의 의도를 추론하는 ViT 기반의 Target Predictor, Flow Matching을 통해 시간적으로 일관된 붓터치를 생성하는 자기회귀 방식의 Next Stroke Predictor, 그리고 필요에 따라 의미론적으로 국소화된 붓터치 시퀀스를 합성하는 VAE 기반의 Region Sampler입니다. 세 가지 미분 가능한 붓 표현(Hard Round, Brush Tip, 2D Gaussian)을 기반으로 구축된 이 시스템은 Optimize History, Stroke Completion, Region Inpainting, Dynamic Brush의 네 가지 상호작용 워크플로우를 지원합니다. 전문 예술가들과의 사례 연구를 통해, 우리는 PaintCopilot이 예술가와 AI가 창작 과정 전반에 걸쳐 지속적으로 제어권을 교대하며 유연한 공동 창작 페인팅 워크플로우를 가능하게 함을 입증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0