본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 15:06

보편적인 차트-코드 생성을 위한 정렬된 다중 뷰 스크립트

요약

본 논문은 차트 이미지를 다양한 프로그래밍 언어(Python, R, LaTeX)의 실행 가능한 코드로 변환하는 '차트-코드 생성' 문제를 다룹니다. 기존 방법들이 파이썬에 국한되거나 감독 정보 활용에 미흡했던 한계를 극복하기 위해, 연구진은 정렬된 스크립트를 제공하고 176K개의 차트로 구성된 데이터셋 Chart2NCode를 소개합니다. 또한, LLaVA 기반 아키텍처에 언어 조건부 저랭크 서브스페이스 혼합을 추가한 효율적인 적응 모듈 CharLuMA를 제안하여, 여러 언어에서 일관되고 시각적으로 충실한 코드 생성을 달성했습니다.

핵심 포인트

  • Chart2NCode: Python, R, LaTeX 등 다양한 언어로 정렬된 176K개의 차트-코드 쌍 데이터셋을 제공합니다.
  • CharLuMA: LLaVA 아키텍처를 기반으로 하며, 언어 조건부 저랭크 서브스페이스 혼합을 통해 여러 목표 언어에 효율적으로 적응하는 모델입니다.
  • 다중 언어 지원: 기존의 파이썬 중심적 한계를 넘어, R과 LaTeX까지 포함하여 시각적으로 동등한 출력을 생성할 수 있습니다.
  • 성능 향상: 제안된 CharLuMA는 모든 대상 언어에서 일관된 실행 가능성과 높은 시각적 충실도를 입증하며 강력한 오픈소스 베이스라인을 능가합니다.

차트-코드 생성 (Chart-to-code generation) 은 차트 이미지를 실행 가능한 플롯팅 스크립트로 변환하여 충실한 재현과 편집 가능한 시각화를 가능하게 합니다. 기존 방법들은 대부분 파이썬 중심 (Python-centric) 으로 제한되어 실용적인 사용을 방해하고 있으며, 중요한 감독 정보의 원천을 간과하고 있습니다: 동일한 차트는 서로 다른 플롯팅 언어에서 의미적으로 동등한 스크립트로 표현될 수 있기 때문입니다. 이 공백을 메우기 위해 우리는 메타데이터-템플릿 파이프라인 (metadata-to-template pipeline) 을 통해 렌더링 검증과 인간 품질 검사를 거쳐 구축한, 파이썬 (Python), R, 및 LaTeX 에서 시각적으로 동등한 출력을 렌더링하는 정렬된 스크립트와 176K 개의 차트가 쌍을 이루는 데이터셋인 Chart2NCode 를 소개합니다. LLaVA 스타일 아키텍처를 기반으로 하여, 우리는 모델이 핵심 차트 이해력을 공유하면서도 경량 라우팅 (lightweight routing) 을 통해 목표 언어에 맞게 코드 생성을 전문화할 수 있도록 멀티모달 프로젝터 (multimodal projector) 에 언어 조건부 저랭크 서브스페이스 혼합 (language-conditioned mixture of low-rank subspaces) 을 추가하는 파라미터 효율적 적응 모듈인 CharLuMA 를 제안합니다. 광범위한 실험 결과, 모든 언어에서 일관된 실행 가능성과 시각적 충실도 향상을 보여주며 강력한 오픈소스 베이스라인을 능회하고 전용 시스템과도 경쟁력을 유지했습니다. 추가 분석은 균형 잡힌 다국어 감독이 모든 언어에 이득을 준다는 점과 어댑터가 컴팩트한 공유 코어와 언어별 용량을 할당한다는 점을 밝혔습니다. 코드와 데이터는 https://github.com/Zhihan72/CharLuMA 에서 이용 가능합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0