본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 30. 14:13

Arko-T: 텍스트 기반 구조화된 3D 생성을 위한 파운데이션 모델 (Foundation Model)

요약

Arko-T는 자연어 의도를 편집 가능한 파라메트릭 CAD 프로그램으로 변환하는 4B 규모의 텍스트-to-설계 파운데이션 모델입니다. 단순 형상 생성을 넘어 설계 상태, 파라미터, 구성 로직을 보존하며 벤치마크에서 프런티어 LLM에 필적하는 성능을 입증했습니다.

핵심 포인트

  • 텍스트를 실행 가능한 파라메트릭 CAD 코드로 직접 매핑
  • 데이터 큐레이션 및 실행 기반 감독을 통한 설계 로직 보존
  • 프런티어 LLM 대비 약 1/10의 비용으로 높은 벤치마크 성능 달성
  • 타겟팅된 설계 수준 학습의 효율성 증명

텍스트-to-3D (Text-to-3D) 시스템은 이제 단 한 문장으로 기계 부품을 합성할 수 있지만, 그 결과물은 렌더링을 위한 형상일 뿐 편집 가능한 설계(design)는 아닙니다. 우리는 자연어 의도를 실행 가능한 파라메트릭 CAD (parametric CAD) 프로그램으로 직접 매핑하는 4B 파라미터 규모의 텍스트-to-설계 (text-to-design) 모델인 Arko-T를 선보입니다. Arko-T는 단순히 코드의 실행 가능성만을 최적화하는 대신, 데이터 큐레이션 (data curation), 코드 정규화 (code normalization), 그리고 실행 기반 감독 (execution-grounded supervision)의 모든 단계가 설계 상태 (design state)라는 공식적인 개념에 정렬되도록 하여, CAD 결과물을 편집 가능하게 만드는 특징, 파라미터 (parameters), 그리고 구성 로직 (construction logic)을 보존하도록 합니다. 12개의 지표에 걸쳐 7개의 프런티어 LLM (frontier LLMs)과 벤치마크를 수행한 결과, Arko-T는 벤치마크당 비용이 약 10분의 1 수준임에도 불구하고 8개 지표에서 최고 점수를 기록했으며, 3개 지표에서 두 번째로 높은 점수를 기록했습니다. 이러한 결과는 적절한 규모의 타겟팅된 설계 수준 학습 (design-level training)이 구조화된 CAD 생성 분야에서 프런티어 범용 모델 (frontier general-purpose models)과 대등한 성능을 낼 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0