본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 05. 13:25

Function2Scene: 기능적 명세로부터의 3D 실내 장면 레이아웃 생성

요약

Function2Scene은 단순 객체 배치를 넘어 사용자의 활동과 요구사항을 반영하는 3D 실내 레이아웃 생성 프레임워크입니다. LLM의 맥락 추론과 VLM의 시각적 평가를 결합한 도구 증강 루프를 통해 기능적 제약 조건을 충족하는 정교한 공간을 설계합니다.

핵심 포인트

  • 사용자 페르소나와 활동 기반의 기능적 디자인 제약 조건 도출
  • 17가지 기준의 분류 체계를 통한 공간 및 인체공학적 고려
  • LLM 추론과 VLM 평가를 결합한 도구 증강 체크 및 수정 루프 활용
  • 기존 LLM 기반 방식 대비 높은 기능적 요구사항 충족률 달성

대부분의 텍스트 기반 3D 실내 장면 합성 (3D indoor scene synthesis) 방법들은 공간이 어떻게 사용되는지가 아니라, 어떤 가구가 배치되어야 하는지를 묻는 객체 중심의 프롬프트 (object-centric prompts)로부터 방을 생성합니다. 하지만 실제 인테리어 디자인에서 레이아웃은 거주자의 활동 및 신체적 요구사항과 같이 거주자를 얼마나 잘 지원하는지에 따라 판단됩니다. 우리는 기능적 명세, 즉 누가 방을 사용할 것이며 그곳에서 무엇을 해야 하는지를 설명하는 자연어 디자인 브리프 (design briefs)로부터 3D 실내 레이아웃을 생성하는 프레임워크인 Function2Scene을 소개합니다. 이러한 명세가 주어지면, 우리 시스템은 거주자 페르소나 (occupant personas)와 활동을 분석하고, 공간적, 인체공학적, 활동적 및 환경적 고려 사항을 아우르는 17가지 기준의 분류 체계 (taxonomy)로부터 맞춤형 기능적 디자인 제약 조건 (functional design constraints) 세트를 도출하며, 이러한 제약 조건을 사용하여 레이아웃 생성을 안내합니다. 최종 장면을 직접 생성하기 위해 LLM (Large Language Model)에 의존하는 대신, Function2Scene은 기하학적 측정, LLM 기반의 맥락적 추론 (contextual reasoning), 그리고 VLM (Vision-Language Model) 기반의 시각적 평가를 결합한 도구 증강 체크 및 수정 루프 (tool-augmented check-and-repair loop)를 통해 반복적인 평가와 개선을 수행합니다. 전문적으로 작성된 30개의 인테리어 디자인 사례에 대한 실험 결과, Function2Scene은 최근의 LLM 기반 장면 합성 베이스라인 (baselines)보다 기능적 요구사항을 더 잘 충족하는 레이아웃을 생성하며, 쌍체 비교 (pairwise comparisons)의 94.3%에서 우리 결과가 선호되었습니다. 우리의 연구는 텍스트 기반 실내 장면 합성을 그럴듯한 객체를 배치하는 것에서 인간의 사용을 지원하는 공간을 설계하는 것으로 재정의합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0