Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.GR (Graphics) 69건필터 해제
PolycubeNet: Polycube 기반 육면체 메쉬 생성을 위한 이중 잠재 확산 모델 (Dual-latent Diffusion Model)
PolycubeNet은 복잡한 CAD 기하학적 구조로부터 육면체 메쉬를 자동으로 생성하기 위해 제안된 이중 잠재 확산 모델(Dual-latent Diffusion Model) 기반의 프레임워크입니다. 기존 방식의 한계인 복잡한 표면 분할 과정 없이, 저차원 잠재 공간을 활용하여 계산 효율성을 높이면서도 고품질의 polycube 구조를 생성합니다. 실험을 통해 임의의 종수를 가진 복잡한 모델에서도 견고하고 빠른 생성 성능을 입증하였습니다.
PiG-Avatar: 계층적 Neural-Field 가이드 Gaussian Avatar
PiG-Avatar는 기존 Gaussian avatar 방식이 가진 신체 템플릿 의존적 기하학 제약을 해결하기 위해 제안된 새로운 방법론입니다. 파라메트릭 신체 모델을 운동학적 전달 용도로만 제한하고, avatar를 연속적인 neural field로 제어되는 볼륨형 정준 공간의 Gaussians로 표현하여 복잡한 의류와 비강체 움직임을 정교하게 캡처합니다. 이를 통해 고충실도의 렌더링 품질과 실시간 성능을 동시에 달성했습니다.
TelePhysics: 단일 이미지로부터 실시간 상호작용이 가능한 물리 기반 다중 객체 장면 생성
TelePhysics는 단일 이미지로부터 물리적으로 일관되고 제어 가능한 다중 객체 장면을 생성하는 training-free 프레임워크입니다. 통합된 공간 좌표계를 통해 객체 간의 침투 및 정렬 문제를 해결하며, 시뮬레이션과 렌더링을 분리하여 실시간 물리 상호작용과 높은 시각적 충실도를 동시에 달성합니다.
HyperBones: Hypernetwork Conditioning을 이용한 실시간 뼈 기반 신경 의상 시뮬레이션
HyperBones는 실시간 의상 시뮬레이션을 위해 Hypernetwork Conditioning을 활용하는 새로운 신경망 기반 접근 방식을 제안합니다. 가상 뼈를 이용한 거친 수준의 움직임과 합성곱 신경 맵을 통한 미세한 주름 복원을 결합하여, 물리적으로 타당하면서도 매우 빠른 성능을 구현합니다. 일반 GPU에서 300 FPS 이상의 속도로 실행되어 대화형 애플리케이션에 최적화되어 있습니다.
PaintCopilot: 자율적 예술적 지속으로서의 회화를 모델링하기
PaintCopilot은 목표 이미지를 미리 설정하는 대신, 캔버스의 상태와 이전 붓터치 이력을 바탕으로 다음 붓터치를 예측하는 자기회귀 방식의 공동 창작 페인팅 어시스턴트입니다. ViT 기반의 Target Predictor, Flow Matching 기반의 Next Stroke Predictor, VAE 기반의 Region Sampler라는 세 가지 모델을 통해 예술적 역학을 학습하고 구현합니다. 이를 통해 예술가와 AI가 창작 과정에서 제어권을 유연하게 주고받으며 협업할 수 있는 워크플로우를 제공합니다.
ROAR-3D: 고충실도 3D 생성을 위한 임의 시점 라우팅 (Routing Arbitrary Views for High-Fidelity 3D
ROAR-3D는 단일 이미지 기반 3D 생성 모델의 한계를 극복하기 위해, 포즈 정보가 없는 임의의 다중 시점 이미지를 수용할 수 있는 경량 방법론입니다. 토큰 단위 뷰 라우터와 이중 스트림 어텐션 설계를 통해 방향 제어와 기하학적 전이 간의 충돌을 해결하며, 최소한의 파라미터 추가만으로 고품질의 3D 생성을 구현합니다.
AnyAct: 비디오로부터 캐릭터 동작을 활용한 인간 재연(Human Reenactment)을 향하여
AnyAct는 비인간 캐릭터의 단안 비디오에서 동작을 추출하여 인간의 퍼포먼스로 재해석하는 새로운 인간 재연(Human Reenactment) 기술을 제안합니다. 기존 방식의 한계를 극복하기 위해 희소한 국소 2D 관절 동작을 활용하여 캐릭터의 역학을 보존하면서도 편집 가능한 인간 동작을 생성합니다. 이를 위해 3D-to-2D 투영 감독, 점진적 학습, 전역-국소 동작 디커플링이라는 세 가지 핵심 설계를 도입했습니다.
HL-OutPaint: 고해상도 장기 비디오를 위한 Coarse-to-Fine 비디오 아웃페인팅 (Video Outpainting)
HL-OutPaint는 고해상도 장기 비디오 아웃페인팅을 위한 새로운 프레임워크입니다. 이 프레임워크는 2단계의 coarse-to-fine 전략을 사용하여, 먼저 전역적 구조와 움직임을 포착하는 Global Coarse Guidance (GCG)를 구축합니다. 이후 GCG가 제공하는 안내를 받아 공간적으로 상세하고 시간적으로 일관된 고해상도 아웃페인팅을 수행함으로써, 긴 비디오 시퀀스에 대한 안정적인 대규모 공간 외삽을 가능하게 합니다.
PiG-Avatar: 계층적 신경장(Neural-Field) 가이드 기반 가우시안 아바타
PiG-Avatar는 기존 가우시안 아바타 방식이 가진 신체 템플릿 의존성 문제를 해결하기 위해 연속적인 신경장(Neural-Field) 가이드 기반의 볼륨형 정준 공간을 제안합니다. 이를 통해 의류나 신체 외부 요소와 같은 복잡한 비강체 기하 구조를 템플릿의 제약 없이 정교하게 캡처하며, 실시간 렌더링과 높은 재구성 품질을 동시에 달성합니다.
GLUT: 연속적 색상 변환을 위한 3D 가우시안 룩업 테이블 (3D Gaussian Lookup Table)
GLUT는 3D 가우시안 프리미티브를 사용하여 색상 변환을 모델링하는 연속적이고 명시적인 색상 표현 방식입니다. 기존 그리드 기반 LUT의 메모리 문제와 암시적 신경 표현의 해석 가능성 문제를 동시에 해결하며, 컴팩트한 메모리 사용량과 유연한 표현력을 제공합니다. 또한 조건부 생성기(CGLUT)를 통해 매끄러운 스타일 블렌딩과 국소적인 색상 편집을 지원합니다.
WorldParticle: Transformer를 통한 라그랑주 입자 역학 (Lagrangian Particle Dynamics)의 통합
WorldParticle은 단일 Transformer 아키텍처를 사용하여 천, 유체, 고체 등 다양한 물리 현상을 통합적으로 모델링하는 학습 기반 입자 시뮬레이터입니다. 예측-수정(prediction-correction) 설계를 통해 입자 간 상호작용을 정밀하게 예측하며, 슈퍼 토큰(super token) 기술을 활용해 계산 효율성을 높였습니다. 이 모델은 학습되지 않은 재료나 경계 조건에서도 뛰어난 일반화 성능을 보여줍니다.
대규모 및 다중 스케일 미세구조의 생성적 및 등매개변수 기하학적 모델링
적층 제조 기술의 발전에 따라 대규모 영역과 미세한 기하학적 특징을 동시에 표현해야 하는 모델링 과제를 해결하기 위한 새로운 방법을 제안합니다. ExVCC라는 확장된 볼륨 Catmull-Clark 스플라인 표현 방식과 형상 코딩 체계를 통해, 모든 세부 사항을 미리 생성하지 않고 필요할 때만 생성하는 온디맨드 방식을 도입했습니다. 또한 등매개변수 표현 방식을 통해 스케일 간의 기하학적 연관성을 유지하고 수정 사항이 자동으로 전파되도록 설계되었습니다.
곡면 기하학을 위한 공간 가속 와인딩 넘버 (Spatially Accelerated Winding Numbers)
본 연구는 NURBS 곡선 및 패치와 같은 곡면 기하학에서 일반화된 와인딩 넘버(GWN)를 빠르고 정확하게 계산하는 새로운 방법을 제안합니다. 기존의 공간 인덱스 기반 근사 방식이 이산적 데이터에 국한되었던 한계를 극복하기 위해, BVH와 적응형 세분화 전략을 결합하여 경계 근처의 정확도를 유지하면서도 하선형 복잡도를 달성했습니다.
MMGS: Multi-view Ranking 기반의 Optimal Transport Aggregation을 통한 10배 압축된 3DGS
MMGS는 3D Gaussian Splatting(3DGS)의 방대한 데이터 오버헤드 문제를 해결하기 위해 Optimal Transport(OT) 기반의 집계 방식을 제안하는 프레임워크입니다. 다중 뷰 기여도 순위 지정과 전역적 기하학적 분포 매칭을 통해 중복된 프리미티브를 효과적으로 병합합니다. 이를 통해 기존 방식 대비 프리미티브 사용량을 10%로 줄이면서도 최첨단 렌더링 품질과 10배 빠른 학습 속도를 달성했습니다.
메시(Meshes) 상의 삼각분할 불가지론적(Triangulation-Agnostic) Flow Matching을 위한 Matérn 노이즈
본 논문은 삼각형 메시 상에서 삼각분할 방식에 구애받지 않고 신호를 생성할 수 있는 Triangulation-Agnostic Flow Matching(FM) 기법을 제안합니다. Matérn 프로세스를 활용한 특정 가우시안 랜덤 필드 노이즈를 통해 메시의 구조적 변화에도 일관된 성능을 유지하며, PoissonNet을 디노이저로 사용하여 고품질의 신호 생성을 구현합니다.
CompoSE: 부품 인식 제어를 통한 3D 형상의 구성적 합성 및 편집
CompoSE는 부품 인식 제어를 통해 3D 형상을 구성적으로 합성하고 편집할 수 있는 새로운 방법론입니다. 경계 상자와 같은 거친 기하학적 기본 도형을 입력받아 부품 분리형 3D 객체를 생성하며, 디퓨전 트랜스포머 아키텍처를 통해 국소적 편집과 전역적 문맥 정보를 동시에 처리합니다. 텍스트 프롬프트 없이도 레이아웃 가이드를 통해 부품의 의미와 대칭성을 추론하여 정교한 편집 기능을 제공합니다.
공간 적응형 상호작용 가이드를 이용한 스킨 기반 모션 리타겟팅 (Skinned Motion Retargeting with Spatially
본 논문은 서로 다른 체형을 가진 캐릭터 간의 모션 리타겟팅 시 자기 접촉 및 신체 근접성과 같은 상호작용 의미론을 보존하는 새로운 프레임워크를 제안합니다. 기존의 정적인 대응 방식 대신 Transformer 기반의 공간 적응형 앵커를 동적으로 재배치하여, 대상 캐릭터의 기하 구조와 신체 비율 변화에 유연하게 대응합니다. 이를 통해 다양한 캐릭터 기하 구조에서도 상호작용의 충실도를 유지하며 우수한 성능을 입증했습니다.
AnchorFlow: 희소 앵커 포인트 필드(Sparse Anchor Point Fields)를 통한 편집 가능한 SVG 재구성
AnchorFlow는 래스터 이미지를 편집 가능한 SVG 벡터 그래픽으로 변환할 때 발생하는 충실도와 편집 가능성 사이의 트레이드오프를 해결하기 위한 새로운 프레임워크입니다. 희소 앵커 포인트 필드(Sparse Anchor Point Fields)를 사용하여 베지에 곡선 위의 앵커 배치를 최적화하며, 렌더링 가이드 피드백을 통해 구조적 오류를 수정합니다. 이를 통해 높은 이미지 재현성을 유지하면서도 불필요한 경로를 줄여 편집이 용이한 벡터 구조를 생성합니다.
BrepForge: 와이어프레임 구성 및 경계 조건 기반 표면 인스턴스화를 통한 인수분해된 B-rep 합성
BrepForge는 B-rep(경계 표현) 합성의 어려움을 해결하기 위해 와이어프레임 구성과 표면 인스턴스화 과정을 분리한 새로운 생성 프레임워크입니다. 면 인식 자기회귀 모델을 통해 위상적으로 완전한 와이어프레임을 먼저 생성한 후, 학습이 필요 없는 기하학적 사전 지식을 활용하여 정밀한 표면을 구현합니다. 이를 통해 위상적 무결성과 기하학적 정밀도를 동시에 확보하며 기존 방식보다 뛰어난 성능을 보여줍니다.
분산형 직접 볼륨 렌더링: 자원 제한 환경에서의 MRI 디지털 트윈을 위한 브라우저 네이티브 GPU 아키텍처
본 논문은 자원 제한 환경에서도 고충실도 MRI 디지털 트윈을 구현할 수 있는 분산형 클라이언트 측 WebGPU 아키텍처를 제안합니다. 서버 측 렌더링 대신 저가형 에지 GPU에서 직접 레이마칭을 수행함으로써 네트워크 지연을 제거하고, 높은 프레임 속도와 빠른 응답성을 확보했습니다. 이를 통해 별도의 고가 장비 없이 브라우저 환경에서 실시간 의료 시뮬레이션이 가능함을 입증했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.