본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.GR (Graphics) 69필터 해제

arXiv논문

AnyAct: 비디오로부터 캐릭터 동작을 활용한 인간 재연(Human Reenactment)을 향하여

AnyAct는 비인간 캐릭터의 단안 비디오에서 동작을 추출하여 편집 가능한 인간의 퍼포먼스로 재해석하는 새로운 프레임워크를 제안합니다. 기존 방식의 한계인 구조적 차이와 토폴로지 문제를 해결하기 위해 희소한 국소 관절 동작을 활용하여 캐릭터의 역학을 보존합니다. 이를 위해 3D-to-2D 투영 감독, 점진적 학습, 전역-국소 동작 디커플링 기술을 도입하여 고충실도의 인간 동작 생성을 구현했습니다.

human reenactmentmotion capturecharacter animation
1일 전0
arXiv논문

CM-EVS: 완전한 장면 커버리지를 위한 희소 파노라마 RGB-D-Pose 데이터

본 연구는 3D 시각 학습을 위해 기존 데이터셋의 중복성과 불일치 문제를 해결하는 새로운 희소 파노라마 RGB-D-pose 데이터셋인 CM-EVS를 제안합니다. 학습이 필요 없는 뷰포인트 큐레이터인 COVER를 통해 장면의 완전한 커버리지를 유지하면서도 기하학적으로 일관된 데이터를 효율적으로 추출합니다.

3d-visionrgb-dpanoramic-data
1일 전0
arXiv논문

DealMaTe: Diffusion Transformer을 통한 다차원 재질 전이

DealMaTe는 텍스트 가이드와 참조 네트워크 없이 깊이, 법선, 조명 이미지를 활용하여 고품질의 재질 전이를 수행하는 새로운 확산 프레임워크입니다. Multi-Dim 3D Shader LoRA를 통해 베이스 모델 수정 없이 3D 정보를 주입하며, 어텐션 메커니즘 최적화를 통해 계산 효율성을 높였습니다. 다양한 실험을 통해 임의의 입력 재질에서도 높은 충실도를 가진 재질 전이 성능을 입증했습니다.

diffusion-transformermaterial-transferlora
1일 전0
arXiv논문

StippleDiffusion: 제어된 확산 모델을 이용한 용량 제한 스티플링 (Capacity-Constrained Stippling)

StippleDiffusion은 기존의 느리고 미분 불가능한 반복 최적화 방식 대신, 확산 모델을 활용하여 용량이 제한된 스티플링 패턴을 생성하는 새로운 샘플러를 제안합니다. 이 모델은 타겟 밀도 맵과 고해상도 이미지를 조건으로 하여, 점의 개수와 무관한 속도로 블루 노이즈 구조를 유지하며 정밀한 점 집합을 생성합니다. 특히 훈련 시 보지 못한 점 예산에 대해서도 뛰어난 일반화 성능을 보이며, 기존 최적화 방식과 대등한 성능을 달성했습니다.

diffusion-modelsstipplingcontrolnet
1일 전0
arXiv논문

적응형 합의를 이용한 분산형 아핀 바디 다이내믹스 (Distributed Affine Body Dynamics with Adaptive

본 논문은 점진적 포텐셜 접촉(IPC) 프레임워크 내의 아핀 바디 다이내믹스(ABD)를 분산형 환경에서 실행할 수 있는 새로운 정식화 방법을 제안합니다. 합의 기반 ADMM 기법을 도입하여 각 컴퓨팅 노드가 로컬 문제를 병렬로 해결하면서도 전역적인 일관성과 비침투성을 유지할 수 있도록 설계되었습니다. 실험을 통해 대규모 장면에서도 안정적인 수렴과 효율적인 확장성을 입증하였습니다.

affine-body-dynamicsipcadmm
1일 전0
arXiv논문

Gaussian Splatting 방식을 위한 스마트 타겟 포인트 제어

표준 Gaussian Splatting 방식은 휴리스틱한 밀도화 및 가지치기 과정으로 인해 Gaussian 개수가 불균일하게 결정되어 방법론 간의 공정한 비교가 어렵습니다. 본 논문은 이차 함수 형태의 타겟 포인트 궤적을 추적하는 '할당량 제어기(quota-governor)'를 제안하여, 모든 방법론이 동일한 밀도화 사이클을 거치며 목표 포인트 개수에 도달하도록 합니다.

gaussian-splattingcomputer-vision3d-reconstruction
1일 전0
arXiv논문

디자인 비디오 생성 평가: 구성적 충실도(Compositional Fidelity)를 위한 지표

디자인 애니메이션을 위한 생성형 비디오 모델의 표준화된 평가 프레임워크를 제안합니다. 레이아웃 충실도, 동작 정확성, 시간적 품질, 콘텐츠 충실도의 네 가지 차원을 통해 주관적인 인간 평가 없이도 자동화된 벤치마킹이 가능하도록 설계되었습니다.

generative-videovideo-evaluationdesign-animation
1일 전0
arXiv논문

일률적인 방식 그 이상: 반응형 선형 차트(Line Charts)의 단순화 기법 및 수준 선택을 위한 사용자 전략

반응형 디스플레이를 위한 선형 차트 단순화 시, 단일 알고리즘을 일률적으로 적용하는 대신 사용자가 알고리즘을 선택할 때 얻는 이득을 연구했습니다. 실험 결과, 사용자는 기기 크기보다 데이터셋의 특성에 따라 단순화 기법을 조정하는 전략을 사용하며, 상호작용의 복잡성이 반드시 높은 참여도로 이어지지는 않는다는 점을 확인했습니다.

data-visualizationline-chartsresponsive-design
1일 전0
arXiv논문

RTX에서의 순차적 전방-후방 Any-Hit 순회 (Ordered Front-to-back Any-Hit Traversal)

본 논문은 RTX 레이 트레이싱 환경에서 광선을 따라 발생하는 연속적인 히트(Hit)들을 전방-후방 정렬 순서로 보장하며 순회하는 'Ordered Front-to-back Any-Hit Traversal(FTB)' 문제를 다룹니다. 동일한 거리에 교차 지점이 발생하더라도 이를 누락하지 않고 순회할 수 있는 다양한 해결 방법을 기존 레이 트레이싱 파이프라인의 제약 조건 내에서 제안하고 평가합니다.

ray-tracingrtxgraphics
1일 전0
arXiv논문

Genflow Ad Studio: 브랜드 정렬 및 자기 수정형 비디오 생성을 위한 복합 AI 아키텍처 (Compound AI

Genflow는 생성형 비디오 모델의 시간적 불일치와 브랜드 불일치 문제를 해결하기 위해 설계된 복합 AI 시스템입니다. 'Brand DNA' 추출 모듈과 적대적 멀티 에이전트 품질 관리(QC) 루프를 통해 브랜드 가이드라인을 엄격히 준수하며, 자기 수정형 파이프라인을 통해 비디오 생성 수율을 42%에서 89%로 대폭 향상시켰습니다.

generative videocompound aimulti-agent systems
1일 전0
arXiv논문

3DPhysVideo: 3D 장면 재구성 및 물리 시뮬레이션을 통한 비디오 생성을 위한 일관성 가이드 Flow SDE

3DPhysVideo는 단일 이미지로부터 물리적으로 사실적인 비디오를 생성하기 위해 3D 장면 재구성과 물리 시뮬레이션을 결합한 새로운 training-free 파이프라인입니다. Consistency-Guided Flow SDE를 통해 기존 비디오 모델을 재사용하여 360도 기하 구조 재구성과 물리적 역학이 반영된 고품질 비디오 합성을 가능하게 합니다. 이를 통해 유체 역학 및 다중 객체 상호작용과 같은 복잡한 물리적 시나리오에서도 뛰어난 성능을 보여줍니다.

video-generation3d-reconstructionphysics-simulation
1일 전0
arXiv논문

QuadLink: 점 관계 학습을 통한 자기회귀적 사각형 중심 메쉬 생성

QuadLink는 포인트 클라우드로부터 비등방성 사각형 중심(quad-dominant) 메쉬를 생성하는 3단계 통합 프레임워크를 제안합니다. 하이브리드 중심점 조건부 정점 연결 방식을 통해 일관된 에지 흐름을 가진 고품질 메쉬를 생성하며, 기존 방식보다 뛰어난 기하학적 충실도와 토폴로지 품질을 제공합니다.

quad-dominantmesh-generationpoint-clouds
1일 전0
arXiv논문

단 하나의 아틀라스면 충분하다: 몰입형 비디오를 위한 디코더 측 가우시안 스플래팅 (Decoder-Side Gaussian Splatting)

몰입형 비디오 전송의 대역폭 문제를 해결하기 위해 디코더 측에서 가우시안 스플래팅을 수행하는 DSGS 프레임워크를 제안합니다. 이 방식은 기존의 깊이 추정 방식이 가진 기하학적 복잡성과 깜빡임 문제를 해결하며, 압축된 비트스트림을 활용해 효율적인 볼륨 장면 최적화를 구현합니다. 특히 극단적인 뷰 희소성 환경에서도 높은 화질과 안정적인 뷰 합성 성능을 보여줍니다.

gaussian-splattingimmersive-videovideo-compression
1일 전0
arXiv논문

Topo-GS: 위상학적 가우시안 스플래팅 (Topological Gaussian Splatting)을 통한 고차원 데이터의 연속적 볼륨

Topo-GS는 기존의 이산적인 포인트 클라우드 방식이 가진 시각적 폐쇄성과 불연속성 문제를 해결하기 위해 3D Gaussian Splatting을 활용한 새로운 프레임워크입니다. 고차원 데이터를 메시가 없는 연속적인 볼륨으로 재구성하며, 국소적 기하학적 제약 조건을 통해 데이터의 위상적 구조를 보존합니다.

gaussian-splattingdimensionality-reductiontopology
1일 전0
arXiv논문

VoxScene: 실내 장면 배치를 위한 앵커 조건부 복셀 확산 (Anchor-Conditioned Voxel Diffusion)

VoxScene은 실내 장면 배치를 위해 앵커 조건부 복셀 확산(anchor-conditioned voxel diffusion)을 사용하는 새로운 프레임워크입니다. 기존의 경계 상자 기반 방식이 가진 물리적 충돌 문제를 해결하기 위해 객체 중심의 복셀 표현을 도입하여, 복잡한 환경에서도 충돌 없는 정교한 배치를 가능하게 합니다.

3d-scene-synthesisvoxel-diffusionlayout-generation
1일 전0
arXiv논문

조명 음영/대비 모델 및 운동 시차(JSM) 기반의 단안 깊이 인지 향상

본 논문은 특수 장치 없이 일반 2D 디스플레이에서도 깊이 인지를 향상시킬 수 있는 새로운 프레임워크인 JSM을 제안합니다. JSM은 조명 음영/대비 모델과 운동 시차를 활용하여 단안 깊이 인지를 강화함으로써 깊이 부피 및 범위 인지 능력을 개선합니다. 이를 통해 스테레오스코피 3D 디스플레이의 한계인 시각적 피로와 고가의 장비 필요성을 보완할 수 있습니다.

depth perceptionmonocular visionstereoscopy
1일 전1
arXiv논문

QQJ: 생성형 AI의 확장 가능하고 인간 정렬된 평가를 위한 질적 판단의 정량화

기존의 자동 지표와 LLM 기반 평가가 가진 한계를 극복하기 위해, 인간의 질적 판단을 정량화하는 새로운 프레임워크인 QQJ를 제안합니다. QQJ는 전문가가 설계한 다차원 루브릭을 기반으로 소수의 고품질 주석을 사용하여 LLM 평가자를 보정함으로써, 인간의 추론 방식과 일치하는 확장 가능한 평가를 가능하게 합니다.

generative aillm evaluationalignment
1일 전0
arXiv논문

유한 요소 해석 (FEA) 피드백을 활용한 자기 개선형 CAD 생성 에이전트

본 연구는 자유 형식의 엔지니어링 요구사항으로부터 조립된 다중 부품 STEP 파일을 생성하고, 유한 요소 해석(FEA)을 통해 물리적 타당성을 검증하는 자기 개선형 CAD 생성 에이전트 프레임워크를 제안합니다. 기존 모델들이 물리적 요구사항 충족에 어려움을 겪는 문제를 해결하기 위해 텍스트 전용 청사진 스키마와 21-뷰 이미지 렌더러를 도입하여 엔지니어의 반복 작업 방식과 유사한 피드백 루프를 구축했습니다. 실험 결과, 이러한 감독 신호는 기하학적 재구성 성능을 유의미하게 향상시켰으며 시각적 완성도와 물리적 구조 요구사항을 동시에 만족하는 결과물 생성을 유도합니다.

cad-generationfeaengineering-agents
1일 전0
arXiv논문

HL-OutPaint: 고해상도 장기 비디오를 위한 Coarse-to-Fine 비디오 아웃페인팅 (Video Outpainting)

HL-OutPaint는 긴 비디오 시퀀스를 위해 고해상도 공간적 외삽을 지원하는 새로운 비디오 아웃페인팅 프레임워크입니다. Coarse-to-fine 전략을 사용하여 전역적인 구조와 움직임을 먼저 포착한 후, 이를 바탕으로 세밀하고 일관된 고해상도 콘텐츠를 생성합니다.

video-outpaintingspatio-temporal-consistencycoarse-to-fine
1일 전0
arXiv논문

실시간 신경망 헤어 디노이징 (Real-Time Neural Hair Denoising)

심하게 언더샘플링된 래스터화 입력으로부터 가닥 기반의 헤어 G-버퍼를 재구성하는 경량 실시간 신경망 방법을 제안합니다. 신경망 공간 재구성, 시간적 축적, 접선 가이드 재구성 단계를 통해 헤어 커버리지와 위치 정보를 복구하여 물리 기반 셰이딩을 가능하게 합니다. 다양한 헤어스타일에 대해 기존 디노이징 기술 및 DLSS, FSR보다 뛰어난 재구성 품질을 입증했습니다.

neural-denoisinghair-renderingreal-time-graphics
1일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.