본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 23. 10:02

OSOG: 미세 광학 환경을 위한 미분 가능한 물리 정보 기반 합성 데이터 엔진

요약

OSOG는 미세 광학 현상을 물리적으로 정확하게 모사하는 미분 가능한 합성 데이터 생성 엔진입니다. PyTorch 기반의 최적화된 아키텍처를 통해 파동 광학 계산을 가속화하며, 실시간 데이터셋 생성과 역렌더링을 지원합니다.

핵심 포인트

  • 물리 기반 미분 가능 엔진을 통한 고품질 합성 데이터 생성
  • PyTorch 네이티브 구조로 파동 광학 계산의 병목 현상 해결
  • YOLOv11-OBB 모델의 실제 현미경 데이터 제로샷 성능 입증
  • DiffOSOG를 활용한 정밀한 광학 파라미터 역렌더링 가능
  • 20 FPS 이상의 속도로 복잡한 광학 입자의 실시간 합성 지원

계산 현미경학 (computational microscopy) 분야의 딥러닝 (deep learning)은 밀도 있게 주석이 달린 데이터셋의 부족으로 인해 심각한 제약을 받고 있습니다. 합성 데이터 생성 (synthetic data generation)이 거시적 컴퓨터 비전 (computer vision) 분야에서는 이러한 격차를 해소해 왔지만, 전통적인 그래픽 엔진은 기하학적 광선 추적 (geometric ray-tracing)에 의존하기 때문에 현미경학에 필요한 미세 광학 현상 (micro-optical phenomena)을 포착하지 못합니다. 반대로, 파동 광학 (wave-optics) 공식이 존재하기는 하지만, 이를 딥러닝에 필요한 규모에서 계산 가능한 수준으로 렌더링하는 것은 여전히 거대한 시스템적 과제로 남아 있습니다. 이를 해결하기 위해, 우리는 고성능의 완전 미분 가능한 순방향 모델링 (forward-modeling) 엔진인 OSOG (Optical Synthetic Object Generator)를 소개합니다. 회절 (diffraction) 및 위상 지연 (phase retardation)의 확립된 물리 모델을 활용하여, OSOG는 연속적인 광로차 (Optical Path Difference, OPD) 계산을 고도로 최적화된 PyTorch 네이티브 구조 배열 (Structure-of-Arrays, SoA) 아키텍처로 매핑합니다. 우리는 세 가지 축을 통해 이 계산 프레임워크를 검증합니다. 첫째, OSOG로 생성된 데이터만으로 학습된 객체 탐지 (object detection) 모델 (YOLOv11-OBB)은 폐쇄(occlusion)가 심한 실제 Lysozyme 현미경 사진에 대해 강력한 제로샷 전이 (zero-shot transfer) 성능을 달 수 있습니다. 둘째, 우리는 DiffOSOG를 도입하여, 엔진의 엔드 투 엔드 (end-to-end) 미분 가능성이 커리큘럼 가이드 역렌더링 (curriculum-guided inverse rendering)을 통해 연속적인 광학 파라미터를 정확하게 복구할 수 있음을 입증합니다. 마지막으로, OSOG는 순차적 광선 추적 (sequential ray-tracing)의 $\mathcal{O}(N)$ 병목 현상을 우회하여, 40,000개의 복잡한 파동 광학 입자를 50밀리초 미만(>20 FPS) 내에 합성함으로써 하위 선형 스케일링 (sub-linear scaling)을 보여줍니다. 빠르고 확장 가능하며 물리적으로 근거가 있는 텐서 파이프라인 (tensor pipeline)을 제공함으로써, OSOG는 진정한 실시간 온더플라이 (on-the-fly) 데이터셋 생성을 가능하게 합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.GR (Graphics)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0