6월 25일 - AI, ML 및 Computer Vision Meetup
요약
2026년 6월 25일에 개최되는 AI, ML 및 Computer Vision Meetup 세션 안내입니다. Local View Transformers를 활용한 대규모 3D 장면 재구성 기술, 저자기장 영상화를 위한 딥러닝 기반 의료 영상 분석, 그리고 FiftyOne 도구를 활용한 데이터셋 관리 및 확장 방법론에 대한 발표가 진행됩니다.
핵심 포인트
- Local View Transformer(LVT)를 통해 대규모 고해상도 장면의 확장 가능한 단일 패스 3D 재구성 가능
- CycleGAN 및 ResUNet을 활용하여 저자기장 환경에서의 의료 영상 품질 개선 및 노이즈 제거 연구 공유
- FiftyOne 오픈 소스 도구를 활용하여 컴퓨터 비전 데이터셋 관리의 한계를 확장하는 실용적 데모 제공
날짜, 시간 및 장소: 2026년 6월 25일 오전 9시(태평양 표준시), 온라인. Zoom에 등록하세요!
발표 내용은 다음과 같습니다:
Local View Transformers를 통한 대규모 장면 재구성 (Large-Scale Scene Reconstruction via Local View Transformers)
Transformer 기반 모델들은 3D 장면 재구성 (3D scene reconstruction) 기술을 발전시켜 왔으나, 이들의 이차 복잡도 주의 집중 (quadratic attention) 방식은 대규모 장면에 대한 확장성 (scalability)을 제한합니다. 우리는 전역 주의 집중 (global attention)을 상대적인 카메라 기하학 (relative camera geometry)에 기반하여 인접 뷰(neighboring views)에 대한 지역 인식 주의 집중 (locality-aware attention)으로 대체하는 Local View Transformer (LVT)를 소개합니다. LVT는 고충실도 렌더링 (high-fidelity rendering)을 위해 뷰 의존적 색상 (view-dependent color) 및 불투명도 (opacity)를 가진 3D Gaussian splats로 직접 디코딩합니다. 우리의 접근 방식은 대규모 고해상도 장면의 확장 가능한 단일 패스 재구성 (single-pass reconstruction)을 가능하게 합니다.
연사 소개: Tooba Imtiaz는 Northeastern University의 전기 및 컴퓨터 공학 박사 과정 학생으로
먼저, 회고적 시뮬레이션 연구 (retrospective simulation study)를 통해 저자기장 (low field)에서 NiV 감염을 영상화하는 것의 타당성을 평가하였으며, 이어서 종단적 영상화 (longitudinal imaging)를 가능하게 하는 전향적 배치 (prospective deployment, 0.05 T)를 진행했습니다. VLF-NiV 영상화는 낮은 영상 품질과 다중 대조도 (multiple contrasts)를 특징으로 합니다. 획득 파라미터 (acquisition parameters)에 조건화된 딥러닝 기반의 비쌍체 도메인 적응 (unpaired domain adaptation, CycleGAN)을 사용하여 대조도를 조화시켰으며, 시뮬레이션 기반의 ResUNet 모델을 사용하여 원치 않는 노이즈를 줄이고 T2 강조 (T2-weighted) 구조적 충실도를 보존했습니다. 또한, 접근 가능한 신경 영상 (neuroimaging)에 유리한 제로샷 초해상도 (zero-shot super-resolution) 및 노이즈 제거 (denoising) 실험을 포함한 연구들도 강조합니다.
연사 소개: Ajay Sharma는 생체 의학 영상 분석 (biomedical image analysis) 분야의 폭넓은 배경을 가진 딥러닝 엔지니어입니다. 그의 연구는 컴퓨터 보조 질병 탐지 및 진단을 위한 고급 딥러닝 방법론 개발에 집중되어 있습니다.
그리고 완전히 다른 이야기: FiftyOne과 함께
도구가 진정으로 무엇을 할 수 있는지 이해하는 가장 좋은 방법은 종종 의도되지 않은 방식으로 사용하는 것입니다. 이번 세션은 FiftyOne으로 경계를 확장하는 방법을 보여주는 일련의 데모를 통해, FiftyOne의 컴퓨터 비전 (computer vision) 뿌리를 넘어 그 한계를 밀어붙입니다. 몇 가지는 실용적이고, 몇 가지는 유희적이며, 모두 오픈 소스 코드로 구축되었습니다. 여러분은 FiftyOne의 핵심 빌딩 블록 (building blocks)이 레이블이 지정된 데이터셋 (labeled datasets)을 훨씬 넘어 어떻게 일반화되는지 확인하게 될 것이며, 여러분만의 방향으로 가져갈 수 있는 패턴과 아이디어를 얻게 될 것입니다.
연사 소개: Burhan Qaddoumi는 Voxel51의 ML DevRel 엔지니어이자
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기