입력 이진화를 통한 반도체 시각적 프로그램 합성의 Sim-to-Real 격차 해소
요약
반도체 검사를 위한 정밀한 학습 데이터 생성을 위해 VLM 기반의 시각적 프로그램 합성 프레임워크를 제안합니다. 입력 이진화 전략을 통해 SEM 이미지의 질감과 노이즈를 제거함으로써 Sim-to-Real 격차를 효과적으로 해소했습니다.
핵심 포인트
- VLM을 활용해 검사 이미지를 편집 가능한 DSL 코드로 변환
- 입력 이진화 전략으로 SEM 이미지의 도메인 격차 완화
- MIIC 데이터셋에서 Dice coefficient 성능 향상 입증
- 나노미터 규모의 정밀한 기하학적 데이터 생성 가능
회로 기하학(geometry)에 대한 정밀한 파라미터 제어는 반도체 검사(inspection)에 필수적이지만, 충분한 실제 학습 데이터를 확보하는 것은 여전히 비용이 많이 듭니다. Diffusion models 및 Generative Adversarial Networks (GANs)와 같은 생성 모델이 학습 데이터를 증강할 수는 있지만, 계측(metrology) 작업에 요구되는 나노미터 규모의 기하학적 정확성을 보장할 수는 없습니다. 본 논문에서는 Vision-Language Model (VLM)이 검사 이미지를 회로 기하학을 설명하는 편집 가능한 Domain-Specific Language (DSL) 코드로 변환하여, 정확한 파라미터 조작을 통해 학습 데이터를 제어하며 생성할 수 있는 시각적 프로그램 합성(visual program synthesis) 프레임워크를 제안합니다. VLM은 오직 합성된 DSL 렌더링 데이터로만 학습되기 때문에, 실제 Scanning Electron Microscope (SEM) 이미지를 처리할 때 도메인 격차(domain gap)가 발생합니다. 우리는 SEM 특유의 질감(texture)과 노이즈를 제거하여 모델이 기하학적 구조에 집중할 수 있도록 하는 입력 이진화(input binarization) 전략을 통해 이 격차를 해소합니다. MIIC 데이터셋에서 이진화된 입력은 원본 입력(raw-input) 베이스라인 대비 평균 Dice coefficient를 0.4393에서 0.5256으로 향상시켰으며, 이는 단순한 질감 추상화가 sim-to-real 격차를 실질적으로 완화함을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기