본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 09. 12:05

잠재 공간 베이지안 최적화 (Latent Space Bayesian Optimization)를 위한 인컨텍스트 학습 (In-Context

요약

잠재 공간 베이지안 최적화(LSBO) 시 발생하는 인컨텍스트 모델의 데이터 불일치 문제를 해결하기 위한 연구입니다. 분자 VAE 잠재 공간 기반의 합성 최적화 작업을 통해 테이블형 파운데이션 모델을 지속 사전 학습하여 성능을 개선했습니다.

핵심 포인트

  • LSBO와 인컨텍스트 모델 간의 데이터 매핑 불일치 문제 식별
  • 분자 VAE 잠재 공간을 활용한 합성 최적화 작업 도입
  • 정규화 항을 포함한 지속 사전 학습으로 기존 지식 보존
  • 분자 최적화 벤치마크에서 강력한 성능 입증

베이지안 최적화 (Bayesian optimization, BO)는 샘플 효율적인 설계를 위한 핵심 도구이며, 잠재 공간 베이지안 최적화 (latent-space Bayesian optimization, LSBO)는 이를 분자나 단백질과 같은 구조화된 객체로 확장합니다. 이와 병행하여, TabPFN 및 TabICL과 같은 테이블형 파운데이션 모델 (tabular foundation models)은 현재 최첨단 회귀 (regression) 성능을 달성하고 있으며, BO 대리 모델 (surrogates)로 점점 더 많이 사용되고 있습니다. 이러한 모델들의 베이지안 동작은 대규모 합성 사전 학습 (synthetic pretraining) 데이터셋에 의해 유도되기 때문에, 이 사전 학습 분포의 구성이 매우 중요합니다. LSBO는 독특한 불일치 (mismatch)를 생성합니다. 즉, 잠재 코드 (latent code)에서 목적 함수 값 (objective value)으로 유도되는 매핑이 현재의 인컨텍스트 모델 (in-context models)을 학습시키는 데 사용된 회귀 작업과 현저히 다릅니다. 우리는 분자 VAE (molecular VAE)의 잠재 공간 상에 정의된 합성 최적화 작업 (synthetic optimization tasks)을 테이블형 파운데이션 모델 대리 모델의 사전 학습 단계에 보완함으로써 이 불일치를 해결합니다. 지속 사전 학습 (continued-pretraining) 목적 함수는 모델을 원래의 체크포인트에 고정하는 정규화 항 (regularizer)을 특징으로 하며, 이를 통해 적응 작업 (adaptation tasks)에 대한 과도한 전문화를 피하면서도 모델의 광범위한 회귀 사전 지식 (regression prior)을 보존합니다. 홀드아웃 (held-out) 분자 최적화 벤치마크에서 결과 모델은 강력한 성능을 달성하였으며, 이는 인컨텍스트 대리 모델을 위한 LSBO 특화 적응의 관련성을 뒷받침합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0