arXiv논문2026. 05. 12. 17:09

It Just Takes Two: 대규모 집합으로의 감가 추론 확장

요약

본 논문은 신경 사후 추정(Neural posterior estimation)이 대규모 조건 변수 집합에 의존하는 응용 분야에서 발생하는 계산적 한계를 해결하는 방법을 제시합니다. 연구진은 표현 학습과 사후 모델링을 분리하는 새로운 전략을 도입하여, 최대 크기 2의 작은 집합으로 Deep Set 인코더를 훈련하고 이를 임의의 대규모 조건 변수 집합에 일반화할 수 있게 했습니다. 이 접근 방식은 추론 비용이 배포 시점의 조건 변수 개수(N)와 독립적이어서, 메모리와 컴퓨팅 자원 측면에서 실용적인 해결책을 제공합니다.

핵심 포인트

신경 사후 추정은 강력하지만, 대규모 조건 변수 집합 처리 시 계산 비용이 급증하는 문제가 있습니다.
제안된 방법은 표현 학습(Representation Learning)과 사후 모델링(Posterior Modeling)을 분리하여 이 문제를 해결합니다.
최대 크기 2의 작은 집합으로 Deep Set 인코더를 훈련함으로써, 임의의 대규모 조건 변수 집합에 일반화할 수 있습니다.
이 접근 방식은 추론 비용이 배포 집합 크기 N에 본질적으로 독립적이어서 효율적입니다.

신경 사후 추정(Neural posterior estimation)은 감가 추론(amortized inference)을 위한 강력한 도구로 부상했으며, 과학 및 응용 분야 전반에 걸쳐 채택이 증가하고 있습니다. 이러한 많은 응용 프로그램에서 조건 변수는 관측치들의 집합이며, 이 요소들은 목표뿐만 아니라 집합 전체에 공유되는 알려지지 않은 요인들에 의존합니다. 따라서 최적의 추론은 해당 집합을 공동으로 처리해야 하며, 이는 결국 배포(deployment) 집합 크기만큼 추정기를 훈련할 것을 요구합니다. 이러한 방식에서는 메모리와 컴퓨팅 자원이 빠르게 비현실적이 됩니다. 우리는 표현 학습(representation learning)과 사후 모델링(posterior modeling)을 분리하는 간단하고 이론적으로 근거가 있는 전략을 소개합니다. 우리의 방법은 최대 크기 2의 집합에 대해 평균 풀(mean-pool) Deep Set을 훈련하여, 임의의 집합 크기로 일반화되는 인코더를 생성합니다. 그런 다음 추론 헤드(inference head)는 사전 집계된 임베딩(pre-aggregated embeddings)으로 미세 조정되어, 훈련 비용이 배포 집합 크기 N에 본질적으로 독립적이게 만듭니다. 수천 개의 N을 가진 스칼라, 이미지, 다중 뷰 3D, 분자 및 고차원 조건부 생성 벤치마크 전반에서, 우리의 접근 방식은 표준 베이스라인과 동등하거나 능가하는 성능을 훨씬 적은 컴퓨팅 자원으로 달성합니다.

AI 자동 생성 콘텐츠

원문 바로가기

It Just Takes Two: 대규모 집합으로의 감가 추론 확장

요약

핵심 포인트

댓글