SynLaD: 3D 약리단(Pharmacophore) 프로파일에 기반한 합성 가능한 분자 생성을 위한 잠재 확산(Latent
요약
SynLaD는 3D 약리단 프로파일과 합성 가능성을 동시에 고려하는 새로운 잠재 확산(Latent Diffusion) 프레임워크입니다. 3D 구조와 합성 경로를 함께 학습하여, 생물 활성 리간드 설계 시 높은 합성 가능성과 구조적 정확도를 동시에 확보합니다.
핵심 포인트
- 3D 구조와 합성 경로를 통합하는 잠재 공간 학습
- 기하학적 헤드와 자기회귀 합성 헤드를 통한 이중 디코딩
- 약리단 프로파일을 조건으로 하는 확산 트랜스포머 활용
- 기존 모델 대비 높은 합성 가능성 및 분자 다양성 입증
우리는 리간드 기반 약물 설계 목표(무엇을 만들 것인가)와 합성 가능성(어떻게 만들 것인가)을 통합하는 소분자 생성을 위한 잠재 확산(Latent Diffusion) 프레임워크인 SynLaD를 제시합니다. 현재의 모델들은 일반적으로 한 가지 목표를 최적화하는 과정에서 다른 목표를 희생시키며, 이는 높은 점수를 가진 합성 가능한 분자를 발견하는 데 병목 현상을 일으킵니다. SynLaD는 3D 구조와 합성 경로를 모두 디코딩하는 잠재 공간(Latent space)을 학습함으로써, 반응 제약 생성(Reaction-constrained generation)과 약리단(Pharmacophore) 조건부 3D 설계를 결합합니다. 인코더는 분자를 잠재 표현(Latent representation)으로 매핑하며, 이는 두 개의 디코더 헤드에 의해 사용됩니다: (i) 원자 유형과 좌표를 재구성하는 기하학적 헤드(Geometric head), 그리고 (ii) 직렬화된 반응 기반 표기법으로 합성 경로를 출력하는 자기회귀 합성 헤드(Autoregressive synthesis head)입니다. 확산 트랜스포머(Diffusion transformer)는 약리단 프로파일을 조건으로 하여 학습된 공간 내에서 새로운 잠재 변수(Latents)를 생성합니다. 생물 활성 리간드(Bioactive ligands)에 대한 유사체 생성 작업 전반에서, SynLaD는 합성 가능하고 다양한 히트(Hit) 생성 측면에서 기존 베이스라인 모델들을 능가하며, 단일 모델이 실행 가능한 합성 계획과 함께 형태가 정렬된(Shape-aligned) 분자를 생성할 수 있음을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기