PepALD: 자기회귀 잠재 확산(Autoregressive Latent Diffusion)을 통한 거대고리 펩타이드 생성
요약
PepALD는 거대고리 펩타이드 생성을 위한 자기회귀 잠재 확산(ALD) 기반의 파운데이션 모델입니다. 화학적 임베딩과 문맥 조건부 확산을 통해 복잡한 화학적 구조를 정밀하게 생성하며, 선호도 최적화를 통해 결합 친화도를 높였습니다.
핵심 포인트
- 자기회귀 잠재 확산(ALD) 모델을 통한 펩타이드 생성
- HELM 단량체를 구조화된 화학적 임베딩으로 표현
- R-그룹 인식을 통한 고리 폐쇄(ring closures) 예측
- 친화도 보상 정렬을 위한 선호도 최적화 기술 적용
- 기존 베이스라인 모델 대비 우수한 생성 품질 입증
거대고리 펩타이드(Macrocyclic peptides)는 세포 내 타겟을 위한 유망한 치료 후보 물질이지만, 이를 설계하기 위해서는 비천연 단량체(non-natural monomer) 화학, 고리 위상(ring topology), 막 투과성(membrane permeability), 그리고 타겟 결합(target binding)을 동시에 제어해야 합니다. 기존의 SMILES 또는 HELM 문자열 생성 모델은 긴 원자 수준의 시퀀스 공간에서 작동하거나, 단량체를 화학적 근거가 제한적인 상징적 토큰(symbolic tokens)으로 취급합니다. 본 연구에서는 extit{de novo} 거대고리 펩타이드 생성을 위한 자기회귀 잠재 확산(Autoregressive Latent Diffusion, ALD) 파운데이션 모델인 PepALD를 소개합니다. 이 모델은 구조화된 화학적 임베딩(chemical embeddings)으로 HELM 단량체를 표현하고, 화학적으로 정보가 반영된 잠재 공간(latent space) 내에서 문맥 조건부 확산(context-conditioned diffusion)을 통해 각 잔기(residue)를 생성하며, 자기회귀 생성 과정 동안 R-그룹을 인식하는 고리 폐쇄(ring closures)를 예측하고, 승자 보호 확산 적응 선호도 최적화(winner-protected diffusion-adapted preference optimization)를 사용하여 디노이저(denoiser)를 친화도 보상(affinity rewards)에 정렬합니다. 인실리코(In silico) 실험을 통해 대표적인 펩타이드 생성 베이스라인 모델들과 비교하여 PepALD의 생성 품질과 보상 최적화 성능을 입증하였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기