다중 도메인 단백질-리간드 결합을 위한 계층적 대조 학습 (Hierarchical Contrastive Learning)
요약
HCLBind는 다중 도메인 단백질의 결합 친화도 예측을 위해 기하학적 표현 학습과 친화도 회귀를 분리한 자기지도 학습 프레임워크입니다. 계층적 디코이 전략을 통해 국소적 물리화학적 제약과 전역적 형태 기하학을 동시에 학습하며, 도메인 게이트 그래프 어텐션 네트워크를 통해 도메인 인터페이스를 효과적으로 포착합니다.
핵심 포인트
- 단일 도메인 섭동과 다중 도메인 회전을 활용한 계층적 디코이 전략 제안
- 도메인 게이트 그래프 어텐션 및 교차 모달 어텐션을 통한 인터페이스 특징 강화
- LoRA를 적용하여 단백질 및 리간드 파운데이션 모델의 진화적 지식 보존 및 효율적 최적화 수행
- PDBBind 데이터셋 실험을 통해 기존 지도 학습 대비 우수한 인터페이스 특징 학습 및 불확실성 추정 능력 입증
단백질-리간드 결합 친화도 (binding affinity)를 예측하는 것은 도메인 간 역학 (inter-domain dynamics)이 분자 인식 (molecular recognition)을 지배하는 다중 도메인 단백질 (multi-domain proteins)의 경우 여전히 해결하기 어려운 과제로 남아 있습니다. 기존의 기하학적 딥러닝 (geometric deep learning) 방법들은 일반적으로 단백질을 하나의 거대한 정적 그래프 (monolithic static graphs)로 취급하며, 이로 인해 강체 가정 (rigid-body assumptions) 및 유연한 영역에서의 우연적 노이즈 (aleatoric noise) 문제로 어려움을 겪습니다. 이를 해결하기 위해, 우리는 기하학적 표현 학습 (geometric representation learning)과 친화도 회귀 (affinity regression)를 분리하는 자기지도 학습 (self-supervised) 프레임워크인 HCLBind를 도입했습니다. HCLBind는 Q-BioLiP 데이터베이스에서 일반적-특수적 (general-to-specific) 사전 학습 패러다임을 활용하여 결합의 견고한 물리적 문법 (physical grammar)을 학습합니다. 우리는 새로운 계층적 디코이 (hierarchical decoy) 전략을 제안합니다. 모델은 단일 도메인 단백질 (single-domain proteins)에서의 단백질 좌표 섭동 (protein coordinate perturbation)을 통해 국소적 물리화학적 제약 (local physicochemical constraints)을 학습하고, 다중 도메인 복합체 (multi-domain complexes)에서의 도메인 간 회전 (inter-domain rotation)을 통해 전역적 형태 기하학 (global conformational geometry)을 학습합니다. 우리의 하이브리드 아키텍처는 도메인 게이트 그래프 어텐션 네트워크 (domain-gated graph attention network)와 교차 모달 어텐션 (cross-modal attention)을 통합하여 도메인 인터페이스 (domain interfaces)를 명시적으로 우선시합니다. 또한, 단백질 및 리간드 파운데이션 모델 (foundation models)에 LoRA를 적용하여 진화적 지식 (evolutionary knowledge)을 보존하면서도 효율적인 최적화를 보장합니다. PDBBind에 대한 실험 결과, HCLBind는 변별력 있는 인터페이스 특징 (interface features)을 효과적으로 학습하고 견고한 불확실성 추정 (uncertainty estimation)을 제공하여 표준 지도 학습 (supervised learning)의 한계를 극복함을 입증했습니다. 코드는 https://github.com/jiankliu/HCLBind 에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG (Machine Learning)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기