본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 23. 12:08

QBioFusion-QSAR: 소규모 데이터 리간드 분류를 위한 Morgan-Anchored 양자 다중 커널 학습 (Quantum

요약

QBioFusion-QSAR는 소규모 데이터 환경에서 리간드 분류 성능을 높이기 위해 양자 다중 커널 학습(QMKL)을 제안합니다. Morgan/Tanimoto 커널과 양자 충실도 커널을 결합하여 활성 절벽(activity-cliff) 문제를 개선하고 예측 정확도를 향상시켰습니다.

핵심 포인트

  • 양자 다중 커널 학습(QMKL)을 통한 리간드 분류 성능 향상
  • Morgan/Tanimoto 커널과 양자 충실도 커널의 결합 방식 제안
  • PsychLight-A 벤치마크에서 정확도 및 MCC 지표 개선 확인
  • 활성 절벽 하위 집합에서의 MCC 성능 유의미한 증가

유사한 분자 유사체(molecular analogues)가 서로 다른 활성 라벨(activity labels)을 가질 때, 소규모 정량적 구조-활성 관계 (QSAR) 연구는 어렵습니다. 본 논문은 양자 커널(quantum kernel)이 Morgan/Tanimoto 핑거프린트 모델에 유사성 정보를 추가할 수 있는지, 그리고 어떤 분자들이 이러한 변화를 일으키는지 질문합니다. QBioFusion-QSAR는 양자 다중 커널 학습 (QMKL, Quantum Multiple Kernel Learning)을 사용합니다. 즉, 서포트 벡터 머신 (SVM, Support Vector Machine)이 Morgan/Tanimoto 커널과 RDKit 및 Mordred 기술자(descriptors) 및 Deep-PK 특징(features)에서 유도된 폴드-로컬 구성 요소(fold-local components)로부터 구축된 양자 충실도 커널(quantum fidelity kernel)을 결합합니다. 선형(Linear) 및 방사 기저 함수(RBF, Radial Basis Function) 기술자 커널이 고전적 대조군(classical controls)으로 포함됩니다. 54개 분자로 구성된 PsychLight-A 벤치마크에서 Morgan/Tanimoto는 가장 강력한 단일 표현(single representation)이었습니다. 주요 층화 5-겹 교차 검증 (stratified five-fold evaluation)에서 QMKL은 정확도(accuracy)를 0.815에서 0.833으로, 매튜스 상관 계수 (MCC, Matthews Correlation Coefficient)를 0.613에서 0.645로 향상시켰습니다. 매칭 정규화 감사 (Matched-regularization auditing) 결과, 이러한 변화는 N-Me-5-HT와 N-Me-tryptamine이 위음성(false-negative) 예측에서 진양성(true-positive) 예측으로 변경된 데 기인한 것으로 나타났으며, 활성 절벽 (activity-cliff) 하위 집합의 MCC는 0.07에서 0.22로 증가했습니다. 10회의 무작위 분할에 대해 5-겹 프로토콜을 반복한 결과, 학습된 QMKL이 평균 MCC에서 Morgan/Tanimoto를 초과하지 않음을 보여주었습니다. 매칭 비교를 위한 쌍체 홀드아웃 부트스트랩 구간 (paired held-out bootstrap intervals) 또한 0을 포함합니다. 이러한 결과는 QBioFusion-QSAR가 소규모 데이터 및 활성 절벽을 인지하는 리간드 분류에서 국소적인 잔차 양자-커널 기여도를 식별할 수 있는 감사 가능한 QMKL 프레임워크임을 뒷받침합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0