본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 08. 16:56

Edge-specific signal propagation on mature chromophore-region 3D mechanism

요약

본 연구는 형광 단백질의 양자 수율(QY) 예측을 위해 크로모포어 중심 메커니즘 그래프 알고리즘을 제안합니다. 기존 모델들이 전역적 경향에 의존했던 것과 달리, 이 방법은 성숙한 크로모포르 영역에 작용하는 국소 물리 신호를 포착하여 단백질의 3차원 구조를 타입화된 잔기 그래프로 변환하고 채널 신호 전파를 통해 특징을 추출합니다. 실험 결과, 제안된 방법은 다양한 벤치마크에서 기존 모델들보다 우수한 성능을 보여주었으며, 특히 유사도가 낮은 원격 영역에서의 예측 능력이 뛰어남을 입증했습니다.

핵심 포인트

  • 형광 단백질의 양자 수율(QY)은 서열 동일성뿐 아니라 크로모포르 주변의 국소 물리 환경에 의해 결정된다.
  • 제안된 방법은 PDB 구조를 타입화된 3D 잔기 그래프로 변환하고, 채널 신호 전파 메커니즘을 사용하여 QY 예측에 필요한 국소 물리적 특징을 추출한다.
  • 이 알고리즘은 접촉 채널 및 씨드 신호를 인코딩하여 해석 가능성이 높으며, 기존의 모델 기반 베이스라인(예: Band mean, ESM-C)보다 우수한 성능을 달성했다.
  • 특히 단백질 간 유사도가 낮은 원격 영역(remote bucket)에서 가장 강력한 예측 능력을 보여주었으며, 이는 밝기 스크리닝에 유용하다.

형광 단백질 양자 수율 (QY) 은 단순히 서열 동일성뿐만 아니라 성숙한 크로모포르와 그 3 차원 마이크로 환경에 의해 지배됩니다. 단백질 언어 모델과 방출대 평균은 전역적 경향을 포착하지만, 특정 크로모포르 영역에 작용하는 국소 물리 신호를 모델링하지는 않습니다. 우리는 QY 예측을 위한 크로모포르 중심 메커니즘 그래프 알고리즘을 제시합니다. 각 PDB 구조는 타입화된 3D 잔기 그래프로 변환되며, 성숙한 CRO 상태에 등록되고 페놀레이트, 브리지 및 이미자졸리논 영역으로 분할되며 채널 신호 영역 전파를 통해 변환됩니다. 이 표현식은 121 개의 부가 특성을 포함하며, 동일성 단축을 제거한 후 밴드별 ExtraTrees 회귀에 52 개의 비동일성 특성이 사용됩니다. 각 특성은 접촉 채널, 씨드 신호 및 목표 CRO 영역을 인코딩하므로 해석은 사후적이 아닌 내재적입니다. 531 개 단백질 벤치마크에서该方法 (이 방법) 은 모델 기반 베이스라인 중 가장 좋은 랜덤-CV 성능을 달성했습니다 (R = 0.772 +/- 0.008, MAE = 0.131 +/- 0.002). 이는 Band mean (R = 0.632), ESM-C (R = 0.734) 및 SaProt (R = 0.731) 을 초과하며 밝기 스크리닝에서 1 위를 차지했습니다 (Bright P@5 = 0.704). 동질성 제어 하에서는 이 장점이 원격 버킷 (<50% 유사도; R = 0.697 versus 0.633, 0.575 및 0.408) 에서 가장 명확했으며, 밝기/어둠 Top-K 스크리닝에서 가장 강력한 성능을 보였습니다. 안정적으로 선택된 기능은 밴드별 메커니즘을 복원했습니다: GFP 유사 단백질의 방향족 패킹과 클램프 비대칭성, Red 단백질의 전하/클램프 균형, 그리고 Far-red 단백질의 유연성 리스크/거대 접촉 특성입니다. 소스 코드, 기능 표 및 평가 스크립트는 요청 시 1 저자로부터 제공됩니다. 연락처: yuchenak05@gmail.com

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0