SciCore-Mol: 플러그형 분자 인지 모듈을 통한 대규모 언어 모델 (LLMs)의 강화
요약
SciCore-Mol은 LLM이 분자 데이터와 같은 과학적 데이터를 처리할 때 발생하는 정보 손실을 해결하기 위한 모듈형 프레임워크입니다. 위상 인식, 잠재 확산, 반응 인식의 세 가지 플러그형 모듈을 통해 분자 이해와 생성, 반응 예측 성능을 극대화했습니다.
핵심 포인트
- LLM과 분자 데이터 간의 의미론적 간극 해소
- 세 가지 플러그형 인지 모듈을 통한 전문 지식 통합
- 8B 규모 모델로 폐쇄형 대규모 모델과 경쟁 가능한 성능 입증
- 신약 설계 및 화학 합성 분야에 직접적인 활용 가능성 제시
대규모 언어 모델 (LLMs)은 '일당백(one-for-all)' 지능 패러다임의 중심에 있지만, 분자와 같은 이질적인 과학 데이터를 다룰 때 근본적인 문제에 직면합니다. 즉, 이산적인 언어 기호 (discrete linguistic symbols)와 위상학적 분자 (topological molecular) 또는 연속적인 반응 데이터 (continuous reaction data) 사이의 내재적인 간극으로 인해, 텍스트 기반 추론 과정에서 상당한 정보 손실과 의미론적 노이즈 (semantic noise)가 발생합니다. 우리는 세 가지의 깊게 통합된 플러그형 인지 모듈인 위상 인식 인지 모듈 (topology-aware perception module), 잠재 확산 기반 분자 생성 모듈 (latent diffusion-based molecular generation module), 그리고 반응 인식 추론 모듈 (reaction-aware reasoning module)을 통해 이 간극을 메우는 모듈형 프레임워크인 SciCore-Mol을 제안합니다. 각 모듈은 학습된 표현 인터페이스 (learned representation interfaces)를 통해 LLM 백본 (backbone)과 결합되어, 텍[]스트 전용 도구 피드백 (text-only tool feedback)만으로는 가능한 것보다 더 풍부한 정보 교환을 가능하게 합니다. 다양한 화학 작업에 대한 실험을 통해, SciCore-Mol은 분자 이해, 생성, 반응 예측 및 일반 화학 지식 전반에 걸쳐 강력한 종합 성능을 달성함을 입증하였으며, 8B 파라미터 규모의 오픈 소스 시스템임에도 불구하고 폐쇄형 대규모 모델들과 경쟁할 만한 수준이며 여러 차원에서 이를 능가합니다. 본 연구는 분리 가능하고, 플러그형이며, 유연하게 오케스트레이션 (orchestrated) 가능한 모듈을 통해 LLM에 과학적 전문 지식을 부여하는 체계적인 청사진을 제공하며, 이는 신약 설계 (drug design), 화학 합성 (chemical synthesis) 및 더 넓은 과학적 발견에 직접적인 시사점을 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기