BiMol-Diff: 분자 생성 및 캡셔닝을 위한 통합 확산 프레임워크
요약
BiMol-Diff는 텍스트 조건부 분자 생성과 분자 캡셔닝이라는 두 가지 상반된 작업을 통합한 확산 프레임워크입니다. 기존 모델들이 가진 장거리 의존성 처리의 어려움이나 균일한 노이즈 적용 문제를 해결하기 위해, 이 프레임워크는 토큰 회복 난이도에 기반하여 위치별로 노이즈를 할당하는 '토큰 인식 노이즈 스케줄'을 핵심 구성 요소로 사용합니다. 실험 결과, BiMol-Diff는 분자 재구성 및 캡셔닝 성능 모두에서 기존 최고 성능의 베이스라인 대비 유의미한 향상을 입증했습니다.
핵심 포인트
- BiMol-Diff는 분자 구조와 자연어 간의 상호작용을 모델링하는 통합 확산 프레임워크입니다.
- 핵심 기술은 토큰 회복 난이도에 기반하여 노이즈를 할당하는 '토큰 인식 노이즈 스케줄'이며, 이는 구조적 정보 보존에 기여합니다.
- 본 프레임워크는 텍스트 조건부 분자 생성과 분자 캡셔닝이라는 두 가지 작업을 동시에 수행할 수 있습니다.
- 실험적으로 BiMol-Diff는 분자 재구성(Exact Match) 및 캡셔닝(BLEU, BERTScore) 성능 모두에서 우수한 결과를 보였습니다.
분자 구조와 자연어 간의 연결은 제어 가능한 설계에 필수적입니다. 오터레그레시브 (autoregressive) 모델은 장거리 의존성 (long-range dependencies) 처리에 어려움을 겪으며, 표준 확산 과정 (standard diffusion processes) 은 위치마다 균일한 부패 (uniform corruption) 를 적용하여 구조적으로 유의미한 토큰을 왜곡시킬 수 있습니다. 우리는 텍스트 조건부 분자 생성 (text-conditioned molecule generation) 과 분자 캡셔닝 (molecule captioning) 의 쌍대 작업을 위한 통합 확산 프레임워크인 BiMol-Diff 를 제안합니다. 우리의 핵심 구성 요소는 토큰 회복 난이도에 기반하여 위치 의존적 부패를 할당하는 토큰 인식 노이즈 스케줄 (token-aware noise schedule) 입니다. 이는 순방향 과정에서 회복하기 어려운 하위 구조를 보존합니다. ChEBI-20 과 M3-20M 데이터셋에서 BiMol-Diff 는 Exact Match 에서 15.4% 의 상대적 향상을 통해 분자 재구성 성능을 개선했으며, 비교 대상 베이스라인 (baselines) 중 가장 높은 BLEU 와 BERTScore 를 달성하는 강력한 캡셔닝 결과를 보였습니다. 이러한 결과는 토큰 인식 노이징이 분자 구조-언어 모델링의 충실도 (fidelity) 를 향상시킨다는 것을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기