결정론적이고 자기 확장 가능한 반응 분류를 위한 검증 가능한 규칙의 에이전트 기반 생성
요약
LLM 기반 멀티 에이전트 프레임워크를 활용하여 화학 반응 규칙을 자동으로 생성하고 검증하는 시스템을 제안합니다. 기존의 고정된 규칙 세트 한계를 극복하여 수만 개의 클래스로 분류 체계를 확장하고 높은 분류 정확도를 달성했습니다.
핵심 포인트
- LLM 멀티 에이전트를 통한 화학 반응 규칙 자동 생성 및 검증
- 기존 68개에서 14,073개 클래스로 분류 체계의 대폭 확장
- 미학습 반응에 대해 97.7%의 높은 분류 성능 기록
- 자기 확장 가능한 심볼릭 시스템 구축 경로 제시
컴퓨터 보조 합성 계획 (Computer-assisted synthesis planning)은 각 변환에 결정론적이고 해석 가능한 레이블을 부여하는 방대한 반응 규칙 라이브러리를 사용하여 대상 분자를 접근 가능한 전구체로 분해합니다. 하지만 화학은 롱테일 (long-tailed) 특성을 가지고 있어 수동 인코딩이 불가능하며, 기존 도구들은 새로운 화학 분야에 적응할 수 없는 고정된 규칙 세트에 의존합니다. 본 논문에서는 대규모 언어 모델 (LLMs)의 멀티 에이전트 프레임워크가 665,901개의 미국 특허 반응에 걸쳐 반응을 분류하고 규칙 자체를 직접 작성하는 완전 자동화된 파이프라인을 제시하며, 각 규칙은 코퍼스 (corpus)를 대상으로 테스트하는 검증 루프 (verification loop) 하에서 생성됩니다. 이 시스템은 인간의 큐레이션 없이 표준 분류 체계를 68개에서 14,073개 클래스로 확장합니다. 경량 핑거프린트 분류기 (lightweight fingerprint classifier)를 통해 학습되지 않은 반응의 97.7%를 분류하며, 이는 선도적인 독점 분류기와 대등한 성능을 보이면서도 화학적 특성을 더 세밀하게 해결하고, 학습 분포 외부의 화학 분야로 필요에 따라 확장할 수 있습니다. 그 결과, 살아있는 반응성 데이터베이스와 생성 모델을 신뢰할 수 있는 자기 확장형 심볼릭 시스템 (symbolic systems)으로 전환하는 일반적인 경로를 확보하게 되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기