UNATE: 결정 구조 특성 예측을 위한 비지도 원자 임베딩 (Unsupervised Atomic Embedding)
요약
UNATE는 라벨링되지 않은 결정 구조 데이터를 활용하여 원자 표현을 학습하는 비지도 학습 프레임워크입니다. 노이즈 제거 오토인코더와 자기지도 대조 학습을 통해 결정 특성 예측 성능을 크게 향상시켰습니다.
핵심 포인트
- 비지도 학습 기반의 원자 임베딩 프레임워크 UNATE 제안
- 노이즈 제거 오토인코더와 자기지도 대조 학습 통합
- 전체 데이터 기준선 대비 성능 2.7% 향상
- 데이터 부족 시(25% 사용 시) 최대 10% 성능 향상 효과
결정(crystal) 특성을 정확하게 예측하는 것은 재료 발견(materials discovery)을 가속화하는 데 매우 중요하지만, 흔히 부족한 라벨링된 데이터(labeled data)와 비용이 많이 드는 이론적 계산으로 인해 제한을 받습니다. 이를 완화하기 위해, 우리는 라벨링되지 않은 결정 구조에서 추출된 구조적 정보를 활용하는 프레임워크인 UNATE (Unsupervised Atomic Embedding)를 제안합니다. UNATE는 비지도 노이즈 제거 오토인코더 (unsupervised denoising autoencoder)와 자기지도 대조 학습 (self-supervised contrastive learning)을 통합하여 강력한 원자 표현 (atomic representations)을 학습하며, 이는 이후 다운스트림 특성 예측 (downstream property prediction)을 위한 입력 피처 (input features)로 사용됩니다. 실험 결과에 따르면, 원시 원자 번호 (raw atomic numbers)를 UNATE로 사전 학습된 노드 임베딩 (node embeddings)으로 교체했을 때 전체 데이터 기준선 (full-data baseline) 대비 2.7%의 성능 향상을 보였습니다. 특히, 라벨링된 데이터가 제한적인 시나리오에서 이러한 이점은 더욱 두드러지며, 라벨링된 데이터의 25%만 사용했을 때 최대 10%의 향상에 도달했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기