EM-NeSy: 신경기호학습 (Neurosymbolic Learning)을 위한 기대값 최대화 (Expectation Maximization)
요약
신경망과 기호적 추론을 통합하는 신경기호학습(NeSy)을 위해 EM 알고리즘을 적용한 EM-NeSy 프레임워크를 제안합니다. 이 방식은 기호적 구성 요소의 미분 가능성 없이도 근사 추론을 통해 효율적인 학습을 가능하게 합니다.
핵심 포인트
- EM 알고리즘을 활용한 확률적 NeSy 학습 프레임워크 제안
- 기호적 구성 요소의 미분 가능성 요구 사항 해결
- 근사 추론을 통한 NeSy 모델의 자연스러운 확장성 확보
- 실험을 통해 입증된 높은 확장성 및 계산 효율성
신경기호학습 (Neurosymbolic (NeSy)) 모델은 강건하고 해석 가능한 AI를 위해 신경망 (neural networks)과 기호적 추론 (symbolic reasoning)을 통합합니다. 최첨단 NeSy 모델들은 기호적 구성 요소가 미분 가능한 (differentiable) 방식으로 표현될 것을 요구하며, 이는 종종 근사 추론 (approximate inference)의 사용을 복잡하게 만듭니다. 우리는 확률적 NeSy 학습을 기대값 최대화 (Expectation-Maximization (EM)) 알고리즘의 사례로 전환하는 EM-NeSy를 제안합니다. 기대값 단계 (expectation step)에서, 우리는 확률적 추론을 통해 레이블 (label)이 주어졌을 때 신경망이 예측한 기호들에 대한 사후 확률 (posterior)을 계산합니다. 최대화 단계 (maximization step)에서, 우리는 오직 신경망 구성 요소를 통해서만 경사 하강법 (gradient descent)을 사용하여 이 사후 확률을 바탕으로 신경망 파라미터 (neural parameters)를 업데이트합니다. 이러한 정식화는 NeSy 학습을 위한 EM 알고리즘의 잠재력을 완전히 끌어냅니다. 이를 통해 NeSy는 기호적 구성 요소에 대한 추가적인 수정이나 미분 가능성 요구 사항 없이도 근사 추론 (approximate reasoning)으로 자연스럽게 확장될 수 있습니다. 또한, 이는 정확한 추론 (exact inference) 하에서 표준적인 엔드투엔드 (end-to-end) 경사 기반 NeSy 설정을 회복합니다. 우리의 실험 결과는 EM-NeSy의 확장성 (scalability)과 계산 효율성 (computational efficiency)을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기