CELN: Vector Symbolic Architectures (VSA)를 사용하는 CPU 전용 결정론적 추론 엔진
요약
CELN은 신경망 대신 벡터 심볼릭 아키텍처(VSA)를 활용하여 결정론적 선형 대수로 논리 추론을 수행하는 엔진입니다. ProofWriter 벤치마크에서 100%의 정확도를 기록하며, 통계적 확률이 아닌 수학적 연산을 통해 연역적 추론을 구현합니다.
핵심 포인트
- VSA 기반의 결정론적 벡터 대수 활용
- ProofWriter 벤치마크에서 100% 정확도 달성
- 학습 파라미터 없이 수학적 연산으로 추론 수행
- CPU 환경에서 효율적인 저지연/저메모리 동작
제가 작업해 온 프로젝트인 CELN (C. Elegans Learning Network)을 공유하고자 합니다. 이는 신경망 (Neural Networks) 대신 벡터 심볼릭 아키텍처 (Vector Symbolic Architectures, VSA)를 사용하는 논리 추론 엔진입니다.
제가 이것을 처음 만든 이유는 형식 논리 추론 (Formal Logical Reasoning)이 학습된 통계 모델이 아닌, 완전히 결정론적인 벡터 대수 (Deterministic Vector Algebra)만으로 구현될 수 있는지 탐구하고 싶었기 때문입니다.
작동 방식 (간략히):
- 개념 (Concepts)은 10,000차원 벡터로 인코딩됩니다.
- 비가환 결합 연산자 (Non-commutative Binding Operator, Projective Resonance)가 논리 문장을 합성하고 분해합니다.
- 결합 대수 (Binding Algebra)는 학습된 파라미터는 없지만, 수학적으로 Q·K^T 어텐션 (Attention)과 유사한 쿼리-키 유사도 계산을 생성합니다.
- 연역 (Deduction)은 확률이 아닌 결정론적 선형 대수 (Deterministic Linear Algebra)를 통해 이루어집니다.
저는 True, False, Unknown의 세 가지 클래스에 걸쳐 논리 추론을 테스트하는 ProofWriter 벤치마크에서 CELN을 평가했습니다.
결과 (Ryzen 2600):
- ProofWriter: 500/500 (100%)
- 스트레스 테스트 (5,000개 예시): 여전히 100%
- 지연 시간 (Latency): 쿼리당 ~34.7ms
- RAM: 피크 493MB
"Unknown" 클래스는 흥미로운데, CELN은 유도가 불가능할 때마다 "증명 불가능 (no proof possible)"을 반환하기 때문입니다. 대수가 단순히 해결되지 않는 것입니다.
한계점: CELN은 논리 코어 (Logic Core)이지 챗봇 (Chatbot)이 아닙니다. 아직 유창하게 텍스트를 생성하지는 못합니다. 규칙은 현재 수작업으로 만들어졌으며, 자연어로부터의 자동 추출이 다음 단계입니다.
배경: 저는 아키텍처와 수학을 설계했습니다. Python 구현은 AI 어시스턴트의 도움을 받아 수행되었습니다. 저는 그들을 수학적 청사진을 위한 컴파일러로 취급하며, 모든 반복 과정을 검토하고 디버깅했습니다.
저는 브라질에 사는 15세입니다. 연구실도, GPU 클러스터도, 지도 교수도 없습니다. 홈 PC로 이것을 만들었습니다.
직접 시도해 보세요 (무거운 다운로드 없음):
git clone https://github.com/Ravi4649/celn && cd celn && python examples/step_by_step_en.py
GitHub: https://github.com/Ravi4649/celn
Paper (DOI): https://doi.org/10.5281/zenodo.20836283
저는 특히 사람들이 이 접근 방식이 어디에서 실패할 것이라고 생각하는지에 대해 관심이 많습니다. 질문이 있다면 기꺼이 답변하겠습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기