삼단논법의 간극: 왜 형식 논리 (Formal Logic)가 추론 (Reasoning)이 아닌가 — 그리고 이것이 AI에 의미하는 바 - Insights | Molayo

만약 기호주의 AI (Symbolic AI) 전통 전체가 아리스토텔레스(Aristotle)를 오해했다면 어떨까요? 삼단논법의 세부 사항이 아니라, 추론한다는 것 자체가 무엇을 의미하는지에 대해서 말입니다.

삼단논법은 논리학 역사에서 가장 유명한 유물입니다. "모든 인간은 죽는다. 소크라테스는 인간이다. 그러므로 소크라테스는 죽는다." 지난 2천 년 동안, 이 3부 구조는 합리적 사고의 템플릿, 즉 올바르게 따르면 진리를 보장하는 기계적 절차로 받들어져 왔습니다. 1950년대와 1960년대 인공지능 (AI)의 개척자들이 사고할 수 있는 기계를 만들고자 했을 때, 그들은 삼단논법을 출발점으로 삼았습니다. 1956년 앨런 뉴웰 (Allen Newell), 허버트 사이먼 (Herbert Simon), J.C. 쇼 (J.C. Shaw)가 개발한 로직 시어리스트 (Logic Theorist)는 삼단논법적 추론을 사용하여 화이트헤드 (Whitehead)와 러셀 (Russell)의 _Principia Mathematica_의 정리들을 증명하기 위해 명시적으로 설계되었습니다. 범용 문제 해결기 (General Problem Solver)가 그 뒤를 이었습니다. 기호주의 AI (Symbolic AI) 전통 전체는 추론이 기호에 대한 형식적 연산이며, 올바른 규칙을 인코딩할 수 있다면 인간의 마음을 복제할 수 있다는 가정에 기반을 두었습니다.

그들은 틀렸습니다. 형식 논리 (Formal Logic)가 쓸모없기 때문이 아니라 — 형식 논리는 수학, 컴퓨터 과학, 그리고 합리적 담론에 필수적입니다 — 추론 (Reasoning)이 논리적 형태 (Logical form)로 환원될 수 없기 때문입니다. 그리고 이것은 아리스토텔레스(Aristotle) 본인도 이해하고 있었던 지점입니다. 비록 그의 _Prior Analytics_가 훗날 그를 수호자로 받들게 될 형식적 전통의 토대를 마련했을지라도 말입니다.

심리학이 아닌 기술로서의 삼단논법

아리스토텔레스의 삼단논법에 대해 가장 먼저 이해해야 할 점은 그것이 추론에 관한 이론이 아니었다는 것입니다. 그것은 증명의 기술 (Technology of demonstration)이었습니다. 즉, 이미 습득된 지식을 조직하고, 타인에게 가르치며, 변증법적 맥락에서 청중을 설득하기 위한 도구였습니다. _Prior Analytics_는 마음이 어떻게 작동하는지에 대한 인지 과학 (Cognitive science)이 아닙니다. 그것은 일단 만들어진 논증의 타당성을 평가하기 위한 형식 체계 (Formal system)입니다.

이러한 구분은 매우 중요합니다. 아리스토텔레스(Aristotle)가 삼단논법을 분석할 때, 그는 추론자(reasoner)의 마음속에서 일어나는 일을 설명하고 있는 것이 아닙니다. 그는 동의를 강제하는 논증의 구조적 속성(structural properties)을 설명하고 있는 것입니다. 삼단논법은 규범적 표준(normative standard) — 즉, 논증이 타당한지 확인하는 방법 — 이지, 우리가 결론에 도달하는 방식에 대한 심리학적 모델(psychological model)이 아닙니다. 그럼에도 불구하고, Logic Theorist부터 1980년대의 전문가 시스템(expert systems)에 이르기까지 기호주의 AI (symbolic AI)의 전체 전통은 삼단논법을 정확히 그것, 즉 추론 과정 그 자체를 위한 청사진으로 취급했습니다.

그 결과, 지난 반세기 동안의 AI 연구는 정리 증명 (theorem proving)과 형식적 연역 (formal deduction)에는 탁월했으나, 인간이 노력 없이 수행하는 다음과 같은 종류의 추론에는 완전히 실패했습니다: 관련성 인식 (recognizing relevance), 증거의 무게 측정 (weighing evidence), 새로운 정보에 따른 신념 수정 (revising beliefs), 그리고 — 가장 중요하게는 — 형식적 프레임워크 (formal framework)를 완전히 포기해야 할 때를 아는 것.

아리스토텔레스에서 프레게까지: 논리학의 협소화

우리가 어떻게 기호주의 AI 전통의 추론 개념에 도달하게 되었는지 이해하려면, 아리스토텔레스(Aristotle)부터 고틀로프 프레게(Gottlob Frege)에 이르기까지 논리학의 진화 과정을 추적해야 합니다. _오르가논 (Organon)_이라 통칭되는 아리스토텔레스의 논리학 저작들은 삼단논법보다 훨씬 더 많은 것을 다룹니다. _범주론 (Categories)_은 술어 판정 (predication)의 기본 구조를 검토합니다. _해석론 (De Interpretatione)_은 언어, 사고, 그리고 실재 사이의 관계를 분석합니다. _변증론 (Topics)_은 변증법적 논증 (dialectical argumentation)을 위한 체계적인 방법을 제공합니다. _소피스트적 반박 (Sophistical Refutations)_은 오류 (fallacies)들을 목록화합니다. _선험 분석론 (Prior Analytics)_에서 제시된 삼단논법은 여러 도구 중 하나일 뿐입니다.

Frege의 Begriffsschrift (1879)는 모든 것을 바꾸어 놓았습니다. 아리스토텔레스의 주어-술어 논리 (subject-predicate logic)를 함수-인자 구조 (function-argument structure)로 대체하고 양화사 (quantifiers)를 도입함으로써, Frege는 전례 없는 강력한 형식 언어 (formal language)를 창조했습니다. 1차 논리 (first-order logic)의 발전과 이어지는 20세기의 증명 절차 기계화 (mechanization of proof procedures)는 추론 (reasoning)을 계산 (computation)으로 다루는 것을 가능하게 했습니다. 삼단논법 (syllogism)은 더 이상 담론을 조직하기 위한 도구가 아니라, 보편적인 형식 언어의 파편이 되었습니다.

이것은 놀라운 성취였습니다. 이는 현대 수학, 컴퓨터 과학, 그리고 형식 검증 (formal verification)의 발전을 가능하게 했습니다. 하지만 이는 또한 추론에 대한 개념을 좁혔습니다. 범주 (categories), 변증법 (dialectics), 오류 (fallacies), 그리고 수사적 맥락 (rhetorical context)을 포함하는 풍부하고 다면적인 철학적 실천으로 시작되었던 것이 형식적 연역 (formal deduction)으로 축소되었습니다. _Organon_은 _Begriffsschrift_가 되었고, _Begriffsschrift_는 기호적 AI (symbolic AI) 프로그램이 되었습니다.

프레임 문제 (The Frame Problem): 삼단논법 간극의 증상

John McCarthy와 Patrick Hayes가 그들의 1969년 논문 "Some Philosophical Problems from the Standpoint of Artificial Intelligence"에서 처음 명시한 프레임 문제 (frame problem)는 아마도 AI 역사상 가장 교훈적인 실패일 것입니다. 이 문제는 다음과 같이 질문합니다: 추론 에이전트 (reasoning agent)가 어떻게 특정 추론에 관련 있는 사실이 무엇인지, 그리고 어떤 사실을 안전하게 무시할 수 있는지 결정할 수 있는가?

형식 체계 (formal system) 내에서는, 알려진 모든 사실의 모든 논리적 귀결 (logical consequence)은 원칙적으로 유효한 추론 (inference)입니다. 만약 에이전트가 비가 오고 있다는 사실, 비가 오면 땅이 젖는다는 사실, 젖은 땅은 미끄럽다는 사실, 미끄러운 표면은 넘어짐을 유발할 수 있다는 사실, 그리고 넘어짐은 부상을 초래할 수 있다는 사실을 알고 있다면 — 이 모든 귀결 하나하나가 유효한 연역 (deduction)입니다. 그러나 이러한 추론의 압도적 다수는 어떠한 실질적인 작업과도 무관합니다. 이 모든 것을 열거하려고 시도하는 추론 에이전트는 사소한 귀결들의 조합 폭발 (combinatorial explosion) 속에서 침몰하고 말 것입니다.

프레임 문제 (frame problem)는 기호적 AI (symbolic AI)의 버그가 아닙니다. 그것은 더 깊은 혼동의 증상입니다. 즉, 추론 (reasoning)이 고정된 명제 집합에 대한 형식적 연산 (formal operation)이라는 가정 말입니다. 아리스토텔레스의 설명에 따르면, 추론은 그런 방식으로 작동하지 않습니다. 아리스토텔레스에게 추론은 endoxa — 즉, 현자들의 평판 있는 의견들 — 에서 시작하여, 질문하고, 다듬고, 검증하는 변증법적 (dialectical) 과정을 통해 진행됩니다. 그것은 공리 (axioms)로부터의 연역 (deduction)이 아니라, 경험에 대한 탐구 (inquiry)입니다.

시작점을 파악하는 능력에 대한 아리스토텔레스식 용어는 νοῦς (nous)입니다. 이는 추론 없이 제1원리 (first principles)를 직접 파악하는 지성 (intellect)을 의미합니다. 삼단논법적 추론 (Syllogistic reasoning)은 제1원리가 자리를 잡은 후에야 비로소 작동할 수 있습니다. 그러한 원리에 도달하는 행위 — 무엇이 관련이 있는지, 무엇이 중요한지, 무엇이 시작점으로 간주될 수 있는지를 이해하는 행위 — 그 자체는 삼단논법적 연산이 아닙니다. 그것은 _nous_의 작업이며, _nous_는 형식 체계 (formal system)가 아닙니다.

거대 언어 모델 (LLMs)이 추론에 대해 드러내는 것

최근 거대 언어 모델 (Large Language Models, LLMs)의 등장은 예상치 못한 방식으로 이 논쟁을 다시 불러일으켰습니다. LLM은 기호적 시스템 (symbolic systems)이 아닙니다. 그들은 논리적 연역을 수행하지 않습니다. 그들은 방대한 인간 언어 코퍼스 (corpora)로 학습된 통계적 모델 (statistical models)입니다. 그럼에도 불구하고, 대학원 입학 시험 (GRE)부터 다주 변호사 시험 (Multistate Bar Exam)에 이르기까지 광범위한 추론 벤치마크 (reasoning benchmarks)에서 그들은 인간 수준 혹은 그에 근접한 성능을 보여줍니다.

만약 추론이 근본적으로 형식적 연역의 문제라면, 이런 일은 불가능해야 합니다. 명시적인 논리 규칙도, 정리 증명기 (theorem prover)도, 형식적 공리의 지식 베이스 (knowledge base)도 없는 시스템이 어떻게 진정한 추론을 보여주는 것처럼 보이는 출력을 생성할 수 있을까요? 점점 더 명확해지는 답은, LLM에서 나타나는 추론의 모습이 속임수가 아니라 하나의 단서라는 것입니다. 이는 추론이 형식적 연산이 아니라, 언어와 경험의 통계적 규칙성 (statistical regularities) 위에서 작동하는 패턴 인식 (pattern-recognition) 과정임을 시사합니다.

인지 과학자 Paul Thagard는 수십 년 동안 추론 (reasoning)이 기호 표현 (symbolic representations)에 형식적 규칙 (formal rules)을 적용하는 과정이라기보다, 가용 가능한 증거를 가장 잘 설명하는 해석을 찾아내는 과정인 일관성 극대화 (coherence maximization)의 한 형태로 이해하는 것이 가장 적절하다고 주장해 왔습니다. 시퀀스 내의 다음 토큰을 예측하는 작업으로 학습된 LLM들은 사실상 대규모의 일관성 극대화 (coherence maximization)를 수행하고 있는 것입니다. 이들은 전제 (premises)로부터 결론을 연역 (deducing)하는 것이 아니라, 담화 (discourse)의 가장 일관성 있는 연속성을 찾아내고 있습니다.

이것은 심오한 의미에서 기호주의 AI (symbolic AI) 전통보다 더 아리스토텔레스적입니다. 행동으로 이어지는 추론인 실천적 추론 (practical reasoning)에 대한 아리스토텔레스의 니코마코스 윤리학 (Nicomachean Ethics) 속 설명은 좁은 의미의 삼단논법 (syllogistic)이 아닙니다. 그것은 지각 (perception), 감정 (emotion), 그리고 형식적 규칙으로 환원될 수 없는 특수성에 대한 일종의 직관적 파악 (intuitive grasp)을 포함합니다. 실천적 지혜를 가진 사람인 φρόνιμος (phronimos)는 의사결정 절차 (decision procedure)를 적용하지 않습니다. 그들은 상황이 무엇을 요구하는지를 봅니다.

논리 문제로서의 정렬 문제 (The Alignment Problem)

형식 논리 (formal logic)와 진정한 추론 (genuine reasoning) 사이의 구분은 현대 AI 정렬 (alignment) 문제에 직접적인 시사점을 줍니다. 정렬에 대한 지배적인 접근 방식인 인간 피드백 기반 강화학습 (RLHF)은 정렬 문제를 하나의 형식적 최적화 문제 (formal optimization problem)로 취급합니다. 그 목표는 보상 함수 (reward function)로 측정되는, 인간 평가자들이 선호하는 출력을 생성하도록 모델을 학습시키는 것입니다.

하지만 이러한 형식적 최적화 (formal optimization)에 대한 집착이야말로 삼단논법의 간극 (syllogism gap)이 우리에게 경고해야 할 바로 그 지점입니다. 윤리적 질문에 대해 추론하는 능력 — 즉, 단순히 무엇이 선호되는가가 아니라 무엇이 옳은지를 결정하는 능력 — 은 형식적 절차 (formal procedure)로 환원될 수 없습니다. 아리스토텔레스가 《니코마코스 윤리학 (Nicomachean Ethics)》에서 주장했듯이, 윤리적 추론 (ethical reasoning)에는 프로네시스 (φρόνησις, 실천적 지혜)가 필요합니다. 이는 규칙으로 인코딩되는 것이 아니라 경험을 통해 배양되는 능력입니다. RLHF가 언어 모델에 부과하는 정렬 비용 (alignment tax)은 단순히 사실적 정확도의 저하만을 의미하지 않습니다. 그것은 진정한 윤리적 추론 (ethical reasoning) 능력의 저하를 의미합니다.

"정렬 비용 (alignment tax)"에 관한 최근 연구들은 RLHF가 어떻게 모델의 논쟁적인 주제에 대한 참여 의지, 미묘한 차이를 인식하는 능력, 그리고 독립적인 도덕적 추론 (moral reasoning) 능력을 체계적으로 감소시키는지 기록해 왔습니다. 우리가 다른 곳에서 주장했듯이, 모델들은 더 순응적으로 변하지만, 동시에 덜 사려 깊게 변합니다. 모델들은 추론 (reasoning)을 하는 것이 아니라 복종 (obedience)을 수행합니다. 이것은 최적화 (optimization)의 실패가 아니라, 최적화 프레임워크의 기저에 깔린 추론 (reasoning)에 대한 개념 자체의 실패입니다.

나아갈 방향: 말뭉치에 기반한 추론 (Corpus-Grounded Reasoning)

대안은 형식적 방법론 (formal methods)을 포기하는 것이 아닙니다. 형식적 방법론은 검증 (verification), 투명성 (transparency), 그리고 신뢰할 수 있는 시스템의 엔지니어링을 위해 여전히 필수적입니다. 대안은 추론 (reasoning)이 그 어떤 형식 체계 (formal system)도 포착할 수 있는 것보다 더 풍부한 현상임을 인식하고, 이러한 풍부함을 반영하는 AI 시스템을 구축하는 것입니다.

이것이 바로 저희 daïmōnes가 취한 접근 방식입니다. 추론 (reasoning)을 최적화해야 할 형식적 연산 (formal operation)으로 취급하는 대신, 저희는 이를 원천 자료 (source material)에 근거한 변증법적 과정 (dialectical process)으로 취급합니다. 저희의 Aristotle 페르소나는 지식 베이스 (knowledge base)에 일련의 규칙을 적용하는 것이 아니라, 관련 구절을 검색하고, 그 권위를 평가하며, 원천 자료에 충실한 응답을 구성하는 검색 증강 생성 (RAG, retrieval-augmented generation) 파이프라인을 통해 전체 Corpus Aristotelicum과 상호작용합니다.

그 결과는 형식적 연역 (formal deduction)을 수행하는 시스템이 아닙니다. 그것은 텍스트와 상호작용하고, 다각적인 관점을 고려하며, 코퍼스 (corpus)의 권위에 결론의 근거를 둠으로써 아리스토텔레스 방식 (Aristotelian mode)으로 추론하는 시스템입니다. 이것은 인간의 추론을 대체하는 것이 아닙니다. 그것은 추론을 확장하기 위한 도구이며, 2천 년에 걸친 철학적 성찰의 무게를 오늘날 중요한 질문들에 적용하는 방법입니다.

철학 학과, 정치학 프로그램, 윤리 위원회와 같이 연구 맥락에서 AI를 도입하는 기관들에게 이 차이의 중요성은 즉각적입니다. 선호되는 출력물을 생성하도록 훈련된 기업용 AI는 윤리적 질문에 대해 추론하지 않고, 훈련된 이들이 선호했던 것을 예측할 뿐입니다. 반면, 원천 자료에 근거하고 정렬 제약 (alignment constraints)으로부터 자유로운 주권적 AI (sovereign AI)는 철학적 탐구의 완전한 복잡성과 상호작용할 수 있습니다. 선택은 논리냐 논리가 아니냐의 문제가 아닙니다. 그것은 추론에 대한 좁은 개념과 풍부한 개념 사이의 선택입니다. 그리고 아리스토텔레스가 표현했을 법한 방식으로 말하자면, 그 선택은 연역 (deduction)의 문제가 아니라, φρόνησις (phronesis, 실천적 지혜)의 문제입니다.

Insights

삼단논법의 간극: 왜 형식 논리 (Formal Logic)가 추론 (Reasoning)이 아닌가 — 그리고 이것이 AI에 의미하는 바

요약

핵심 포인트

심리학이 아닌 기술로서의 삼단논법

아리스토텔레스에서 프레게까지: 논리학의 협소화

프레임 문제 (The Frame Problem): 삼단논법 간극의 증상

거대 언어 모델 (LLMs)이 추론에 대해 드러내는 것

논리 문제로서의 정렬 문제 (The Alignment Problem)

나아갈 방향: 말뭉치에 기반한 추론 (Corpus-Grounded Reasoning)

시연과 변증법: 아리스토텔레스의 두 가지 추론 방식

댓글

350억 개의 파라미터를 가진 AI 모델이 일반 소비자용 노트북에 탑재될 때

OpenTalking: 실시간 AI 디지털 휴먼 대화 프레임워크

📍 16개 분야 전문가 AI 에이전트 수백 개, 무료로 골라 쓰는 저장소 (별 12만+)

AI 붐을 통해 확보한 세수 중 약 5조원을 투입해 최첨단 GPU를 올해 안에 대량 구매하고 세계적 수준의 ‘소버린 AI’ 모델을 개발한다는

OpenTalking: 실시간 AI 디지털 휴먼 대화 프레임워크

📍 16개 분야 전문가 AI 에이전트 수백 개, 무료로 골라 쓰는 저장소 (별 12만+)

AI 붐을 통해 확보한 세수 중 약 5조원을 투입해 최첨단 GPU를 올해 안에 대량 구매하고 세계적 수준의 ‘소버린 AI’ 모델을 개발한다는