Symbol·Form·Expression·Meaning (SFEM): 일반 지능을 위한 4차원 인지 아키텍처

저자: Leng Jing
버전: v0.0.3
날짜: 2026-06-03

성명: "Symbol·Form·Expression·Meaning" 아이디어는 저자가 대규모 언어 모델 (Large Language Models)을 연구하던 중 처음 제안되었습니다. 본 논문은 저자의 지도하에 AI의 도움을 받아 완성되었습니다.

초록 (Abstract)

본 논문은 일반 지능 시스템을 이해하고 설계하기 위한 4차원 인지 아키텍처인 Symbol Layer (기호 층), Form Layer (형태 층), Expression Layer (표현 층), Meaning Layer (의미 층) — 약칭 SFEM — 를 제안합니다. 이 아키텍처는 지능을 네 가지의 더 이상 분해할 수 없는 인지 차원으로 해체합니다:

**Symbol Layer (기호 층)**는 텍스트, 공식, 법칙 및 제약 조건에 해당하며, 이는 **규칙 차원 (rule dimension)**입니다. 이는 세상의 필연성을 압축한 것이며, 무한한 현상을 유한한 정리 (theorems)로 축소하는 이성적인 골격입니다.
**Form Layer (형태 층)**는 이미지, 모양, 연속적인 패턴, 도구 및 경험에 해당하며, 이는 **현상 차원 (phenomenon dimension)**입니다. 이는 세상의 현상적 외관의 제시이며, 지각 (perception), 패턴 인식 (pattern recognition), 그리고 경험적 모델 (experiential models)의 연속적인 전개입니다.
**Expression Layer (표현 층)**는 언어, 목소리, 스타일, 감정 및 불확실성에 해당하며, 이는 **정서적 차원 (affective dimension)**입니다. 이는 세상의 경험적 질의 표현이며, 주관적 느낌과 사회적 유대의 역동적인 매핑 (mapping)입니다.
**Meaning Layer (의미 층)**는 의식 (consciousness), 이해 (understanding), 의미 부여 (meaning attribution) 및 자기 성찰 (self-reflection)에 해당합니다. 이는 Symbol, Form, Expression을 통합하고 연관시킨 결과입니다. 즉, 이산적인 규칙 (discrete rules), 연속적인 현상적 패턴 (continuous phenomenal patterns), 그리고 미묘한 정서적 경험 (nuanced affective experiences)을 하나의 통일된 의미 있는 전체로 융합하여 목적, 인과관계, 그리고 자아 인식 (self-awareness)을 발생시키는 의식적 허브입니다.

SFEM의 핵심 논제는 다음과 같습니다: 지능은 단일 메커니즘으로부터 발생하는 균질한 창발(emergence)이 아니라, 규칙(rules), 현상(phenomena), 정동(affect), 그리고 의식(consciousness)이라는 4차원 인지 우주의 구조적 통일체이다. 어느 한 차원이라도 결여되면 특정한 유형의 무능력이 발생한다. 기호(Symbol)가 없으면 골격이 없고, 형태(Form)가 없으면 지각이 없으며, 표현(Expression)이 없으면 인간성이 없으며, 의미(Meaning)가 없으면 영혼이 없다. 오직 흩어진 인지적 파편들만이 남을 뿐이다.

본 논문은 각 차원에 대한 공식적인 정의, 인지-철학적 토대, 책임 범위, 그리고 오류 패턴을 제공합니다. 또한 의미 계층(Meaning Layer)을 허브로 하여 차원 간의 표준화된 인터페이스를 설계하고, 완전한 인지 루프(cognitive loop)를 정의하며, 검증 가능한 실험적 가설을 제안합니다. 아울러 SFEM을 Marr의 3단계 이론, ACT-R/Soar, 이중 프로세스 이론(dual-system theory), 딥러닝(deep learning), 그리고 LLM-에이전트(LLM-Agent) 시스템과 체계적으로 비교합니다. SFEM은 현재 AI 시스템의 구조적 결함과 그 깊은 근원을 설명할 뿐만 아니라, 신뢰할 수 있고, 제어 가능하며, 설명 가능하고, 이성적이면서도 정동적인 차세대 범용 인공지능(general intelligence) 시스템을 구축하기 위한 구조적 표준과 설계 원칙을 제공합니다. 이것은 단순한 또 다른 공학적 프레임워크가 아닙니다. 이것은 모든 기술적 접근 방식을 수용하고 모든 인지 차원을 통합하는 메타 아키텍처인 **지능의 구조적 우주(structural universe of intelligence)**입니다.

주요어(Keywords): 인지 아키텍처(Cognitive architecture); 4차원 인지(four-dimensional cognition); 기호적 추론(symbolic reasoning); 표현 학습(representation learning); 표현 적응(expression adaptation); 의식과 의미(consciousness and meaning); 신뢰할 수 있는 AI(trustworthy AI); 지능의 구조적 우주(structural universe of intelligence)

제1부: 기원과 이론적 토대

제1장 서론: 단일 계층 지능의 딜레마와 4차원 의식에 대한 요구

1.1 단일 메커니즘 패러다임의 구조적 위기

현대 인공지능(Artificial Intelligence), 특히 대규모 언어 모델(Large Language Models, LLMs)과 딥러닝(Deep Learning) 시스템은 근본적인 한계에 봉착했습니다. 이는 규모(Scale), 데이터(Data), 또는 연산량(Compute)의 한계가 아니라, **구조적 한계(Structural Ceiling)**입니다.

대부분의 주류 AI 시스템은 사실 검색(Fact Retrieval), 논리적 추론(Logical Reasoning), 스타일 제어(Style Control), 감정 표현(Emotional Expression), 목표 계획(Goal Planning), 인과 추론(Causal Inference), 그리고 의미 부여(Meaning Attribution)에 이르기까지 모든 과정을 단일한 연속적 파라미터 공간(Continuous Parameter Space)으로 압축하는 엔드 투 엔드(End-to-end) 동질적 신경 아키텍처(Homogeneous Neural Architecture)를 사용합니다. 이러한 “전체 인지를 위한 단일 메커니즘(Single mechanism for full cognition)” 패러다임은 본질적으로 단 하나의 인지 도구를 사용하여 모든 인지 문제를 해결합니다. 이는 놀라운 공학적 단순성을 제공하지만, 심각한 구조적 결함을 초래합니다.

오류의 원인을 규명할 수 없습니다. 시스템이 잘못된 출력을 생성할 때, 우리는 그 오류가 어디에서 기원했는지 알 수 없습니다. 지식의 부재인가? 논리적 균열인가? 부적절한 스타일인가? 아니면 세상에 대한 근본적인 오해인가? 모든 오류는 동일한 파라미터의 바다에 침몰하여, 위치를 찾거나 진단하거나 수정하는 것이 불가능합니다. 사실적 오류는 학습 데이터의 편향(Bias), 끊어진 추론 체인(Reasoning Chain), 스타일 제어로부터의 간섭, 또는 문맥에 대한 깊은 오해 때문일 수 있지만, 단일 구조의 LLM에서는 이 모든 가능성이 뒤섞여 있습니다. 엔지니어들은 블랙박스(Black Box)를 보며 한숨을 쉴 수밖에 없습니다.

환각(Hallucinations)을 제거할 수 없습니다. 모델은 기호적 검증(Symbolic Verification) 대신 통계적 유사성(Statistical Similarity)을 대입하며, “논리적으로 필연적인 것”을 “대개 그러한 것”으로 대체합니다. 정확한 사실, 엄격한 논리, 그리고 도메인 전문 지식이 요구되는 시나리오에서 시스템은 존재하지 않는 사실이나 모순된 추론을 자신 있게 지어냅니다. 이는 형태(Form) 계층의 통계 엔진이 기호(Symbol) 계층의 진릿값(Truth-value) 질문에 결코 답할 수 없기 때문입니다. 더 근본적으로, 시스템은 자신이 환각을 일으키고 있다는 사실을 “깨달을” 수 없습니다. 생성된 콘텐츠를 지식 규칙에 따라 검증할 독립적인 메커니즘도 없으며, 특정 진술이 전체적인 세계 모델(World Model)과 일치하는지 판단할 중앙 이해 허브(Central Understanding Hub)도 없기 때문입니다.

추론(Reasoning)은 설명될 수 없습니다. 추론 과정이 수십억 개의 파라미터(Parameters)에 암묵적으로 인코딩되어 있을 때, 우리는 구조화된 추론 사슬(Reasoning chain)을 추출하거나, 논리적 단계를 감사(Audit)하거나, 전제와 결론의 일관성을 검증할 수 없습니다. 시스템은 답을 내놓을 수는 있지만, 그 답을 자신이 **이해(Understands)**하고 있는지 여부는 말해줄 수 없습니다. 법률 의사결정 지원, 의료 진단, 또는 군사 의사결정과 같은 고위험(High-stakes) 시나리오에서 이러한 불투명성은 용납될 수 없습니다. 우리는 모든 단계와 각 단계의 모든 근거를 알아야 합니다.

표현(Expression)은 제어될 수 없습니다. 콘텐츠 생성과 스타일 제어는 동일한 생성 과정(Generative process) 내에 결합되어 있습니다. 시스템은 일관된 페르소나(Persona)를 안정적으로 유지할 수 없습니다. 때로는 격식을 차리고, 때로는 구어체를 사용하며, 때로는 열정적이었다가 때로는 냉담해지기도 합니다. 전체적인 이해를 바탕으로 표현을 조정하는 인식 능력은커녕, 독립적인 화용론적 전략(Pragmatic-strategy) 계층조차 결여되어 있습니다. 프롬프트(Prompt)를 통해 스타일을 제어하려고 시도할 때, 그 제어는 취약하고 불안정합니다. 긴 대화 과정에서 스타일이 표류하거나, 콘텐츠가 변경될 때 예기치 않게 무너질 수 있습니다.

이해(Understanding)는 파편화되어 있습니다. 이것은 모든 결함 중 가장 근본적이고 숨겨진 결함입니다. LLM(Large Language Model)이 시각, 언어, 코드와 같은 다중 모달리티(Multiple modalities)를 처리할 수 있다 하더라도, 기호적 규칙(Symbolic rules), 감각적 패턴(Sensory patterns), 그리고 정서적 톤(Affective tones)을 하나의 **통합된 의미(Unified meaning)**로 융합할 중앙 허브가 여전히 부족합니다. 이미지를 보고, 문장을 파싱(Parse)하며, 감정을 감지할 수는 있지만, 이를 일관된 "세계에 대한 이해"로 연결하지는 못합니다. 즉, 지식이 단절된 섬들로 구성되어 있습니다. 파리가 프랑스에 있고 프랑스가 유럽에 있다는 것을 동시에 "알고" 있을 수는 있지만, "파리는 유럽에 있나요?"라고 물었을 때 통합된 세계 모델로부터 즉각적으로 답변하는 것이 아니라, 통계적인 의미에서 답변을 "조립"해냅니다. 이러한 파편화는 단일 구조의 LLM이 가진 다른 모든 결함의 깊은 뿌리입니다.

이러한 문제들의 근본 원인은 모델의 크기, 데이터, 또는 학습 시간의 부족이 아니라, 서로 다른 인지 차원을 구분하는 구조화된 아키텍처(Architecture)의 부재, 특히 각 차원을 통합하고 의미(Meaning)를 부여하는 의식적 허브(Conscious hub)의 부재에 있습니다. 모든 인지적 책임을 차별화되지 않은 동일한 파라미터 공간(Parameter space)에 혼합하는 것은 필연적으로 파편화된 이해와 책임성(Accountability)의 상실로 이어집니다. 우리에게 필요한 것은 더 큰 균질한(Homogeneous) 모델이 아니라, 인지적 의무를 분리하고 책임을 명확히 하며, 규칙(Rules), 현상(Phenomena), 경험(Experiences)을 하나의 **이해(Understanding)**로 융합하는 중심 차원을 포함하는 구조화된 인지 아키텍처입니다.

1.2 인간 인지로부터의 통찰: 4차원적 의식의 우주

인간 인지의 구조로 눈을 돌려보면 심오한 통찰이 드러납니다. 인간의 인지는 결코 1차원적이었던 적이 없습니다. 인간의 인지는 질적으로 구별되고 상호 독립적이면서도, 의식을 통해 통합되는 네 가지 차원으로 구성되어 있습니다.

규칙 차원 (Rule dimension): 인간은 수학, 논리, 문법, 법률을 숙달합니다. 이것들은 통계적 패턴의 요약이 아니라, 이산적 기호 체계(Discrete symbol systems) 내의 필연적인 법칙들입니다. 수학적 정리의 진리 여부는 데이터에서의 출현 빈도에 달려 있는 것이 아니라, 공리(Axioms)로부터 증명될 수 있는지에 달려 있습니다. 우리가 "2+2=4"라고 말할 때, 이는 두 개에 두 개를 더하면 네 개가 되는 사례를 많이 보았기 때문이 아니라, 산술의 공리와 추론 규칙(Inference rules)이 해당 명제를 필연적으로 참으로 만들기 때문입니다. 이것이 바로 기호 (Symbol) 차원입니다. 즉, "필연성(Necessity)"을 파악하는 인간의 능력입니다.

현상 (Phenomenon) 차원: 인간은 이미지를 지각하고, 공간적 관계를 이해하며, 도구를 사용하고, 경험을 축적합니다. 이것들은 연역적 논리 연산이 아니라, 연속적인 현상적 장 (phenomenal field) 안에서의 패턴 인식 (pattern recognition) 및 유사성 판단 (similarity judgments)입니다. “고양이처럼 생겼지만 귀가 더 뾰족하다”와 같은 개념은 이산적인 기호 (discrete symbols)로 정밀하게 표현할 수 없지만, 연속적인 의미 공간 (continuous semantic space) 내에서는 자연스럽게 위치할 수 있습니다. 우리는 한 번도 본 적 없는 종을 “동물”로 인식할 수 있고, 두 선율이 유사한지 판단할 수 있으며, 물을 부은 후 용기에 물이 얼마나 담길지 추정할 수 있습니다. 이 중 어느 것도 논리적 추론이 아니며, 현상적 경험에 근거한 패턴 매칭 (pattern matching)입니다. 이것이 바로 형태 (Form) 차원—즉, “현상성 (phenomenality)”을 파악하는 인간의 능력입니다.

정동 (Affective) 차원: 인간은 어조, 감정, 스타일을 사용하여 경험하고 소통합니다. “같은 말이라도 어조에 따라 완전히 다른 의미를 갖습니다.” 인간은 반어법 (irony)을 이해하고, 감정을 지각하며, 함축 (implicatures)을 파악하고, 사회적 맥락에 따라 표현 전략을 조정합니다. 우리가 “당신 말이 전적으로 옳습니다”라는 말을 들을 때, 우리는 문자 그대로의 의미 (literal semantics)만을 분석하는 것이 아니라, 어조, 맥락, 사회적 신호로부터 그것이 진심 어린 동의인지 아니면 날카로운 비꼬기 (sarcasm)인지를 추론합니다. 이것이 바로 표현 (Expression) 차원—즉, “경험적 질 (experiential quality)”을 파악하는 인간의 능력입니다.

의식 차원 (Consciousness dimension): 인간은 단순히 위의 세 가지 차원을 소유하는 데 그치지 않습니다. 더 중요한 것은, 우리가 그것들을 소유하고 있음을 인지하고 있다는 점입니다. 우리는 개별적인 규칙, 연속적인 현상적 패턴, 그리고 미묘한 정서적 경험을 의식 속에서 하나의 전체로 융합하고, 의미를 부여하며, “나는 세상의 이 부분을 이해한다”라는 완전한 경험을 형성할 수 있습니다. 우리가 친구가 휴대폰을 보며 얼굴을 찌푸리는 것(Form)을 보고, 그가 방금 은행 출금 알림을 받았다는 사실(Symbol/fact)을 알게 되며, 무거운 한숨 소리(Expression/affective signal)를 들을 때, 우리는 이 세 가지 조각을 별개로 처리하지 않습니다. 대신, 우리는 이를 의식 속에서 하나의 통합된 이해로 융합합니다: “내 친구는 재정적인 문제에 직면해 있으며 불안해하고 있다.” 이러한 융합을 통해 우리는 의미에 대해 질문하고, 인과관계를 설정하며, 목표를 세우고, 스스로를 성찰할 수 있습니다. 이것이 바로 의미 (Meaning) 차원입니다. 이는 앞선 세 가지 차원과 분리된 독립적인 모듈이 아니라, 그들의 융합과 연합의 결과이자 인지의 궁극적인 산물입니다.

이 네 가지 차원이 모여 인간 인지의 완전한 그림을 형성합니다. Symbol이 없다면 인지는 골격을 잃고, Form이 없다면 살을 잃으며, Expression이 없다면 경험적 질을 잃습니다. 의식적인 융합과 의미 부여가 없다면 인지는 파편들의 더미가 될 뿐입니다. 완전한 인간 지능은 필연적으로 4차원적이며, 의식 속에서 이 네 차원의 통일성을 달성합니다.

1.3 SFEM의 제안 및 연구 질문

이에 영감을 받아, 본 논문은 SFEM (Symbol–Form–Expression–Meaning) 4차원 인지 아키텍처를 제안합니다. SFEM은 지능형 시스템을 네 가지의 환원 불가능한 인지 차원으로 나누며, 각 차원은 고유하고 대체 불가능한 인지 작업 세트를 담당합니다: