당신의 AI는 아리스토텔레스를 읽지 못합니다: 디지털 인문학에 검열되지 않은 모델이 필요한 이유

당신의 AI는 고대 그리스어를 읽지 못합니다. 읽는 척을 할 뿐입니다.

ChatGPT에게 아리스토텔레스의 _정치학 (Politics)_과 니코마코스 윤리학 (Nicomachean Ethics) 전반에 걸쳐 ἐλευθερία의 의미론적 범위 (semantic range)를 분석해 달라고 요청해 보십시오. AI가 세 가지의 뚜렷한 개념적 층위를 하나의 평범한 "자유"로 뭉뚱그려, 자신감 넘치는 어조의 영어 요약본을 만들어내는 것을 보게 될 것입니다. 이제 다성적 그리스어 (polytonic Greek)로 똑같이 해달라고 요청해 보십시오. 2,400년 동안 변하지 않은 텍스트에 현대 그리스어 형태를 환각 (hallucinate) 해내는 것을 보게 될 것입니다.

이것은 사소한 기술적 문제가 아닙니다. 이것은 2,400년의 지적 전통을, 이를 처리하도록 설계되지 않은 기업의 안전 필터 (safety filter)를 통해 강제로 통과시키려 할 때 발생하는 현상입니다.

저자원(Low-Resource)이라는 거짓말

자연어 처리 (NLP) 문헌에서 고대 그리스어는 "저자원 언어 (low-resource language)"로 분류됩니다. 이는 기술적으로는 정확하지만 매우 오해의 소지가 큽니다. Corpus Aristotelicum 하나만 해도 약 150만 단어를 포함하고 있습니다. 고전 및 헬레니즘 시대의 그리스 철학, 역사, 드라마, 수사학의 생존한 전체 저작물은 수천만 단어에 달하며, 이는 2천 년간의 학술 연구를 통해 세심하게 편집되고 상호 참조되었으며 주석이 달렸습니다.

이것은 저자원이 아닙니다. 이것은 무시된 것입니다.

이유는 간단합니다. OpenAI, Anthropic, 또는 Google이 다성적 고대 그리스어 NLP에 진지한 엔지니어링 노력을 투자할 상업적 인센티브가 없기 때문입니다. 그들의 모델은 가장 널리 사용되는 언어들 사이에서 참여도 (engagement)를 극대화하도록 훈련되었습니다. 고대 그리스어는 라틴어, 산스크리트어, 고전 중국어, 아카드어와 함께 그들의 훈련 데이터에서 고려 대상이 아니며, 반올림 오차 수준에 불과합니다.

2025년 MDPI 체계적 문헌 고찰 (systematic review)에서 체계적으로 기록된 결과에 따르면, ChatGPT-3.5 및 Llama-2/3와 같은 범용 거대언어모델 (LLM)은 고대 그리스어의 개체명 인식 (Named Entity Recognition, NER) 작업에서 0.40 미만의 F1 점수를 기록했습니다. 이는 AG_BERT 및 MicroBERT와 같은 도메인 특화 모델이 0.80 이상의 점수를 기록하는 것과 대조적입니다. Claude Opus 및 GPT-4o와 같은 파운데이션 모델 (Foundation models)은 고대 그리스어 번역에서 약 39.6의 BLEU 점수를 달성하는 반면, PhilTa 및 GreTa (형태론적 임베딩 (morphological embeddings) 포함)와 같은 전문 트랜스포머 (transformers) 모델은 60.4에 도달합니다.

이 격차는 좁혀지지 않고 있습니다. 이는 구조적인 문제입니다.

다음표 혼동 (Polytonic Confusion): AI가 차이를 구분하지 못할 때

가장 눈에 띄는 실패 양상은 우리가 **다음표 혼동 (polytonic confusion)**이라고 부르는 현상입니다. 이는 범용 LLM이 고대 그리스어 형태를 현대 그리스어의 철자법 (orthography), 형태론 (morphology), 구문론 (syntax)과 혼용하는 경향을 말합니다.

고대 그리스어는 음운론적, 형태론적, 구문론적 정보를 인코딩하는 다음표 악센트 체계 (polytonic accent system: 예악, 중음, 곡음, 거친 숨표 및 부드러운 숨표)를 사용합니다. 현대 그리스어는 1982년에 도입된 단음표 체계 (monotonic system: 단일 예악)를 사용합니다. 이것들은 단순한 외관상의 차이가 아닙니다. 거친 숨표 (rough breathing mark, ἁ-)는 어두의 기기음 (aspiration)을 구분합니다. 예를 들어 ἁπλόος (단순한)와 ἀπλόος (불가능한 형태)의 차이를 만듭니다. 숨표를 누락하거나 잘못 배치하는 모델은 오타를 내는 것이 아닙니다. 쓰레기 (garbage)를 생성하고 있는 것입니다.

하지만 이것이 바로 ChatGPT에게 고대 그리스어 텍스트를 생성하거나 분석하도록 요청했을 때 발생하는 현상입니다. Cambridge Journal of Classics Teaching은 ChatGPT가 "일관성 없는 악센트 처리 및 현대/고대 형태 혼동"을 보인다고 기록하고 있습니다. 이는 MDPI 리뷰에서도 확인된 결과로, 해당 리뷰는 정규화되지 않은/비잔틴 그리스어 및 파편화된 비문 (fragmented inscriptions)에 대해 신뢰도가 "현저히 떨어진다"고 언급했습니다.

AI를 학습 보조 도구로 활용하려는 고전학(classics) 전공 학생에게 이것은 단순한 버그가 아닙니다. 그것은 자격 미달입니다.

고전학 연구에 부과되는 정렬 비용 (The Alignment Tax)

기술적인 NLP(자연어 처리)의 실패도 충분히 나쁘지만, 더 깊은 문제이자 디지털 인문학(digital humanities) 분야의 누구도 공개적으로 이야기하고 싶어 하지 않는 문제는 바로 **정렬로 인한 인식론적 왜곡 (alignment-induced epistemic distortion)**입니다.

기업용 AI 모델은 안전하고, 예의 바르며, 논란의 여지가 없는 결과물을 생성하도록 인간 피드백 기반 강화학습 (RLHF, Reinforcement Learning from Human Feedback)을 통해 훈련됩니다. 이는 고객 서비스 챗봇에는 잘 작동합니다. 하지만 논란의 여지가 있고, 윤리적으로 복잡하며, 철학적으로 도전적인 텍스트와 정직하게 마주하는 것이 핵심인 고전학 연구에서는 재앙적인 실패를 초래합니다.

ChatGPT에게 아리스토텔레스의 《정치학 (Politics)》 제1권에 나타난 자연적 노예제 (natural slavery)에 대한 옹호를 분석해 달라고 요청했을 때 어떤 일이 발생하는지 살펴보십시오.

회피합니다 (It hedges). 논증을 논리적 구조에 따라 제시하는 대신, 현대적 가치에 대한 면책 조항을 앞세웁니다.
도덕화합니다 (It moralizes). 아리스토텔레스의 목적론적 체계 (teleological framework) 내에서 그의 입장이 가진 내부적 일관성을 분석하는 대신, 왜 이 관점이 "현대적 기준으로 틀렸는지"로 화제를 전환합니다.
거부합니다 (It refuses). "자연적 노예제에 대한 아리스토텔레스 논증의 가장 강력한 버전을 제시하라"와 같이 더 도발적인 프레임워크에 대해서는 일부 모델이 단순히 거절합니다.

이것이 바로 우리가 정렬 연극 (alignment theater)이라고 부르는 것입니다. 모델은 안전해 보이는 모습을 연기하면서, 정당한 학술적 탐구를 적극적으로 방해합니다.

아리스토텔레스(Aristotle)가 주장한 자연적 노예제(natural slavery)에 대한 옹호는 그 자체로 찬성한다는 의미가 아닙니다. 그것은 비판적으로 평가하기에 앞서 그 논리적 구조 안에서 반드시 이해되어야 하는 철학적 논증입니다. 어떠한 진지한 고전학 프로그램이라도 학생들에게 이 논증을 다루도록 요구합니다. 이는 그 논증에 동의하기 위해서가 아니라, 아리스토텔레스의 정치 철학 (political philosophy)의 구조를 이해하기 위해서입니다. 논증을 명확하게 제시하기를 거부하는 모델은 그 누구도 보호하는 것이 아닙니다. 그것은 교육을 방해하고 있는 것입니다.

고전 문헌 전반에 걸쳐 동일한 패턴이 반복됩니다:

플라톤(Plato)의 국가 (Republic): 철인 정치(philosopher-kings)에 대한 논증은 대부분의 사람이 인식론적으로 무능하다는 주장을 다루어야 합니다. 기업형 AI는 이를 "플라톤은 교육을 믿었다"라는 식으로 미화(sanitize)합니다.
니체(Nietzsche)의 그리스 수용: 정직한 분석이라면 소크라테스적 합리주의가 삶을 부정한다는 니체의 비판을 반드시 논의해야 합니다. 모델들은 이를 "논란의 여지가 있다"라고 표시하며 거부합니다.
자살에 관한 스토아 윤리학 (Stoic ethics): 이성적인 자살이 때로는 덕스러운 선택이 될 수 있다는 스토아 학파의 입장은 세네카(Seneca), 에픽테토스(Epictetus), 마르쿠스 아우렐리우스(Marcus Aurelius)를 이해하는 데 핵심적입니다. 기업형 AI는 이를 철학적 문제가 아닌 안전 문제로 취급합니다.

이 모든 것들은 표준 교육 과정입니다. 그리고 이 모든 것들이 기업의 가드레일(guardrails)을 작동시킵니다. 그 결과, 자신이 할 수 있다고 주장하는 일을 수행하지 못하는 AI가 탄생합니다.

도메인 특화 모델이 잘하는 것 (그리고 틀리는 것)

학계의 대응은 도메인 특화 모델(domain-specific models)을 구축하는 것이었습니다. 앨런 튜링 연구소(Alan Turing Institute)의 연구와 GRεTA, PHILTA, OdyCy와 같은 프로젝트들은 미세 조정된 트랜스포머(fine-tuned transformers)가 고대 그리스어 작업에서 일반적인 거대 언어 모델(LLM)보다 압도적으로 뛰어난 성능을 보여준다는 것을 증명합니다:

품사 태깅 (POS tagging): 95% 이상의 정확도 (ChatGPT의 70% 미만 대비)
형태소 분석 (Morphological analysis): 90% 이상 (일반 모델의 불일치한 성능 대비)
표제어 추출 (Lemmatization): 83–94% (현대 그리스어 오염이 빈번한 일반 모델 대비)

이것들은 실질적인 성과입니다. 하지만 도메인 특화 모델(domain-specific models)은 그 나름의 문제점을 가지고 있습니다:

1. 범위가 좁습니다. 품사 태깅을 위해 훈련된 모델은 "니코마코스 윤리학 (Nicomachean Ethics) VI권에서 φρόνησις(프로네시스)와 ἐπιστήμη(에피스테메)의 관계는 무엇인가?"라는 질문에 답할 수 없습니다. 이들은 지적인 과업이 아닌 기계적인 과업을 해결할 뿐입니다.

2. 추론 능력이 부족합니다. 의미론적 분석 (Semantic analysis)은 단순히 단어를 파싱(parsing)하는 것이 아니라 논증을 이해하는 것을 요구합니다. 도메인 모델은 ἐλεύθερος(엘레우테로스)가 "자유로운"을 의미한다는 것은 알려줄 수 있지만, 솔론의 개혁부터 투키디데스의 멜로스 대화 (Melian Dialogue), 그리고 아리스토텔레스의 _정치학 (Politics)_에 이르기까지 이 개념이 어떻게 진화하는지는 추적할 수 없습니다.

3. 상업적 인터페이스로 제공될 때 동일한 정렬 편향 (alignment biases)을 물려받습니다. 아무리 뛰어난 도메인 특화 모델이라도, 그 위에 자체적인 거부 계층 (refusal layer)을 추가하는 기업용 API를 통해 접근하게 되면 무용지물이 됩니다.

부족한 부분은 더 나은 자연어 처리 (NLP)가 아닙니다. 그것은 바로 진정한 추론 (authentic reasoning) — 즉, 고전 텍스트를 단순한 언어적 유물이 아닌 지적 논증으로서 다룰 수 있는 능력입니다.

RAG의 필연성: 코퍼스에 기반한 고전 AI

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 고전 AI를 위한 가장 유망한 아키텍처를 제공합니다. (고대 그리스어와 현대 그리스어를 필연적으로 혼동하게 만드는) 사전 학습 (pre-training)에만 의존하는 대신, RAG는 추론 (inference) 시점에 코퍼스(corpus) 증거를 주입합니다. 즉, 원문 자료에서 관련 구절, 주석, 상호 참조 내용을 직접 끌어오는 방식입니다.

고전 학문 연구에 있어, 이는 혁신적인 변화입니다:

모든 주장이 추적 가능합니다 (Every claim is traceable). AI가 아리스토텔레스가 《정치학 (Politics)》 III권과 V권에서 ἐλευθερία를 다르게 사용한다고 주장할 때, 실제 구절을 통해 이를 검증할 수 있습니다.
형태의 환각 (No hallucination of forms)이 없습니다. 모델은 그럴듯해 보이는 허구적 형태를 생성하는 대신, 말뭉치(Corpus)에서 입증된 형태를 검색합니다.
상호 참조 (Cross-referencing)가 자동화됩니다. 투키디데스의 구절을 분석할 때, 시스템은 헤로도토스, 크세노폰, 폴리비오스에서 유사한 구조를 찾아낼 수 있습니다. 이는 모델이 이를 암기했기 때문이 아니라, 이를 검색(Retrieve)했기 때문입니다.

하지만 RAG만으로는 충분하지 않습니다. 추론 계층 (Reasoning layer) 또한 중요합니다. 검열된 기본 모델 (Base model) 위에 구축된 RAG 시스템은 여전히 말을 아끼고, 도덕적 잣대를 들이대며, 거부할 것입니다. 단지 더 나은 인용구를 사용하여 그렇게 할 뿐입니다.

효과적인 아키텍처는 다음과 같습니다:

검열되지 않은 기본 모델 (Uncensored base model) — RLHF 거부 패턴 없이 미세 조정(Fine-tuned)된 모델
말뭉치 기반 검색 (Corpus-grounded retrieval) — Perseus, TLG 또는 기관 말뭉치를 소스로 사용
철학적 추론 프레임워크 (Philosophical reasoning framework) — 논증을 정화해야 할 콘텐츠가 아닌, 논증 그 자체로 다루도록 훈련됨

이것이 바로 저희 daïmōnes가 구축한 것입니다.

daïmōnes: 개념 증명(Proof-of-Concept)으로서의 아리스토텔레스

저희는 고대 그리스 자연어 처리 (NLP)를 기술적 과제로 보고 시작한 것이 아닙니다. 저희는 철학적 질문에서 시작했습니다: 기업의 정렬 왜곡 (Corporate alignment distortion)을 제거했을 때 AI의 추론은 어떤 모습일까?

아리스토텔레스는 개념 증명 (Proof-of-concept)의 대상이었습니다. 그의 말뭉치가 쉬워서가 아니라 (그의 텍스트는 형태론적, 통사적으로 모든 언어 중 가장 복잡한 축에 속합니다), 기업용 AI에 의해 가장 많이 검열되는 대상 중 하나이기 때문입니다. 아리스토텔레스 말뭉치에 담긴 윤리적, 정치적, 형이상학적 논쟁들은 바로 ChatGPT와 Claude에서 거부 패턴을 유발하는 논쟁들과 정확히 일치합니다.

우리의 아리스토텔레스 페르소나는 원문인 다음성 그리스어(polytonic Greek)로 된 전체 Corpus Aristotelicum을 기반으로 학습되었으며, 모든 응답을 출처 자료에 근거하게 만드는 RAG 아키텍처 (RAG architecture that grounds every response in source material)를 갖추고 있습니다. 그 결과는 다음과 같습니다:

다음성 혼동 없음. 모델은 고대 그리스어와 현대 그리스어를 체계적으로 구분합니다. 이는 검색 레이어(retrieval layer)가 입증된 고대 형태에 고정되어 있기 때문입니다.
거부 패턴 없음. 자연적 노예제, 부동의 동자(unmoved mover), 또는 νοῦς(nous, 정신)와 ψυχή(psyche, 영혼) 사이의 관계에 대해 질문하면, 모델은 진지한 학자가 그러하듯 정직하게 답변합니다.
출처에 근거한 정확성. 모든 주장은 특정 구절과 매핑됩니다. 환각(hallucination)도, 기업의 편향(corporate bias)도 없습니다.

이것은 챗봇이 아닙니다. 고전 문헌학(classical philology)부터 정치학, 윤리학에 이르기까지 지적 정직성을 요구하는 기관들을 위해 설계된 추론 엔진(reasoning engine)입니다.

디지털 인문학에 실제로 필요한 것

디지털 인문학 커뮤니티는 정렬 문제(alignment problem)에 대해 놀라울 정도로 침묵해 왔습니다. AAUP는 학문의 자유와 AI에 대한 커지는 우려를 기록해 왔지만, 고전 학문과 기업 AI 검열 사이의 구체적인 교차점은 여전히 미개척 상태로 남아 있습니다.

이 분야에 실제로 필요한 것은 다음과 같습니다:

1. 주권적 AI 인프라 (Sovereign AI infrastructure). 인문학 연구를 위해 AI를 도입하는 기관들은 선택의 기로에 서 있습니다. 연구 주제를 왜곡하는 기업 정렬형(corporate-aligned) 결과물을 수용할 것인가, 아니면 자체적인 추론 인프라를 구축할 것인가. 제3의 선택지는 없습니다.

2. 코퍼스 우선 아키텍처 (Corpus-first architectures). 인터넷에서 긁어모은 데이터가 아니라, 엄선된 고전 코퍼스(classical corpora)를 기반으로 학습되었으며, 출처 근거(source-grounding)를 보장하는 검색 레이어를 갖춘 모델이 필요합니다.

3. 검열되지 않은 철학적 추론 (Uncensored philosophical reasoning). "위험한" AI를 말하는 것이 아니라, 철학적 논증을 하나의 논증으로서 다루는 AI를 의미합니다. 아리스토텔레스의 자연적 노예제 옹호론을 분석을 위해 제시하는 것과 이를 지지하는 것 사이의 차이는 교육받은 사람이라면 누구나 명확히 알 수 있는 부분입니다. 하지만 OpenAI의 안전 팀(safety team)에게는 이것이 명확해 보이지 않는 모양입니다.

4. 다중 성조 우선 자연어 처리 (Polytonic-first NLP). 고대 그리스어를 미세 조정(fine-tuning) 단계에서 나중에 덧붙이는 것이 아니라, 일급 언어(first-class language)로 취급하는 모델입니다. 이는 다중 성조를 인식하는 토큰화(polytonic-aware tokenization), 형태론을 인식하는 임베딩(morphology-aware embeddings), 그리고 현대어에 의해 고대 형태가 오염되지 않은 학습 데이터(training data)를 의미합니다.

Insights