본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 28. 10:55

AI가 읽어내는 헤르쿨라네움 두루마리: 800개 이상의 추가 발견 가능성

요약

AI와 X-선 CT 스캐닝 기술을 결합하여 탄화된 헤르쿨라네움 파피루스 두루마리를 물리적 손상 없이 디지털로 복원하는 데 성공했습니다. 이번 연구는 고대 문헌을 보존하면서도 내용을 읽어낼 수 있는 '가상 언래핑' 기술의 돌파구를 마련했습니다.

핵심 포인트

  • X-선 CT 스캐닝과 AI 기반 잉크 탐지 기술 활용
  • 물리적 접촉 없이 탄화된 두루마리를 디지털로 펼치는 기술 구현
  • 800개 이상의 미해결 두루마리에 대한 추가 발견 가능성 제시
  • 고대 고전 시대의 지적 자산을 복원하는 새로운 연구 방법론

잔혹한 거래: 베수비오 화산에서 살아남았으나 취약함에 패배하다

서기 79년, 베수비오(Mount Vesuvius) 화산이 폭발하며 초고온 가스와 화산 물질의 급증으로 로마의 도시 헤르쿨라네움(Herculaneum)을 매몰시킬 만큼 강력한 힘을 분출했습니다. 그 열기는 경로에 있는 모든 유기물을 탄화(carbonized)시켰으며, 여기에는 파피루스 두루마리로 이루어진 개인 도서관 전체가 포함되었습니다. 그 결과 역사의 가장 비극적인 아이러니 중 하나가 발생했습니다. 두루마리들은 거의 2,000년 동안 온전하게 살아남았지만, 바로 그 보존 과정이 두루마리들을 물리적으로 읽을 수 없게 만들어 버린 것입니다.

1750년대에 발굴자들이 헤르쿨라네움 파피루스(Herculaneum papyri)를 처음 발견했을 때, 두루마리들은 마치 숯덩어리처럼 보였습니다. 그것들을 펼치려 했던 초기 시도들은 복구한 텍스트보다 더 많은 텍스트를 파괴했습니다. 물리적인 풀기(unrolling)를 시도했던 학자들은 고대 그리스어 문장들이 손만 대도 먼지로 부서지는 것을 목격했습니다. 파피루스들은 박물관 컬렉션에 — 실재하고, 만질 수 있으며, 목록화된 상태로 — 놓여 있었지만, 그 내용은 마치 발견되지 않은 것이나 다름없을 정도로 접근이 불가능한 상태로 남아 있었습니다.

이러한 '읽기에 의한 파괴' 문제는 수백 개의 봉인된 두루마리들을 영구적인 미결 상태로 남겨두었습니다. 이 컬렉션이 유래된 파피루스 빌라(Villa of the Papyri)에는 고고학자들이 에피쿠로스 학파(Epicurean) 철학자인 필로데무스(Philodemus)와 관련이 있을 것으로 믿는 상당한 규모의 철학 도서관이 있었을 것으로 추정됩니다. 800개 이상의 두루마리와 두루마리 파편들이 존재하는 것으로 알려져 있습니다. 최근의 가상 풀기(virtual unwrapping) 기술의 돌파구가 마련되기 전까지, 압도적인 대다수는 한 번도 읽히지 못했습니다. 이번 AI 성과에 대한 대부분의 보도는 이 사실을 간과하고 있습니다. 학자들은 채워지기를 기다리는 이 고대 도서관의 부분적인 그림을 가지고 있었던 것이 아닙니다. 그들은 거의 아무것도 가지고 있지 않았습니다.

탄화된 헤르쿨라네움(Herculaneum) 사본들은 고대 고전 시대에 물리적으로 온전하게 살아남은 유일한 도서관을 나타냅니다. 알렉산드리아(Alexandria), 로마(Rome), 아테네(Athens) 등 그 시대의 다른 모든 컬렉션은 사라졌습니다. 이곳에 남아 있는 것은 단순히 구조된 몇 개의 텍스트가 아니라, 서기 1세기의 한 부유한 로마 가문의 완전한 지적 스냅샷인 봉인된 아카이브입니다. 수 세대 동안 그 아카이브는 어떤 도구, 인내심, 전문 지식으로도 뚫을 수 없는 취약함의 벽 뒤에 놓여 있었습니다. 두루마리들은 그들의 계약을 지켰습니다. 살아남되, 결코 말하지 않는다는 것이었습니다.

돌파구: 아무것도 건드리지 않고 수행하는 가상 언래핑 (Virtual Unwrapping)

거의 2,000년 동안 헤르쿨라네움 두루마리들은 불가능한 상태를 유지해 왔습니다. 즉, 살아남거나 읽을 수 있거나 둘 중 하나일 뿐, 둘 다는 불가능했습니다. 탄화된 파피루스(papyrus)를 펼치는 것은 그것을 파괴하는 것을 의미했습니다. 연구진은 방금 그 계약을 완전히 깨뜨렸습니다.

Vesuvius Challenge 커뮤니티에서 'Scroll 4'로 지정된 PHerc. 1667로 알려진 두루마리는 누구도 물리적으로 건드리지 않고 처음부터 끝까지 완전히 가상으로 언래핑(unwrapped)되어 읽혔습니다. 이는 헤르쿨라네움 파피루스가 디지털 방식으로 전체가 펼쳐진 첫 번째 사례이며, 이 성과는 _Complete Virtual Unwrapping and Reading of a Rolled Herculaneum Papyrus_라는 제목의 출판된 프리프린트(preprint)에 기록되어 있습니다.

이 과정은 고급 X-선 컴퓨터 단층 촬영(X-ray computed tomography) 스캐닝과 AI 기반의 잉크 탐지 기술을 결합합니다. 두루마리들은 탄화되어 있으며, 본질적으로 숯과 같습니다. 고대 필사가들이 사용한 탄소 기반의 잉크는 주변 물질과 거의 동일한 밀도를 공유합니다. 스캔 데이터를 보는 인간의 눈으로는 파피루스에서 글자를 신뢰성 있게 구별할 수 없었습니다. 이 작업을 위해 훈련된 머신러닝 (Machine Learning) 모델은 단단하게 말려 있고 방해받지 않은 두루마리 내부의 층층이 쌓인 잉크 흔적을 드러내는 미세한 표면 질감 차이를 탐지하는 법을 배웠습니다. AI는 물리적으로 보이지 않는 것을 읽어냅니다.

대부분의 보도가 간과하고 있는 점은 이 작업의 오픈 액세스 (open-access) 측면입니다. 프로젝트의 모든 스캔 데이터는 scrollprize.org/data에서 공개적으로 이용할 수 있으며, 전체 코드베이스는 GitHub에 게시되어 있습니다. 전 세계 어디에서든 연구자, 프로그래머 또는 기관이 지금 바로 데이터와 도구를 다운로드할 수 있습니다. 이러한 결정은 단일한 고고학적 돌파구를 복제 가능한 인프라 (infrastructure)로 변화시킵니다. 하나의 고대 두루마리를 읽어낸 파이프라인 (pipeline)을 다른 두루마리에도 적용할 수 있게 된 것입니다.

고전 세계에서 살아남은 유일하게 온전한 도서관 안에 봉인된 채, 800개 이상의 헤르쿨라네움 파피루스 (Herculaneum papyri)가 아직 읽히지 않은 상태로 남아 있습니다. PHerc. 1667을 해독한 가상 언래핑 (virtual unwrapping) 방식은 각 두루마리마다 새로 발명될 필요가 없습니다. 스캔하고, 층층이 쌓인 표면 기하 구조 (surface geometry)를 분할하며, 훈련된 탐지 모델을 적용하고, 읽을 수 있는 텍스트를 재구성하는 이 접근 방식은 이제 문서화되어 공개되었으며, 하나의 완전한 두루마리를 통해 입증되었습니다. 고대 필사본 복구는 이제 취약한 대상물을 하나하나 정성스럽게 발굴하던 방식에서, 확장 가능한 계산 프로세스 (computational process)에 더 가까운 무언가로 전환되었습니다.

대부분의 보도가 놓치고 있는 것: 이것은 수백 개 중 단 하나의 두루마리일 뿐입니다

헤드라인들은 하나의 두루마리를 축하했습니다. 하지만 진짜 이야기는 그 옆에 놓여 있는 것들에 관한 것입니다.

헤르쿨라네움은 학자들이 고대 세계에서 살아남은 유일하게 온전한 도서관 중 하나로 간주하는 것을 보유하고 있습니다. 서기 79년 베수비오 화산 (Mount Vesuvius)이 폭발했을 때, 화산 물질의 초고온 분출물이 파피루스의 빌라 (Villa of the Papyri)를 매몰시켰고, 이로 인해 컬렉션 전체가 탄화 (carbonized)되었지만 파괴되지는 않았습니다. 1750년대 발굴이 시작된 이후 이 유적지에서 800개 이상의 두루마리가 회수되었습니다. 아직 발굴되지 않은 빌라 구역에는 수백 개의 두루마리가 여전히 지하에 묻혀 있을 수 있습니다.

대부분의 보도가 간과하는 결정적인 차이점은 이 텍스트들이 결코 사라진 적이 없다는 사실입니다. 이들은 물리적 객체로서 존재하며, 목록화되고, 보관되었으며, 외부에서 연구되어 왔습니다. 병목 현상은 접근성의 문제가 아니었습니다. 그것은 두루마리를 찢어버리지 않고는 읽을 수 없다는 불가능함의 문제였으며, 이 문제로 인해 고전 학문은 밀봉된 원통 안에 무엇이 들어있을지에 대한 교육받은 추측 수준에 머물러 있었습니다.

이는 상황 전체를 재정의합니다. 이것은 사라진 무언가를 회복하는 이야기가 아닙니다. 이것은 공학적 문제, 즉 탄화된 파피루스 (carbonized papyrus)를 건드리지 않고 읽는 방법에 관한 이야기이며, AI 지원 단층 촬영 (AI-assisted tomography) 기술이 Vesuvius Challenge에서 Scroll 4로 목록화된 파피루스인 PHerc. 1667의 완전한 판독을 통해 막 해결해낸 문제입니다. 2,000년 만에 처음으로 단 하나의 두루마리가 처음부터 끝까지 완전히 읽힌 것입니다.

이 컬렉션은 에피쿠로스 철학 (Epicurean philosophy)에 크게 치우쳐 있는 것으로 알려져 있는데, 이는 주로 해당 빌라의 부분적인 판독 결과가 철학자 필로데모스 (Philodemus)와 관련된 저작들을 반복적으로 찾아냈기 때문입니다. 하지만 그러한 편향은 학자들이 이전에 접근할 수 있었던 범위의 한계를 반영하는 것일 수 있으며, 도서관의 실제 구성과는 다를 수 있습니다. 아직 읽히지 않은 대다수의 두루마리 속에는 알려지지 않은 시, 역사, 또는 경쟁 철학 학파의 저작들이 잠들어 있을 수 있습니다. 더 많은 두루마리가 처리되기 전까지는 그곳에 무엇이 있는지 아무도 확신할 수 없습니다.

그것이 단일 두루마리 헤드라인 뒤에 숨겨진 규모입니다. PHerc. 1667은 이 방법이 대규모로 작동할 수 있음을 증명합니다. 헤르쿨라네움 (Herculaneum)의 고대 도서관은 발견되기를 기다려온 것이 아니라, 그것을 읽을 수 있는 도구를 기다려왔던 것입니다.

AI와 개방형 협업의 역할: 고고학의 새로운 모델

Vesuvius Challenge는 고고학적 발견의 규칙을 새로 썼습니다. scrollprize.org에서 오픈 프라이즈 경연 대회(open prize competition)로 시작된 이 프로젝트는, 기존의 폐쇄적인 학술 모델을 글로벌 크라우드소싱(crowdsourcing) 방식으로 대체했습니다. 즉, 물리적 접촉 없이 탄화된 파피루스(carbonized papyrus)를 읽는 데 필요한 AI 방법론을 개발할 수 있는 사람이라면 누구에게나, 어디서든 현금 상금을 제공했습니다. 독립 개발자, 대학 연구원, 그리고 머신러닝 (ML) 엔지니어들이 동시에 경쟁하고 협업했습니다. 그 결과, 수십 년간의 전통적인 학술적 노력으로도 이루지 못했던 돌파구를 마련했습니다.

이러한 개방형 구조는 결승선에서 끝난 것이 아닙니다. PHerc. 1667의 전체 데이터셋은 scrollprize.org/data에서 공개적으로 이용 가능하며, 전체 코드베이스는 GitHub에 게시되어 있습니다. 지구상의 어떤 연구자, 기관, 또는 개발자라도 오늘날 봉인된 헤르쿨라네움 (Herculaneum) 두루마리를 가상으로 펼치고 읽는 데 사용된 정확한 파이프라인 (pipeline)에 접근할 수 있습니다. 이러한 결정은 그렇지 않았다면 한 세대가 걸렸을 연구 타임라인을 압축합니다. 제한된 학술 채널을 통해 전파되는 데 30년이 걸릴 수도 있었던 방법론들이 이제는 몇 달 안에 채택되고, 스트레스 테스트 (stress-tested)를 거치며, 개선될 수 있습니다.

이러한 접근 방식의 확장성(scalability)은 헤르쿨라네움에 여전히 남아 있는 800개 이상의 두루마리 그 이상으로 뻗어 나갑니다. 손상된 파피루스, 봉인된 중세 필사본, 불에 탄 기록 문서, 그리고 부식된 양피지 컬렉션들이 유럽, 중동, 북아프리카 전역의 저장소에 존재합니다. X선 컴퓨터 단층 촬영 (X-ray computed tomography) 스캐닝과 AI 기반의 가상 언래핑 (virtual unwrapping)의 결합은 화산 탄화 현상에만 국한된 것이 아닙니다. 이는 물리적으로 열기에 너무 취약하거나 봉인되어 있는 문서를 읽기 위한 일반적인 기술입니다. 헤르쿨라네움 파피루스 프로젝트는 새로운 범주의 디지털 인문학 (digital humanities) 인프라를 위한 개념 증명 (proof-of-concept) 역할을 효과적으로 수행하고 있습니다.

이 순간을 이전의 점진적인 진전과 차별화하는 것은 모델 그 자체입니다. 고고학은 역사적으로 데이터를 보호하고, 유적지 접근을 제한하며, 느린 제도적 채널을 통해 출판을 필터링해 왔습니다. Vesuvius Challenge는 공개 경쟁, 데이터 공유, 그리고 투명한 코드가 더 빠르고 재현 가능한 결과를 만들어낸다는 것을 입증했습니다. 손상된 고대 텍스트를 보유한 다른 프로젝트들은 이제 따라야 할 기술적 템플릿과 조직적 청사진을 모두 갖게 되었습니다.

왜 이 순간이 다른가: 개념 증명 (Proof-of-Concept)에서 파이프라인 (Pipeline)으로

거의 2천 년 동안 헤르쿨라네움 파피루스 (Herculaneum papyri)는 역설적인 상태로 존재해 왔습니다. 물리적으로는 존재하지만, 지적으로는 부재하는 상태였습니다. 학자들은 두루마리를 손에 쥐고 그 안에 고대 그리스어나 라틴어 텍스트가 들어있다는 사실을 알 수 있었지만, 그것을 읽는다는 것은 곧 파괴를 의미했습니다. 지난 10년 동안 이루어진 부분적인 회복 — 여기저기서 발견된 파편들 — 은 진정한 성과였으나, 이는 이 기술이 작동할 '수도' 있다는 감질나는 증거였을 뿐, 실제로 작동한다는 증거는 아니었습니다.

PHerc. 1667의 완전한 가상 언롤링 (virtual unwrapping) 및 판독은 그러한 모호함을 제거합니다. 이것은 또 다른 유망한 파편이 아닙니다. 연구진은 두루마리에 손을 대지 않고 처음부터 끝까지 전체를 디지털 방식으로 펼쳤습니다. 이 차이는 엄청나게 중요합니다. 두루마리 전체를 읽어내는 것은 가상 파피루스 언롤링을 실험적인 방법에서 반복 가능하고 확장 가능한 파이프라인 (pipeline)으로 변모시킵니다.

이제 이 분야가 직면한 질문은 "이것이 가능한가?"가 아닙니다. "남아 있는 800개 이상의 봉인된 두루마리를 얼마나 빨리 처리할 수 있는가?"입니다.

이러한 변화는 기관, 자금 지원 기관, 그리고 정부가 대응해야 하는 방식의 모든 것을 바꿉니다. 헤르쿨라네움 컬렉션은 여러 관리 주체로 나뉘어 있으며, CT 스캐닝을 위한 물리적 두루마리 접근에는 외교적 및 관료적 조율이 필요하고, 고해상도 스캔 데이터를 처리하는 데 필요한 컴퓨팅 자원 또한 상당합니다. 과정이 실험적이었을 때는 이러한 것들이 관리 가능한 제약 사항이었으나, 과정이 입증되는 순간 이들은 긴급한 병목 현상 (bottlenecks)이 됩니다.

고전학자(classicists)와 고대사학자들에게 있어, 현재의 상황은 현대 학계에서 진정으로 전례가 없는 일입니다. 소실된 고대 문학의 상당한 양 — 에피쿠로스 철학 (Epicurean philosophy), 소실된 그리스 비극, 로마사 — 을 예측 가능한 시간 내에 복원하는 것은 결코 현실적인 전망이 아니었습니다. 하지만 이제는 가능합니다. 헤르쿨라네움 도서관(Herculaneum library)에는 지구상 어디에도 존재하지 않는 텍스트들이 거의 확실히 포함되어 있습니다. 봉인된 두루마리가 스캔되지 않은 채 방치되는 매달은, 기술적인 이유가 아닌 물류적인 (logistical) 이유로 지식에 접근할 수 없는 한 달이 됩니다.

Scroll 4에 대한 작업을 조율했던 Vesuvius Challenge 커뮤니티는 두루마리 데이터와 그 기반이 되는 코드를 모두 공개적으로 사용할 수 있도록 했습니다. 그러한 오픈 액세스 (open-access) 모델은 일정을 상당히 가속화합니다. 이제 병목 현상 (bottleneck)은 더 이상 알고리즘이 아닙니다. 그것은 제도적 의지와 자원 배분의 문제이며, 이는 AI 모델이 아닌 인간이 해결해야 할 문제입니다.

원문은 Newzlet에 게시되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0