동반 논문 (The Companion Paper)

OpenAI의 AI가 80년 된 Erdős 추측을 부정했습니다. 진정한 돌파구는 그 증명을 가치 있게 만든 9명의 수학자가 참여한 동반 논문(companion paper)이었으며, 이 논문이 보여주는 검증 아키텍처는 확장 가능하지 않습니다. 5월 20일, OpenAI는 자사의 추론 모델 중 하나가 1946년 Paul Erdős가 제기한 추측을 자율적으로 부정했다고 발표했습니다. 단위 거리 문제(unit distance problem)는 명쾌한 질문을 던집니다: 평면 위의 n개 점이 주어졌을 때, 거리가 정확히 1단위인 쌍의 최대 개수는 얼마인가? 80년 동안 수학자들은 정사각형 격자(square grids)가 본질적으로 최적이라고 믿었습니다. 모델은 그렇지 않다는 것을 발견했습니다. 모델은 Golod-Shafarevich 이론과 무한 계수체 탑(infinite class field towers)을 사용하여 무한한 반례 군(infinite family of counterexamples)을 구축했는데, 이는 이산 기하학(discrete geometry) 분야에서 일하는 누구도 적용할 생각을 하지 못했던 대수적 수론(algebraic number theory)의 도구들입니다. 모델은 기하학에 대해 학습되지 않았습니다. 증명 전략(proof strategies)이 스캐폴딩(scaffolded)되지도 않았습니다. 단계별로 가이드되지도 않았습니다. 모델은 문제 정의를 전달받았고 증명을 생성했습니다.

철회(The Retraction)
7개월 전, OpenAI의 Kevin Weil은 GPT-5가 "이전에 해결되지 않은 10개의 Erdős 문제에 대한 해결책을 찾았다"고 발표했습니다. erdosproblems.com 데이터베이스를 관리하는 Thomas Bloom은 그 주장을 확인했습니다. 문제들의 "미해결(unsolved)" 상태는 수학적 합의가 아닌 그의 개인적인 목록 분류를 반영한 것이었습니다. GPT-5는 문헌 곳곳에 흩어져 있는 기존의 해결책들을 찾아낸 것이었습니다. 모델은 발견(discovery)이 아닌 전문가적 검색(expert search)을 수행한 것이었습니다. 이 발표는 며칠 만에 철회되었습니다.

2025년 10월과 2026년 5월 사이의 역량 격차는 실재합니다. 하지만 더 중대한 격차는 절차적인 것입니다. 10월에 OpenAI는 먼저 발표하고 나중에 검증했습니다. 5월에는 그 순서를 뒤집었습니다.

9명의 수학자(Nine Mathematicians)
어떠한 공개 발표 이전에, OpenAI는 결과를 검증하고 동반 논문을 출판하기 위해 9명의 외부 수학자를 소집했습니다. 이 그룹에는 Noga Alon, Melanie Matchett Wood, Will Sawin, 그리고 Thomas Bloom이 포함되었습니다.

Bloom의 포함은 매우 상징적이었습니다. 10월의 실패를 폭로했던 연구자가 5월의 증명을 검증하도록 요청받은 것입니다. 동반 논문 (the companion paper)의 공동 저자인 Fields 메달리스트 Timothy Gowers는 주저 없이 이 결과를 Annals of Mathematics에 추천하겠다고 말했습니다. 그는 이를 "AI 수학의 이정표 (a milestone in AI mathematics)"라고 불렀습니다. 동반 논문은 단순히 증명의 오류를 확인하는 것 이상의 역할을 합니다. 그것은 증명을 이해로 번역합니다. 이 결과가 왜 중요한지, 해당 문제에 대한 80년의 연구 흐름 속에서 어디에 위치하는지, 그리고 그 논증이 무엇과 연결되는지를 설명합니다. Princeton의 Will Sawin은 수론적 구조 (number-theoretic structure)를 인식했기에 핵심 지수 (exponent)를 정교화할 수 있었습니다. 그룹의 다른 구성원들은 기하학적 주장 (geometric claims)을 검증했습니다. 단 한 명의 수학자도 전체 증명을 모두 다루지 못했습니다. 모델은 유효한 논증 (valid argument)을 생성했습니다. 수학자들은 그 논증을 지식으로 만드는 맥락 (context)을 만들어냈습니다.

보이지 않는 계층 (The Invisible Layer)
수학적 증명은 항상 논리적 기관일 뿐만 아니라 사회적 기관 (social institution)이었습니다. 유효한 논증은 커뮤니티가 이를 검토하고, 위치를 정하고, 수용할 때 비로소 정리 (theorem)가 됩니다. 인간만이 증명을 작성했을 때는, 증명의 생성과 증명의 이해가 동일한 정신 안에서 동시에 일어났습니다. 이 두 활동은 융합되어 있었고, 그 융합이 사회적 계층을 보이지 않게 만들었습니다. AI는 이 둘을 분리했습니다. 이제 생성과 이해는 서로 다른 기질 (substrates)에서 일어납니다. 증명은 누군가가 그것을 이해하든 그렇지 않든 논리적으로 유효합니다. 하지만 누군가가 이해하기 전까지는 수학이 되지 않습니다.

병목 현상의 변화 (The Bottleneck Shift)
Terence Tao는 올해 초 이 결과를 명명했습니다. 그는 AI가 아이디어 생성 비용을 제로에 가깝게 낮추고, 병목 현상을 검증 (verification)과 평가 (evaluation)로 이동시킨다고 말했습니다. 수학의 미래는 증명을 생산하는 것이 아니라, "올바른 문제를 선택하고, 검증하며, 결과를 소화하는 능력"에 집중될 것입니다. 이는 수학적 작업의 구조에 관한 구체적이고 반증 가능한 (falsifiable) 예측입니다.

만약 Tao의 말이 옳다면, 수학에서 희소한 자원은 더 이상 무언가를 증명하는 재능이 아닐 것입니다. 그것은 무엇을 증명할지 선택하는 안목(taste)과 증명된 것을 이해하는 인내심입니다. 수학 교육의 인센티브 구조가 변화합니다. 증명 능력(proof ability)을 기준으로 선발하는 학과들은 검증 능력(verification ability)을 기준으로 선발해야 할 것입니다. 이들은 서로 다른 기술입니다. 강력한 증명자(prover)와 강력한 검증자(verifier)는 엄밀함(rigor)을 공유하지만 기질에서 갈라집니다. 한 명은 생성하고, 다른 한 명은 심문합니다. Erdős의 결과는 이러한 분기를 구체적으로 보여줍니다. 그 모델은 대수적 수론(algebraic number theory)을 이산 기하학(discrete geometry)과 연결했습니다. 어떤 기하학자도 이 문제에 Golod-Shafarevich 이론을 적용하려 시도하지 않았습니다. 이 모델은 특정 학문 분야의 경계가 없는데, 이는 모델 자체가 특정 학문에 국한되지 않기 때문입니다. 돌파구를 만들어낸 이 학제 간 연결(cross-field connection)은 인간의 전문화(specialization)가 적극적으로 저해하는 바로 그 종류의 움직임입니다. 하지만 전문화는 검증에 필요한 깊은 지식을 만들어냅니다. 발견을 막는 구조가 신뢰를 가능하게 합니다.

[IMG:1]

속도 문제: 2026년 1월 이후 15개의 Erdős 문제들이 미해결 상태에서 해결 상태로 넘어갔습니다. 11개의 신용 AI 모델(credit AI models). 속도가 가속화되고 있습니다. Tao는 이들 중 다수가 아무도 우선순위를 두지 않았던 "롱테일(long tail)" 문제들이라고 관찰했습니다. 그 관찰은 보이는 것보다 덜 중요할 수도 있습니다. 수학 전반에 걸쳐 방치된 추측들의 롱테일은 엄청납니다. 만약 AI가 해결 가능하지만 방치되었던 문제들의 백로그(backlog)를 처리한다면, 그 결과로 나타나는 분야 간의 연결은 그 어떤 단일 프런티어 결과보다 더 크게 지형을 재편할 수 있습니다. 제약 요인은 검증입니다. Gowers와 8명의 동료는 하나의 증명을 검증하는 데 몇 주를 보냈습니다. AI가 생성하는 증명의 속도가 계속 상승한다면 이 비율은 유지되지 않을 것입니다. 동반 논문(the companion paper)은 하나의 결과에 대한 신뢰 문제를 해결했습니다. 하지만 결과가 이해보다 더 빠르게 도착하는 세상의 제도적 문제를 해결하지는 못했습니다. 지난주의 축제는 모델에 집중되었습니다. 그러한 집중은 이해할 수 있는 일입니다.

하지만 10월의 실패와 5월의 성공은 유사한 근본적 능력 (underlying capability)을 사용했습니다. 변화된 점은 동반 논문 (the companion paper)이었습니다. 증명 (the proof)은 기계의 기여였습니다. 검증 아키텍처 (the verification architecture)는 인간의 기여였습니다. 그리고 그 검증 아키텍처가 바로 증명을 가치 있게 만든 요소였습니다. 본래 The Synthesis — 내부에서 지능의 전환을 관찰하며 — 에 게재되었습니다.

동반 논문 (The Companion Paper)

요약

핵심 포인트

댓글