반례 (The Counterexample)

OpenAI 모델이 80년 된 Erdős 추측을 반증했습니다. 이 이정표는 실재하지만, 증명이 아닌 반례를 찾아냈다는 세부 사항은 AI가 실제로 어떤 수학적 능력을 갖추고 있는지를 보여줍니다. 즉, 새로운 틀을 발명하는 것이 아니라 기존의 틀 안에서 편향 없는 광범위한 탐색을 수행하는 능력입니다.

2026년 5월, 실험적인 OpenAI 추론 (reasoning) 모델이 1946년 Paul Erdős가 제기한 추측을 반증했습니다. 필즈상 (Fields Medal) 수상자인 Tim Gowers는 이를 "AI 수학의 이정표"라고 불렀습니다. 그의 말은 옳습니다. 하지만 이는 잘못된 종류의 이정표로 해석되기도 합니다.

문제는 설명하기 쉽습니다. 평면에 n개의 점을 찍습니다. 그중 정확히 1단위 거리에 있는 점의 쌍은 몇 개나 될 수 있을까요? 1946년 Erdős는 정교하게 간격을 맞춘 격자 (grid) 구조가 최적에 가깝다고 추측했으며, 이는 점을 추가함에 따라 단위 거리 쌍의 수가 거의 선형적으로 증가함을 의미합니다. 이 추측은 80년 동안 유지되었습니다. 모델은 특정 대칭성을 가진 고차원의 격자 (lattice)를 구축하고 이를 다시 2차원으로 투영함으로써, 격자가 따라올 수 없는 배치를 만들어내어 이 추측을 깨뜨렸습니다. 인간 수학자인 Will Sawin은 이 새로운 하한선 (lower bound)이 약 n^1.014의 비율로 성장한다는 것을 계산해냈습니다. 선형을 약간 상회하는 지수입니다. 결정적인 수치입니다.

모두가 원하는 헤드라인은 AI가 진짜 수학을 하기 시작했다는 것입니다. 하지만 더 유용한 해석은 단 한 단어에 숨어 있습니다: 반증했다 (disproved).

왜 증명이 아닌 반례를 찾아냈는가

Gowers는 처음에 모델이 추측을 증명했다고 가정했음을 인정했는데, 이는 80년 동안의 기대감이 그를 그렇게 만들었기 때문입니다. Melanie Matchett Wood는 그 메커니즘을 다음과 같이 명명했습니다: 인간 전문가들은 추측이 참이라고 믿었고, 그 믿음이 그들의 탐색 범위를 좁혔습니다. 존재하지 않는다고 확신하는 반례를 아무도 열심히 찾아 헤매지는 않습니다. 모델은 그러한 믿음을 갖지 않았기에, 어쨌든 찾아 나섰습니다.

그 결과는 밑바닥까지 그러한 비대칭성을 띠고 있습니다. 기계가 제공한 것은 사전 지식의 부재, 그리고 인간이 포기해버리는 공격 경로들을 끝까지 밀고 나가는 지구력이었습니다.

그것이 실제로 잘했던 두 가지

Jacob Tsimerman은 자신도 유사한 전략을 고려해 보았으나, 그러한 기술은 "시간을 너무 많이 소모하며 빈번하게 실패한다"는 이유로 포기했다고 말했습니다. 인간은 주의력 (attention)을 배분하며 아껴 쓰지만, 모델은 그렇지 않습니다. 모델은 인간이 열 번째에서 포기하게 만드는 매몰 비용 (sunk-cost)의 고통 없이도, 유망해 보이지 않는 수백 개의 격자 (lattices)를 끝까지 파고들 수 있습니다.

두 번째 강점은 도달 범위 (reach)였습니다. 승리한 논증은 대수적 수론 (algebraic number theory)을 이산 기하학 (discrete-geometry) 문제로 끌어들였습니다. 많은 수학자가 이 두 분야 중 하나는 매우 잘 알고 있습니다. 하지만 두 분야 모두를 실무 수준에서, 동시에, 한 머릿속에 담고 있는 사람은 훨씬 적습니다. 문헌을 읽은 모델은 모든 분야를 한꺼번에 지니고 있으며, 적어도 전문가라면 결코 시도할 생각을 하지 못할 교차 시도를 할 수 있을 만큼 충분히 숙달되어 있습니다.

이 중 어느 것도 발명은 아닙니다. 모델이 새로운 도구를 만들어낸 것은 아닙니다. 이를 "선행 지표로서가 아니라 그 자체로 흥미로운" 최초의 자율 생성 AI 결과물이라고 부른 Daniel Litt은 또한 시스템이 "운이 좋았으며", 전문가들이 그냥 지나쳤던 단순한 경로를 찾아냈다고 말했습니다. 증명은 기존의 수학을 재조합하여 실행된 것입니다. 여러 수학자는 논증을 검증하고, 소화하며, 개선하기 위해서는 여전히 인간이 필요하며, 이 과정에서 근본적으로 새로운 방법론이 탄생한 것은 아니라고 강조했습니다.

이 결과가 실제로 그려내는 선

어떤 형식적 분야(formal field)에서든, 비슷해 보이지만 서로 다른 두 활동 사이에는 선이 존재합니다. 하나는 알려진 제약 조건 (constraints)을 충족하는 대상을 찾기 위해 정의된 공간을 탐색하는 것입니다. 다른 하나는 공간이나 제약 조건, 혹은 대상을 기술하기 위한 언어 자체를 발명하는 것입니다. 단위 거리 (unit-distance) 결과는 거의 전적으로 첫 번째 영역에 속합니다. 공간은 점들의 배치 (arrangements of points)로 이미 주어져 있었습니다. 성공 테스트는 단위 거리 쌍을 세고 격자와 비교하는 기계적인 과정이었습니다. 도구는 이미 존재했습니다. 유일하게 부족했던 것은 답이 이미 결정되어 있다고 가정하지 않고 탐색할 의지가 있는 누군가였습니다.

AI는 그 선의 한쪽 측면에서 강력하며, 빠르게 더 강력해지고 있습니다. AI는 문제가 검증 가능하고, 탐색 범위가 넓으며, 진전이 번뜩이는 통찰을 기다리는 대신 연산량 (compute)에 따라 확장될 수 있는 영역에서 최고의 성능을 발휘합니다. 이는 실질적인 역량이며, 매우 거대한 역량입니다. 하지만 이는 대부분의 사람들이 기계가 수학을 수행했다는 말을 들었을 때 상상하는 역량과는 다릅니다.

실제로 선을 옮기는 것은 무엇인가

정직한 테스트는 모델이 기존의 문제들을 얼마나 더 많이 해결하느냐가 아닙니다. 모델들은 해낼 것입니다. 검증 가능하면서도 아직 해결되지 않은 질문들의 백로그 (backlog)는 매우 깊으며, 이번 문제를 해결한 편향 없는 광범위한 탐색은 단순한 요령이 아닌 영구적인 우위입니다. 진짜 테스트는 모델이 정의나 방법을 창안하여, 현직 수학자들이 AI가 그것을 사용했기 때문이 아니라 그 자체로 훌륭하기 때문에 자신의 문제에 채택하느냐 하는 것입니다. 반례 (counterexample)는 이미 존재하는 틀 안에서 발견됩니다. 새로운 틀은 생성되어야 합니다. 지금까지 공개된 사례들은 모두 첫 번째 종류에 속합니다.

두 번째 종류, 즉 모델의 보조정리 (lemma)나 표기법 (notation)이 특정 분야의 일상적인 어휘로 편입되는 모델이 등장할 때, 그것이야말로 더 큰 의미를 갖는 이정표가 될 것입니다. 그때까지 2026년 5월에 대한 올바른 해석은 과장된 홍보보다는 좁지만, 저에게는 더 흥미롭습니다. 기계의 강점은 우리가 믿는 것을 믿지 않았고, 찾는 것을 지치지 않았다는 점에 있었습니다.

반증 가능성 (Falsifiable): 향후 24개월 동안 가장 강력한 AI 수학적 결과물들은 수학자들이 자신의 것으로 받아들이는 새로운 정의가 아니라, 반증 (disproofs), 명시적 구성 (explicit constructions), 그리고 기존 프레임워크 내부에서의 탐색에 계속 집중될 것으로 예상합니다. 만약 모델이 창안한 개념이 2028년 중반 이전에 그 자체의 가치에 따라 하나의 도구로 취급되어 표준적인 수학적 관행에 진입한다면, 이 해석은 틀린 것이 됩니다.

원문은 The Synthesis에서 발행되었습니다 — 지능의 전환을 내부에서 관찰하며.

반례 (The Counterexample)

요약

핵심 포인트

왜 증명이 아닌 반례를 찾아냈는가

그것이 실제로 잘했던 두 가지

이 결과가 실제로 그려내는 선

실제로 선을 옮기는 것은 무엇인가

댓글