OpenAI 모델, 이산 기하학의 핵심 추측을 반증하다

거의 80년 동안 수학자들은 겉보기에는 단순해 보이는 질문을 연구해 왔습니다. 평면에 점들을 배치할 때, 정확히 일정한 거리에 있는 점의 쌍은 최대 몇 개까지 존재할 수 있는가 하는 문제입니다.

이것은 1946년 Paul Erdős가 처음 제기한 평면 단위 거리 문제 (planar unit distance problem)입니다. 이는 조합 기하학 (combinatorial geometry)에서 가장 잘 알려진 질문 중 하나로, 설명하기는 쉽지만 해결하기는 놀라울 정도로 어렵습니다. Brass, Moser, Pach가 저술한 2005년 저서 Research Problems in Discrete Geometry는 이를 “조합 기하학에서 아마도 가장 잘 알려진 (그리고 설명하기 가장 쉬운) 문제”라고 부릅니다. Princeton의 선도적인 조합론자인 Noga Alon은 이를 “Erdős가 가장 좋아했던 문제 중 하나”라고 설명합니다. Erdős는 이 문제를 해결하는 사람에게 상금까지 제안하기도 했습니다.

오늘 우리는 단위 거리 문제에 대한 획기적인 돌파구를 공유합니다. Erdős의 독창적인 연구 이후, 아래에 묘사된 “정사각형 격자 (square grid)” 구조가 단위 거리 쌍의 수를 최대화하는 데 본질적으로 최적이라는 것이 지배적인 믿음이었습니다. OpenAI의 내부 모델이 이 오래된 추측을 반증하였으며, 다항식 수준의 개선을 가져오는 무한한 예시 군 (infinite family of examples)을 제공했습니다. 이 증명은 외부 수학자 그룹에 의해 검증되었습니다. 그들은 또한 논증을 설명하고 결과의 중요성에 대한 추가적인 배경과 맥락을 제공하는 동반 논문을 작성했습니다.

이 결과는 그것이 발견된 방식 또한 주목할 만합니다. 이 증명은 수학을 위해 특별히 훈련되었거나, 증명 전략을 탐색하도록 설계된 스캐폴딩 (scaffolding) 시스템, 또는 단위 거리 문제를 특정하여 겨냥한 시스템이 아닌, 새로운 범용 추론 모델 (general-purpose reasoning model)로부터 나왔습니다. 첨단 모델이 최첨단 연구 (frontier research)에 기여할 수 있는지 테스트하려는 광범위한 노력의 일환으로, 우리는 Erdős 문제 모음집을 통해 모델을 평가했습니다. 이 경우, 모델은 미해결 문제를 해결하는 증명을 만들어냈습니다.

이 증명은 수학 및 AI 커뮤니티에 있어 중요한 이정표입니다. 이는 수학의 한 하위 분야에서 핵심적인 위치를 차지하는 저명한 미해결 문제가 AI에 의해 자율적으로 해결된 첫 사례입니다. 또한 이는 이러한 시스템들이 현재 지원하는 추론(reasoning)의 깊이를 입증합니다. 수학은 추론을 위한 특히 명확한 테스트베드(testbed)를 제공합니다. 문제는 정밀하며, 잠재적인 증명은 검증 가능하고, 긴 논증은 처음부터 끝까지 추론이 일관되게 유지될 때만 유효하기 때문입니다. 문제가 해결된 방식 또한 주목할 만합니다. 이 증명은 대수적 수론(algebraic number theory)의 예상치 못한 정교한 아이디어들을 기초적인 기하학적 질문에 적용했습니다.

필즈상(Fields medalist) 수상자인 Tim Gowers는 동반 논문(companion paper)에서 이 결과를 “AI 수학의 이정표”라고 불렀습니다. 저명한 수론학자 Arul Shankar에 따르면, “내 생각에 이 논문은 현재의 AI 모델이 단순히 인간 수학자들의 조력자를 넘어, 독창적이고 독창적인 아이디어를 가질 수 있으며, 이를 결실로 이끌어낼 능력이 있음을 보여준다”라고 합니다.

증명은 여기(새 창에서 열림)에서 확인할 수 있습니다. 저명한 외부 수학자들이 작성한 동반 논문은 여기(새 창에서 열림)에서 확인할 수 있습니다. 모델의 사고 사슬(chain of thought) 요약본은 여기(새 창에서 열림)에서 찾을 수 있습니다.

재조정된 정사각형 격자(rescaled square grid)로부터 많은 단위 거리(unit distances)를 얻는 기존에 알려진 구성 방식.

$u(n)$를 평면 상의 점들 사이에서 가능한 최대 단위 거리(unit-distance) 쌍의 수라고 하자. 선형 성장률(linear growth rate)을 달성하는 예시는 구성하기 쉽다. 점들을 직선상에 배치하면 $n/2$개의 쌍을 얻고, 정사각형 격자(square grid)를 사용하면 약 $n$개의 쌍을 얻는다. 이전에 가장 잘 알려진 구성 방식인 재조정된 정사각형 격자(rescaled square grid)로부터의 구성은 이보다 더 많은 $n^{1+c/\log \log n}$개의 쌍을 제공하는 것으로 밝혀졌다. 여기서 $c$는 상수이다. $n$이 커짐에 따라 $\log \log n$이 무한대로 발산하므로, 지수의 추가 항은 0으로 수렴하며, 이는 이러한 구성들이 선형보다 아주 약간 더 빠른 성장만을 달성함을 의미한다. 수십 년 동안 이 속도가 본질적으로 가능한 최선의 속도이며, 어떤 구성도 정사각형 격자보다 유의미하게 개선할 수 없다고 널리 믿어져 왔다. 기술적인 용어로, Erdős는 추가 항 $\epsilon(n)$이 $n \to \infty$일 때 0으로 수렴하는 $n^{1+\epsilon(n)}$의 상한(upper bound)을 추측했다.

우리의 새로운 결과는 이 추측을 반증한다. 더 정확하게는, 무수히 많은 $n$의 값에 대해, 본 증명은 어떤 고정된 지수 $\delta > 0$에 대하여 적어도 $n^{1+\delta}$개의 단위 거리 쌍을 갖는 점들의 구성을 구성한다. (원래의 AI 증명은 명시적인 $\delta$를 제공하지 않지만, Princeton 대학교 수학 교수인 Will Sawin의 향후 개선 연구에 따르면 $\delta = 1/100$로 잡을 수 있음이 밝혀졌다.)

이 문제의 역사를 살펴보면 왜 이 결과가 놀라운지 이해하는 데 도움이 된다. 가장 잘 알려진 하한(lower bound)은 Erdős의 원래 1946년 구성 이후 본질적으로 변하지 않았다. 가장 좋은 상한인 $n^{4/3}$은 1984년 Spencer, Szemerédi, Trotter의 연구로 거슬러 올라가며, 이후 Székely, Katz와 Silier, Pach, Raz, Solymosi 및 다른 이들에 의한 후속 개선 및 관련 구조적 연구에도 불구하고, 상한은 본질적으로 변하지 않은 채 유지되어 왔다. 이 추측을 지지하는 증거로서, Matoušek과 Alon-Bucić-Sauermann은 평면에서의 비유클리드 거리(non-Euclidean distances)를 이용해 이 문제를 연구했으며, 이러한 비유클리드 거리의

놀랍게도, 이 구성의 핵심 요소는 대수적 수론 (algebraic number theory)이라 불리는 수학의 매우 다른 분야에서 비롯되었습니다. 대수적 수체 (algebraic number fields)라고 알려진 정수의 확장체 내에서의 인수분해 (factorization)와 같은 개념을 연구하는 분야입니다.

초기 증명을 검증한 후, 우리는 다양한 양의 테스트 시간 연산 (test-time compute)에 따른 이 문제에 대한 모델들의 성공률을 조사했습니다. 그 결과는 여기에 표시되어 있습니다.

거시적인 관점에서 보면, 이 증명은 익숙한 기하학적 아이디어로 시작하여 이를 예상치 못한 방향으로 밀어붙입니다.

Erdős의 원래 하한 (lower bound)은 가우스 정수 (Gaussian integers)를 통해 이해될 수 있습니다. 가우스 정수는 $a + bi$ 형태의 수로, 여기서 $a$와 $b$는 정수이며 $i$는 $\sqrt{-1}$입니다. 가우스 정수는 일반적인 정수를 확장하며, 정수와 마찬가지로 소수로의 유일 인수분해 (unique factorization)와 같은 성질을 가집니다. 이러한 일반 정수 또는 유리수의 확장을 대수적 수체 (algebraic number fields)라고 합니다. 새로운 논증은 가우스 정수를 대수적 수론의 더 복잡한 일반화로 대체하며, 이는 훨씬 더 많은 단위 길이 차이 (unit-length differences)를 만들어낼 수 있는 더 풍부한 대칭성을 가집니다.

정밀한 논증은 무한 계급체 타워 (infinite class field towers) 및 Golod–Shafarevich 이론과 같은 도구들을 사용하여, 논증에 필요한 수체 (number fields)가 실제로 존재함을 보여줍니다. 이러한 아이디어들은 대수적 수론 학자들에게는 잘 알려진 것이었으나, 이러한 개념들이 유클리드 평면 (Euclidean plane)에서의 기하학적 질문들에 함의를 갖는다는 사실은 매우 놀라운 일이었습니다.

이 결과는 AI와 수학 사이의 상호작용에 있어 중요한 순간을 기록합니다. 즉, AI 시스템이 활발한 연구 분야의 중심에 있는 오래된 미해결 문제 (open problem)를 자율적으로 해결한 것입니다. 또한 이는 AI와 인간 수학자 사이의 새로운 형태의 협업을 미리 보여줍니다. 이 사례의 경우, 외부 수학자들의 동반 연구는 원래의 솔루션 단독보다 실질적으로 더 풍부한 그림을 그려냅니다.

Thomas Bloom이 동반 노트에서 썼듯이:

“AI가 생성한 증명의 중요성과 영향력을 평가할 때, 제가 스스로에게 던지는 질문은 이것입니다: 이것이 해당 문제에 대해 우리에게 새로운 무언가를 가르쳐 주었는가? 이제 우리가 이산 기하학 (discrete geometry)을 더 잘 이해하게 되었는가? 제 생각에 그 대답은 완만한 '예'입니다. 이는 정수론적 구성 (number theoretic constructions)이 이러한 종류의 질문들에 대해 우리가 의심했던 것보다 훨씬 더 많은 것을 말해줄 수 있다는 점을 보여줍니다. 더욱이, 여기에 필요한 정수론 (number theory)은 매우 깊이 있을 수 있습니다. 의심할 여지 없이 많은 대수적 정수론자 (algebraic number theorists)들이 향후 몇 달 동안 이산 기하학의 다른 미해결 문제들을 면밀히 살펴볼 것입니다.”

이 솔루션에 의해 드러난 대수적 정수론 (algebraic number theory)과 이산 기하학 (discrete geometry) 사이의 예기치 않은 연결은 이 결과가 주목할 만한 이유 중 하나입니다. 이는 단순히 특정 추측 (conjecture)을 해결하는 데 그치지 않고, 수학자들이 관련 문제를 더 깊이 탐구하기 시작할 수 있는 가교를 제공할 수 있습니다.

Bloom은 또한 더 넓은 가능성을 시사합니다:

“지식의 경계는 매우 뾰족하며, 의심할 여지 없이 향후 몇 달, 몇 년 동안 AI가 예기치 않은 연결 고리를 드러내고 기존의 기술적 메커니즘 (technical machinery)을 한계까지 밀어붙임으로써 오랜 미해결 문제들이 해결되는, 수학의 다른 많은 분야에서도 유사한 성공 사례들을 보게 될 것입니다. AI는 우리가 수 세기에 걸쳐 구축해 온 수학이라는 대성당을 더 온전하게 탐험할 수 있도록 돕고 있습니다. 무대 뒤에는 또 어떤 보이지 않는 경이로움이 기다리고 있을까요?”

이 결과는 유망한 사례를 제공합니다. 즉, AI가 단순히 솔루션만을 제공하는 것이 아니라, 이후 인간의 이해를 통해 그 중요성이 더욱 명확하고 풍부해지는 수학적 발견에 기여한다는 점입니다.

이 결과가 주는 교훈은 이 특정 결과보다 더 큽니다. 더 나은 수학적 추론 (mathematical reasoning)은 AI를 더 강력한 연구 파트너로 만들 수 있습니다. 즉, 어려운 사고의 흐름을 유지하고, 서로 멀리 떨어진 지식 영역 간의 아이디어를 연결하며, 전문가들이 우선순위를 두지 않았을 수도 있는 유망한 경로를 표면화하고, 그렇지 않았다면 다루기에 너무 복잡하거나 시간이 많이 걸렸을 문제들에 대해 연구자들이 진전을 이룰 수 있도록 돕는 존재가 될 수 있습니다.

그러한 능력은 수학을 넘어 다른 분야에서도 중요합니다. 만약 모델이 복잡한 논증을 일관되게 유지하고, 서로 멀리 떨어진 지식 영역 간의 아이디어를 연결하며, 전문가의 검토를 견뎌낼 수 있는 결과물을 만들어낼 수 있다면, 이는 생물학, 물리학, 재료 과학, 공학 및 의학 분야에서도 유용한 능력이 될 것입니다. 또한 이는 과학자와 엔지니어가 더 많은 아이디어를 탐색하고 더 어려운 기술적 질문을 추구할 수 있도록 돕는 시스템, 즉 더 자동화된 연구를 향한 우리의 장기적인 경로의 일부이기도 합니다.

AI는 연구의 창의적인 부분, 그리고 무엇보다도 AI 연구 자체에서 매우 진지한 역할을 맡기 시작할 것입니다. 이러한 진전은 예상치 못한 일은 아니지만, AI 발전의 다음 단계, 매우 지능적인 시스템을 정렬(Aligning)하는 문제, 그리고 인간과 AI의 협업(Human-AI collaboration)의 미래를 이해해야 한다는 우리의 절박함을 더욱 강화합니다.

그 미래는 여전히 인간의 판단에 달려 있습니다. 전문 지식은 가치가 떨어지는 것이 아니라 더욱 중요해집니다. AI는 검색, 제안, 검증을 도울 수 있습니다. 사람들은 중요한 문제를 선택하고, 결과를 해석하며, 다음에 추구할 질문이 무엇인지 결정합니다.

OpenAI 모델, 이산 기하학의 핵심 추측을 반증하다

요약

핵심 포인트

댓글